Wieso geht mein Rechner wieder, bzw. warum war er kaputt? (sehr mysteriös)



  • In meinem alten Thread* habe ich ja gesagt, dass zwei Festplatten hinüber wären
    und heute ist meine SSD gekommen, also habe ich mir gedacht Prima, dann kann ich sie jetzt in den Abendstunden einbauen.

    Vorher habe ich den Rechner aber noch einmal von Staub befreit, d.h. ich habe ihn vom warmen nach draußen ins kalte getragen (Temperaturdifferenz geschätzt 10 K)
    und dort ausgepustet.

    Als ich damit fertig war, habe ich ihn wieder drinnen angeschlossen und mir gedacht, moment, bevor ich die SSD jetzt einbaue, schließe ich doch noch einmal die alte 2. Festplatte an und guck ob ich da irgendwas retten kann.

    Aber und jetzt kommt das Problem.
    Der Rechner lies sich nicht mehr starten.
    Wenn ich ihn einschaltete, dann gab es entweder kurze oder lange Pipstöne (kann das was da lang oder kurz ist ohen Vergleich nicht so genau unterscheiden, im Vergleich zum normalen Pipston den man immer beim Einschalten hört war es eher lang), die Periodisch tönten.
    Also durchgehend.
    Ein Bild wurde auf dem Monitor auch nicht angezeigt.

    Also habe ich den Rechner ausgemacht, die GPU entfernt und den Rechner wieder eingeschalten, das gleiche Problem.
    Dann dachte ich mir, hm, vielleicht ist beim Ausblasen irgendwie Spucke auf das Mainboard gekommen und jetzt ist da ne Leitende Verbindung wo keine sein soll, also Rechner wieder ausgemacht und gesucht, aber nichts gefunden, aber vielleicht muss der Rechner erstmal klimatisieren, also bin ich Essen gegangen und habe ihn im aus Zustand stehen lassen.

    Als ich mit dem Essen fertig war, habe ich ihn probehalber wieder eingeschaltet, wieder das gleiche Problem.

    Im Internet und in der Wikipedia habe ich gefunden, dass die Töne ein Stromversorgungsproblem mit dem Mainboard sein könnten, es war ein Award BIOS.
    Aber es gab da auch ne Anleitung in der drin stand das man alles entfernen soll, also Steckkarten, Festplatten und sogar den Speicher.

    Also habe ich genau das getan und alles abgeklemmt.
    Nach dem einschalten kam dann ein anderer Pipston, der darauf hinwies, dass kein Speicher eingebaut war. Das war zu erwarten, das kein anderer Pipston kam war auch ein gutes Zeichen.
    Also habe ich einen Speicherriegel wieder eingebaut und den Rechner damit getestet und plötzlich lief er. Kein Mensch weiß warum.

    Dann habe ich mir gedacht, gut, vielleicht ist einer der Speicherriegel kaputt oder das Netzteil hat nen Knacks und kann nicht mehr den Strom für alle Geräte auf einmal zur Verfügung stellen.

    Also habe ich der Reihe nach jerweils einen weiteren Speicherriegel eingebaut und den Rechner sogleich nach jedem Riegel getestet und jedes mal lief er.
    Auch dann noch als alle 4 Module verbaut waren.

    Prima, also habe ich die GPU eingebaut und getestet, lief auch damit.
    Super, jetzt hatte ich wieder ein Bild.

    Dann kamen mit jedes mal testen dann der Reihe nach:
    - Soundkarte
    - TV Karte
    - Festplatten

    Und alles läuft wieder und ich weiß absolut nicht warum.
    Wenn das MB defekt wäre, was ich zuerst befürchtet habe, hätte der Rechner nicht mehr anlaufen dürfen.

    Denkbar wäre noch eine kalte Lötstelle, das wäre doof, dann wäre der Rechner teilkaputt.
    Aber eigentlich hatte der Rechner genug Zeit sich nach dem Putzen im warmem Zimmer wieder zu aklimatisieren. Also kann es eine kalte Lötstelle irgendwie nicht sein.
    Natürlich habe ich nach dem Testen auch geschaut ob noch alle Stecker fest sitzen, inkl. der RAM Module, auch das war der Fall.

    Was mir ansonsten noch einfällt ist, dass man beim reinstecken der Module ja leicht aufs Board drücken muss, da biegt sich das schon etwas durch, das ist normal. Vielleicht hatte eine Leiterbahn einen kleinen Riss und durch das Biegen gab's wieder einen Kontakt. Ich weiß es nicht, aber vielleicht möglich.

    Ansonsten könnte ich mir auch noch vorstellen, dass das NT einen Knacks hat, das würde auch die Probleme mit den zwei HDs erklären.

    Ach ja und die zweite HD, die vor ein paar Tagen nicht mehr anlief, die läuft jetzt wieder.
    Einen Smart Test habe ich bei der aber noch nicht durchgeführt, das werde ich jetzt machen.
    Bei der kleineren, die damals noch lief, aber Smartfehler meldete, werde ich auch noch mal einen Smart Test durchführen, aber bei der vermute ich mal, dass die nen Lesefehler hat.

    Ansonsten ist jetzt auch die SSD da, die schicke ich jetzt nicht mehr zurück, sondern werde sie einbauen.

    Seltsam und sehr mysteriös ist das dennoch. Hatte irgendwer von euch schonmal so ein Erlebnis?

    * Das war der alte Thread, ich mache hier den neuen auf, da das Problem nun eigentlich ein gänzlich anderes ist.
    http://www.c-plusplus.net/forum/327463

    PS: Sobald die beiden Smart Tests für beide HDs durchgelaufen sind, sage ich euch bescheid.

    Könnte es sein, dass das NT einen Knacks hat?
    Also nicht mehr die SPannung und den Strom in der Präzsision liefern kann, wie eigentlich erwartet wird?
    Das würde zumindest erklören warum die 2. HD nicht mehr ansprang und heute der Rechner gar nicht lief. Das er jetzt wieder läuft, könnten vielleicht kalte Lötstellen im NT sein.
    Und das die erste HD mit kaputten Daten beschrieben wurde, so dass ein booten nicht mehr ging, könnte vielleicht auch an einer schlechten Spannungsversorung liegen, so dass der SATA COntroller des MB verrückt spielte.
    Was meint ihr, wäre das denkbar?
    Oder hat das MB nen Knacks?

    Ich werde auch mal sehen, wie sich der Rechner die nächsten Tage verhält.



  • HD Defekte schrieb:

    Dann habe ich mir gedacht, gut, vielleicht ist einer der Speicherriegel kaputt oder das Netzteil hat nen Knacks und kann nicht mehr den Strom für alle Geräte auf einmal zur Verfügung stellen.

    Also habe ich der Reihe nach jerweils einen weiteren Speicherriegel eingebaut und den Rechner sogleich nach jedem Riegel getestet und jedes mal lief er.
    Auch dann noch als alle 4 Module verbaut waren.

    Klingt danach als hätte einfach einer der RAM Riegel nicht gut "gesessen". Das kommt manchmal vor. Kann auch bei PCs passieren die davor monate- oder gar jahrelang problemlos gelaufen sind. Hatte ich schon öfter.
    Ich vermute mal dass passiert weil die Komponenten im Betrieb warm werden und sich dabei natürlich ausdehnen (und wieder zusammenziehen wenn sie wieder abkühlen). Und bei dem ewigen hin und her dann irgendwann keinen ordentlichen Kontakt mehr haben.
    RAM aus- und wieder einbauen hilft dann oft.

    Wobei ich es schon erlebt habe, dass so ein Problem dann in immer kürzer werdenden Abständen auftritt, und man den PC dann irgendwann ganz vergessen kann. Weil er irgendwann nach erfolgreicher "Behandlung" bloss noch 1x angeht, und nachdem er ein paar Stunden aus war dann wieder spinnt. Die betroffenen PCs waren dabei aber immer so alt, dass ich dann nicht weiter rumprobiert habe. Also z.B. mit Isopropanol reinigen oder neue RAMs probieren oder so.



  • Könnte das dann auch die Schreibfehler und Smartfehler und die nicht anlaufende HD vom letzten mal erklären?

    Momentan mache ich den extended Smarttest bei der HD, die nicht mehr anging, das kann aber ca. 5 h bis der fertig ist. Bis jetzt wurden keinerlei Fehler gemeldet.



  • HD Defekte schrieb:

    Könnte das dann auch die Schreibfehler und Smartfehler und die nicht anlaufende HD vom letzten mal erklären?

    Die SMART Daten werden direkt von der HDD selbst reportet. Die Chance dass gerade die SMART Daten durch einen schlecht sitzenden RAM Riegel verfälscht ausgegeben werden, das RAM aber ausreichend wenig Probleme macht so dass das System nicht crasht, sind minimal. Also eher nein.

    Vielleicht liege ich mit meiner Vermutung auch total daneben. Klingt aber schon nach einem Problem mit einem Steckkontakt wenn das System nach auseinander und neu Zusammenbau wieder geht. Kann aber natürlich auch ein anderer Kontakt gewesen sein. Und kalte Lötstellen kann man natürlich auch nie ausschliessen.

    Zu diagnostizieren ist das aber alles sehr schwer. Wenn der PC schon ein paar Jahre alt ist, dann stell dich drauf ein in absehbarer Zeit mal einen neuen anzuschaffen. Wobei ich auch nichts überstürzen würde - so lange das Problem nicht wieder kommt, bzw. sich durch neu Stecken von ein paar Komponenten wieder für ein paar Monate beheben lässt, muss man ja nicht gleich 'was neues kaufen.
    Zumindest nicht wenn das System bloss zum Spass genutzt wird. Wenn wichtige Daten drauf sind, oder das Ding laufen muss weil man sonst nicht arbeiten (im Sinn von Geld verdienen) kann, dann würde ich mir vermutlich recht bald was neues zulegen.



  • Ursprünglich wollte ich mir letztes Jahr einen Haswell kaufen, das hat sich so weit hingezogen, dass ich nun einen Broadwell will, solange sollte der Rechner schon halten.
    Allerdings dürfte das mein letzter und mein schnellster und auch leisester Rechner mit PCI Steckplätzen sein, daher wünsche ich mir, dass er möglichst nie kaputt geht.
    Insofern war das für mich heute schon ein Schock.
    Als ich beim Essen war, mit dem Gedanken, dass er nun hin ist, war ich sogar am Überlegen ob ich mir für diesen Rechner ein altes funktionierendes MB kaufen soll, so dass ich wenigstens einen funktionierenden Rechner mit PCI Steckplätzen habe, bei dem meine PCI Karte noch funktionieren.
    Damit hätte ich dann auch die Zeit bis zum Broadwell überbrücken können.



  • Naja, vielleicht läuft ja jetzt alles wieder für ne Zeit lang - bis zu den Broadwell dauert's ja hoffentlich auch nimmer ganz lange.



  • So, jetzt ist der extended self-test für die HD, die klackerte fertig und es gab gar keine Fehler:

    SMART Attributes Data Structure revision number: 16
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
      2 Throughput_Performance  0x0005   137   137   054    Pre-fail  Offline      -       79
      3 Spin_Up_Time            0x0007   128   128   024    Pre-fail  Always       -       484 (Average 485)
      4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       376
      5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
      7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
      8 Seek_Time_Performance   0x0005   142   142   020    Pre-fail  Offline      -       25
      9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       3525
     10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
     12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       356
    192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       525
    193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       527
    194 Temperature_Celsius     0x0002   176   176   000    Old_age   Always       -       34 (Min/Max 12/40)
    196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
    197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
    198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
    199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
    
    SMART Error Log Version: 1
    No Errors Logged
    
    SMART Self-test log structure revision number 1
    Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
    # 1  Extended offline    Completed without error       00%      3525         -
    # 2  Short offline       Completed without error       00%      3520         -
    

    Erstmal ist das ja eine gute Nachricht, allerdings verwundert es mich auch.
    Man könnte sich jetzt ja noch erklären, dass das klackern vielleicht doch von der anderen Platte kam, also die, mit den Lesefehlern, bezüglich der Lokalisierung des Geräuschs hättet ihr dann Recht, aber das erklärt dann nicht
    die Errormeldung im BIOS die eben zu dieser Festplatte angezeigt wurde, also in deren Zeile.

    Und dann ist vor ein paar Stunden noch etwas passiert, ich musste den Test noch einmal von vorne Anfange, weil der Rechner abgestürzt ist
    als ich eine Sounddatei abspielen wollte. Der Ton war tot, ich konnte noch ein paar Sekunden am Desktop herumspielen, dann fror der Mauszeiger ein und nichts ging mehr.
    Der erste smart extended Durchlauf wurde somit nicht beendet.
    Also habe ich den Rechner neu gestartet und der Sound ging wieder, der erneute smart extended Test Durchlauf hat diesmal dann zum Glück auch geklappt.

    Rein von der logischen Betrachtung her müsste also die erste Festplatte mit den kaputten Smart Werten auch diejenige sein, die klackerte, das war auch die, die nicht mehr booten konnte und bei der ich erst einen Reparaturdurchgang durchführen musste. Dem entgegen steht halt dann das mit der Errormeldung.

    Die andere Erklärung wäre ein Defekt beim Mainboard und dessen Sata Controller, also das der irgendwie herumspinnt.
    Das wäre dann aber leider auch der Worst Case Fall, denn das MB zu tauschen wiegt schwerer, als der Verlust einer 1 TB Platte für deren Daten, die sie trägt, ich sowieso ein Backup habe.

    Morgen werde ich nochmal einen Smart Test mit der anderen Platte machen.


  • Mod

    Ich möchte mal die Hypothese in den Raum werfen, dass deine Festplatten eventuell vollkommen unschuldig sind. Und auch der SATA-Controller. Gerade das was du mit dem Ton beschreibst ist ein absolut untypisches Symptom. Vielleicht ist eine deiner Platten zufällig auch kaputt, aber nicht die Ursache für das, was du beschreibst.


Anmelden zum Antworten