Re: unerklärliche Abstuerze

From: Dura Zell <dura-zell(at)freenet.de>
Date: Thu, 02 Jun 2005 09:47:26 +0200

Oliver Brandmueller schrieb:

>Hallo.
>
>On Thu, Jun 02, 2005 at 08:13:03AM +0200, Dura Zell wrote:
>
>
>>Ich hab hier einen Rechner mit FBSD 5.4 eingerichtet. Dieser haengt sich
>>in unregelmaessigen Abstaenden einfach auf.
>>Er laesst sich dann weder ueber SSH ansprechen, noch reagiert er auf
>>Keyboardeingaben. Das einzige was dann hilft ist der Resetknopf. Leider
>>ist auch in den Logfiles nichts zu finden. Hat jemand aehnliche
>>Erfahrungen oder kann mir sagen was ich tun kann um dem Problem auf die
>>Spur zu kommen?
>>
>>
>[...]
>
>
>>5.4-STABLE FreeBSD
>>SMP Kernel, ULE Scheduler, keine USB/Firewire/Sound Unterstuetzung,
>>
>>
>
>Der allererste Versuch sollte sein, den 4BSD Scheduler zu nehmen. ULE
>ist experimentell und kann zu genau solchen Effekten führen. Finger weg
>von ULE auf Rechnern, wo es drauf ankommt, daß sie laufen - das ist
>nicht meine persönliche Meinung, sondern die offizielle Ansage derzeit
>für 5-STABLE.
>
>Wenn es unabhängig davon weiterhin zu Problemen kommt, dann gibt es drei
>heiße Kandidaten für die Abstürze:
>
> - RAM
> - Netzteil
> - Prozessor(lüfter)
>
>Zum RAM: memtest86 ist zwar ein hübsches Tool, ich habe aber in letzter
>Zeit mehrfach den Fall erlebt, wo memtest86 problemlos 48 Stunden
>durchläuft und nichts findet, auf magische Weise ein Austausch des RAMs
>allerdings den Rechner komplett stabil gemacht hat. Wenn Du also die
>Möglichkeit hast, Austausch-RAM in den Rechner zu stecken, dann probiere
>es damit. Da es ein SMP-System ist, wirst Du Registered RAM haben,
>kannst es also nur paarweise betreiben, wenn Du kein Austausch-RAM hast,
>aber 4 (oder mehr) Steinchen drin, kannst Du nach Belieben ggf. mit
>weniger RAM probieren, ob irgendein Pärchen defekt ist.
>
>Zum Netzteil: Du hast neben zwei Prozessoren diverse Platten in dem
>Rechner. Alles zusammen zieht das schon was. Netzteile sterben meist mit
>einem lauten Knistern, manchmal allerdings sterben sie langsam, dann
>kommt plötzlich aus einer der vielen Leitungen zum Board weniger oder
>kein Strom mehr. Wenn Dein Motherboard die SPannung messen kann, schau
>nach, ob diese stabil ist. Ich hatte kürzlich einen Rechner, da
>flimmerte das Bild am Monitor und wenn man mal größere Datenmengen
>kopierte, rebootete der einfach. Man hat im Spannungsmonitor deutlich
>gesehen, daß die 3-Volt-Spannung teilweise auf 2,8 oder 2,6 Volt
>absackte. Neues Netzteil und der Fall war erledigt.
>
>Bei den alten Dual-Pentiums ist die Sache mit dem Prozessorlüfter
>meistens nicht so kritisch, aber um das Rundum-Sorglos-Paket zu
>vervollständigen und wenn die vorgenannten Dinge keinen Erfolg zeigen
>(bzw. weil es eh recht einfach festzustellen ist), schau mal, ob die mit
>geeigneter Leistung drehen.
>
>
>Und zuguterletzt nochmal: Erstmal weg mit ULE, das ist meines Erachtens
>der heißeste Kandidat für Dein Problem.
>
>
>- Olli
>
>
>
>
Hi

Ich danke dir fuer deine Antwort.
Ich hatte gelesen das der ULE Scheduler fuer SMP Maschinen besser
geeignet sei. Nachdem er dann in der 5.4 freigegeben war habe ich den
dann eben genommen. Ich baue gerade einen Kernel mit dem BSD Scheduler
und werde das dann testen und ggf. berichten. Da die Abstuerze eher
sporadisch auftreten kann das aber unter Umstaenden etwas dauern.

Das Netzteil wuerde ich gerne ausschliessen. Es ist das einzige an dem
Rechner was neu ist und sollte mit 350 Watt auch ausreichen. In einem
anderen Zusammenhang wurde mir gesagt das es das alte 200 Watt NT auch
getan haette. Soweit ich das sagen kann sind die Spannungen auch stabil.
Ich werde mir mal einen Port heraussuchen mit dem ich das im laufenden
Betrieb monitoren kann.

Den Speicher kann ich leider nicht tauschen da ich keinen Ersatz hier
herumliegen habe. Es sind zwei 256er Riegel verbaut. Das Board kann aber
laut Asus Manual auch mit dem normalen Speicher umgehen, eventuell werde
ich das testen sofern ich diesen auftreiben kann. Vielleicht hilft da
auch einfach mal das Ausbauen und wieder Einbauen des Speichers falls
sich ein Staubkorn oder sowas auf den Kontaktleisten festgesetzt hat.

Die Prozessorluefter sind soweit auch in Ordnung. Ich hab sie vor dem
Einbau des Rechners im Gehaeuse grundgereinigt. Sie laufen soweit auch
mit der vorgegebenen Drehzahl. Leider scheint das Board / Slot CPUs im
Allgemeinen eine Temperaturmessung nur ueber ein spezielles Kabel mit
Sensor zum anklemmen zu unterstuetzen welches bei solch alter Hardware
kaum aufzutreiben sein duerfte.

Ein Satz noch zum Schluss bezueglich der Fehlermeldung
"Jun 2 06:55:00 jailhouse kernel: arp: 192.168.12.2 is on rl2 but got
reply from 00:0d:88:38:d1:71 on rl1":
Der Rechner ist uber Switches mit zwei Karten an einen anderen Rechner
angeschlossen der ebenfalls mit zwei Karten an den Siwtches haengt. Der
BSD Rechner soll spaeter den anderen Rechner ersetzen. Eine arp
Anfrage/Antwort kann also von zwei Karten kommen was zu der Meldung
fuehrt. Mit meinem Problem hat das also wahrscheinlich nichts zu tun.
Die andere Fehlermeldung wird dadurch aber IMO nicht erklaert.

Mit freundlichen Gruessen,
Sven Mertens

To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Thu 02 Jun 2005 - 09:48:16 CEST

search this site