Re: unerklärliche Abstuerze

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Thu, 2 Jun 2005 10:56:09 +0200 (CEST)

Dura Zell <dura-zell(at)freenet.de> wrote:
> Ich hatte gelesen das der ULE Scheduler fuer SMP Maschinen besser
> geeignet sei.

Ja, das ist zumindest das Design-Ziel. In der Praxis muß
man aber dem BSD-Scheduler zugute halten, daß er zehnmal
älter ist, von hundertmal mehr Programmierern unter die
Lupe genommen wurde und tausendfach mehr in der Praxis ge-
testet wurde.

ULE steckt halt -- vergleichsweise -- noch in den Kinder-
schuhen, und da sind gewisse Kinderkrankheiten nicht un-
gewöhnlich. Das war bei anderen substantiellen Neuerungen
(z.B. Soft-updates) nicht anders.

> Ich baue gerade einen Kernel mit dem BSD Scheduler
> und werde das dann testen und ggf. berichten. Da die Abstuerze eher
> sporadisch auftreten kann das aber unter Umstaenden etwas dauern.

Wenn es tatsächlich der Scheduler war, dann läßt sich das
Problem vielleicht schneller provozieren, wenn man ihn et-
was mehr fordert. Bei einem »make -j10 buildworld« dürfte
der Scheduler beispielsweise gut zu tun bekommen.

> Das Netzteil wuerde ich gerne ausschliessen. Es ist das
> einzige an dem Rechner was neu ist und sollte mit 350
> Watt auch ausreichen.

Das denke ich eigentlich auch. Allerdings ist nicht allein
die nackte Wattzahl entscheidend -- ich hatte schon Netz-
teile, die durchaus »viel Watte« drin hatten, aber bei
kurzfristigen Leistungsspitzen (z.B. wenn ein Laufwerk an-
lief oder der Prozessor aus dem Idle-mode plötzlich auf
Vollast gebracht wurde) brach dann eine der Spannungsver-
sorgungen geringfügig ein. Für heutige empfindliche Hard-
ware ist schon ein geringer Spannungsabfall ausreichend,
um alle möglichen Fehlersymptome zu erzeugen, von gekippten
Bits (was bestenfalls zu Coredumps führt und schlimmsten-
falls unbemerkt bleibt) bis hin zum kompletten Absturz oder
Einfrieren der Kiste, oder spontanem Reboot.

> Den Speicher kann ich leider nicht tauschen da ich keinen Ersatz hier
> herumliegen habe. Es sind zwei 256er Riegel verbaut. Das Board kann aber
> laut Asus Manual auch mit dem normalen Speicher umgehen, eventuell werde
> ich das testen sofern ich diesen auftreiben kann. Vielleicht hilft da
> auch einfach mal das Ausbauen und wieder Einbauen des Speichers falls
> sich ein Staubkorn oder sowas auf den Kontaktleisten festgesetzt hat.

Ja, das hat schon in anderen Fällen geholfen. Manchmal
bilden sich auch durch thermische Spannungen Kontaktpro-
bleme. Du kannst den Riegel auch mal testweise in einen
anderen Slot stecken; manchmal unterscheiden sich die
Timings der Slots minimal (durch Laufzeitunterschiede der
verschieden langen Leiterbahnen sowie damit einhergehender
kapazitiver Wirkungen), was bei winzigen Schwächen des
RAMs schon den entscheidenden Unterschied machen kann.

> Ein Satz noch zum Schluss bezueglich der Fehlermeldung
> "Jun 2 06:55:00 jailhouse kernel: arp: 192.168.12.2 is on rl2 but got
> reply from 00:0d:88:38:d1:71 on rl1":
> Der Rechner ist uber Switches mit zwei Karten an einen anderen Rechner
> angeschlossen der ebenfalls mit zwei Karten an den Siwtches haengt.

Die Fehlermeldung deutet auf einen Fehler im Routing oder
in der Verkabelung hin (bzw. generell im Netzdesign).

Kannst Du bitte mal die IP-Adresse inkl. Netzmasken(!)
aller beteiligten Interfaces nennen? Und die hängen alle
am selben Switch, ja? Denke daran, daß die Routing-Table
immer eindeutig sein sollte, d.h. keine Überlappungen (es
sei denn, man weiß, was man tut).

> BSD Rechner soll spaeter den anderen Rechner ersetzen. Eine arp
> Anfrage/Antwort kann also von zwei Karten kommen was zu der Meldung
> fuehrt.

Wenn alles korrekt konfiguriert ist, kann eine ARP-Antwort
eigentlich nur von einem eindeutig bestimmten Interface
kommen.

Gruß
   Olli

-- 
Oliver Fromme, secnetix GmbH & Co KG, Oettingenstr. 2, 80538 München
Any opinions expressed in this message may be personal to the author
and may not necessarily reflect the opinions of secnetix in any way.
We're sysadmins.  To us, data is a protocol-overhead.
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Thu 02 Jun 2005 - 10:56:55 CEST

search this site