Re: wie lese ich meine kerneldumps?

From: Peter <pmc(at)citylink.dinoex.sub.org>
Date: Mon, 21 Nov 2016 22:37:31 +0100

Alexander Klein wrote:
> Es war zu Zeiten, als SCSI-2-Platten schon knapp wurden, also habe ich
> angefangen, alte Platten zu sammeln und bin auch zu zwei
> Micropolis-SCSI-1-Platten gekommen, die am Mac immer problemlos ihren
> Dienst verrichteten.
>
> Unter Linux war es dann nur leider so, daß sie im Prinzip zwar auch
> liefen, aber zwischendurch blieb irgendwann plötzlich das ganze System
> stehen. Der Fehler blieb bis zur Entsorgung der Platten ungeklärt.
>
> Die Frage ist halt, was man zu erreichen hoffen kann, denn der Fehler
> kann sich ja im Prinzip überall verstecken:

Was ich erreichen will ist relativ einfach: normalerweise verschiebe ich
die Hardware, die für den Desktop zu langsam wird, in den Server (oder
gönne mir einen neuen Desktop wenn der Server zu langsam wird). Nun hab
ich allerdings vor vier Jahren einen kleinen Fehlkauf getätigt, nämlich
einen schönen i5-3570T Prozessor und ein scheinbar passendes Board, nur
leider kann das Board keine taugliche Grafikauflösung (WQHD), weil kein
DisplayPort und DVI nur single. Dass man da einen Issue haben könnte,
hab ich einfach nicht bedacht.
Der Plan wäre dann gewesen, das Board in den Server packen und einen
schlichten i3-2100 dazu, und ein taugliches neues Board für den Desktop
anschaffen. Nun ist aber Sockel 1155 neu nicht mehr erhältlich, und
gebraucht haben die Leute Preisvorstellungen, die weit über Neupreis
liegen, worauf ich wiederum keine Lust hab - also wird der Server
erstmal weiterhin mit dem Altmaterial aus dem Keller betrieben - was für
die Performance völlig ausreicht, weil das Ding wenig mehr als das
macht, wofür andere Leute eine Fritzbox haben: Router, Anrufbeantworter,
Backup-Server, etc.

Und das sollte vor allem stabil und in zweiter Linie dann so schnell
sein wie es halt geht.

> Was passiert denn, wenn Du den virtuellen Speicher zwar auf der Platte
> hältst, aber statt in einer Partition in einer entsprechenden Datei?
> Wenn die Maschine mehrere Kerne hat, könnte man versuchsweise alle bis
> auf einen abschalten um zu sehen, ob es ein Parallelisierungsproblem ist?

Schon getestet. Sowohl der SWAP als auch der ZFS-Cache auf dem SSD
können weggelassen werden, die SCSI-Panics kommen trotzdem. Netzteile
hab ich auch drei durchprobiert, auch mit Doppelbespannung, kein
Einfluss. Kann natürlich sein dass die Netzteile alle Schrott sind, weil
das alte ist im August kaputtgegangen (das wäre auch noch ein geänderter
Parameter), und das war noch ein 235W Teil ohne "Effizienz" - die
neueren sind ja alle "mit Effizienz", und vielleicht muss man das
übersetzen als "ohne Impulsfestigkeit" bzw. "nur als GPU-Heizung gedacht".

CPU ist nur eine drin. Und wenn ich options-SMP ausschalte, dann kriege
ich keine Dumps, weil es dann hinter "Uptime:" steckenbleibt.

Inzwischen hab ich mich vorläufig damit abgefunden, dass TCQ halt nicht
geht, hab die andere Antiquität aus dem Keller fest eingebaut weil die
ein bischen mehr Memory kann (ASUS CUV4X-DLS - viel zu schön um es
wegzuschmeissen), und hatte damit ne menge Spass: die Memory hab ich
gefühlte hundert mal gesteckt, bevor es sie mochte - angeblich
vergoldete Kontakte scheinen über ein paar Jahre im Keller auch zu
rosten. Ein gutes halbes Dutzend keramische Kondensatoren, die erstens
Schrott und zweitens offenbar überflüssig waren, mussten laut
Support-Tip "forcibly remove"d werden - danach funktionierte immerhin
die Peripherie:
http://vip.asus.com/forum/view.aspx?board_id=1&model=TUSL2-C&id=20070420153428984&page=1&SLanguage=en-us

Jetzt hab ich nur noch gelegentlich komische Panics vom ZFS. Dafür hab
ich dann mal INVARIANTS und WITNESS aktiviert, aber das macht nicht
wirklich Spass, weil da kommt die erste lock-order-reversal schon beim
Kernelstart, und ZFS startet damit erst gar nicht, sondern geht beim
Erstaufruf in eine Endlosschleife. Letzteres dürfte kaum an der Hardware
liegen - eher daran, dass ich statt 10.3-STABLE 10-STABLE
kompiliert hab. Aber wenn man die Release-Notes genau anschaut, dann
gibt es ja eh keine 10.3-RELEASE, sondern nur einen "Snapshot" zwischen
10.2 und 10.4.

Was Du sagst, würde ich von daher etwas anders formulieren: der Fehler
kann nicht nur überall stecken, sondern es stecken wohl fast überall
Fehlerchen drin, die sich lediglich in den meisten Fällen
auskompensieren und nicht wirksam werden.
Es ist dann wohl eher als Glücksfall zu werten, dass mein Zoo bis August
in einem Zustand war, der in seiner damaligen Konfiguration durchgehend
stabil gelaufen ist.

Aber ich bin halt kein Freund davon, Zeug, was eigentlich noch taugen
sollte (und nicht wirklich nachweisbar kaputt ist), nach Afrika zu
schicken und dafür mehr Neuschrott zu kaufen (bei dem man
auch nicht immer weiss ob er besser läuft).

To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 21 Nov 2016 - 23:13:09 CET

search this site