Re: Immer wieder: kernelpanic von rsh

From: Bernd Walter <ticso(at)cicely9.cicely.de>
Date: Mon, 21 Apr 2003 13:39:48 +0200

On Mon, Apr 21, 2003 at 12:17:49AM +0000, Peter Much wrote:
>
> In letzter Zeit macht eine von meinen 4.7 Maschinen immer oefter
> eine kernelpanic. Und zwar immer bei derselben Anwendung, naemlich
> wenn ich mit rsh die filesystem-dumps vom System herunter schiebe,
> nachdem schon eine gute Weile Daten geflossen sind.
> Stacktrace sagt jedesmal, der Crash ist in m_copym() via tcp_output,
> tcp_usr_send, sosend, soo_write, dofilewrite, write, syscall2.
>
> Solange kein Backup laeuft, ist das System voellig stabil. Es
> arbeitet als Gateway fuer die Internet-Anbindung, es ist also
> kaum denkbar, dass die Probleme aus genuinem Netzwerktraffic
> herruehren.

Routing ist was anderes als selber Daten zu verschicken.
Außerdem passiert es in dem Fall gleichzeitig mit Plattenzugriffen,
die beim routen als solche niemals vorkommen.

> Die weitere Analyse entpuppt sich leider als Huerdenlauf. Erste
> boese Ueberraschung: Ein Pagingspace aus 2 mal 80% des RAM ist
> zwar gem. "best practices" am sinnvollsten, taugt aber nicht zum
> Dumpen - also erstmal die Filesysteme umgestrickt.

Klau der Kiste zeitweilig einfach etwas RAM.
Es gibt dafür extra die Loadervariable hw.physmem, wobei ich nicht
sicher sagen kann, daß die 4.7 das schon hatte.
Es ist natürlich nciht garantiert, daß die RAM Menge nicht auch Einfluß
auf das auftreten des Fehlers hat.

> Dann weiter:
> - INVARIANTS sollte genauere Fehlermeldungen aus m_copym() liefern,
> tatsaechlich sorgt es aber nur dafuer, dass der Kernel bei jeder
> Gelegenheit panict, und noch nichteinmal mehr komplett booten
> mag. (irgendwas mit ng_ether_attach: already present)

INVARIANTS verlangt, daß alle eingesetzten Module ebenfalls damit
kompiliert sind.
make depend sollte man auch zwingend benutzen, ansonsten werde
wichtige Files nicht neu compiliert - im Zweifelsfall einen make clean
machen.

> - Wenn ich INVARIANTS nur in kern/uipc_mbuf.c einschalte, dann
> passiert die panic wieder nur beim Backup, davor erscheint eine
> Meldung "panic: freeing free mbuf", der stacktrace sieht aber
> jetzt voellig anders aus als zuvor (und viel laenger), und das
> System kann dann keinen cache mehr synchronisieren und keinen
> dump schreiben.

Das geht auch nicht.
Entweder überall INVARIANTS oder nirgendwo.

> An einen hardware-Fehler mag ich bei dem spezifischen und
> reproduzierbaren Fehlerbild noch nicht recht glauben. Wie ich
> weiter recherchieren soll, weiss ich allerdings auch nicht.

Klingt für mich auch noch nicht alzu wahrscheinlich, obwohl das nicht
auszuschließen ist.

> Nun bin ich also einigermaszen ratlos, denn einen Backup haette
> ich eigentlich schon gern weiterhin. Wenn also jemand Ideen hat, wie
> man so ein Problem weiter angehen koennte, immer her damit. :-)

-- 
B.Walter                   BWCT                http://www.bwct.de
ticso(at)bwct.de                                  info(at)bwct.de
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 21 Apr 2003 - 13:40:22 CEST

search this site