In letzter Zeit macht eine von meinen 4.7 Maschinen immer oefter
eine kernelpanic. Und zwar immer bei derselben Anwendung, naemlich
wenn ich mit rsh die filesystem-dumps vom System herunter schiebe,
nachdem schon eine gute Weile Daten geflossen sind.
Stacktrace sagt jedesmal, der Crash ist in m_copym() via tcp_output,
tcp_usr_send, sosend, soo_write, dofilewrite, write, syscall2.
Solange kein Backup laeuft, ist das System voellig stabil. Es
arbeitet als Gateway fuer die Internet-Anbindung, es ist also
kaum denkbar, dass die Probleme aus genuinem Netzwerktraffic
herruehren.
Die weitere Analyse entpuppt sich leider als Huerdenlauf. Erste
boese Ueberraschung: Ein Pagingspace aus 2 mal 80% des RAM ist
zwar gem. "best practices" am sinnvollsten, taugt aber nicht zum
Dumpen - also erstmal die Filesysteme umgestrickt.
Dann weiter:
- INVARIANTS sollte genauere Fehlermeldungen aus m_copym() liefern,
tatsaechlich sorgt es aber nur dafuer, dass der Kernel bei jeder
Gelegenheit panict, und noch nichteinmal mehr komplett booten
mag. (irgendwas mit ng_ether_attach: already present)
- Wenn ich INVARIANTS nur in kern/uipc_mbuf.c einschalte, dann
passiert die panic wieder nur beim Backup, davor erscheint eine
Meldung "panic: freeing free mbuf", der stacktrace sieht aber
jetzt voellig anders aus als zuvor (und viel laenger), und das
System kann dann keinen cache mehr synchronisieren und keinen
dump schreiben.
An einen hardware-Fehler mag ich bei dem spezifischen und
reproduzierbaren Fehlerbild noch nicht recht glauben. Wie ich
weiter recherchieren soll, weiss ich allerdings auch nicht.
Nun bin ich also einigermaszen ratlos, denn einen Backup haette
ich eigentlich schon gern weiterhin. Wenn also jemand Ideen hat, wie
man so ein Problem weiter angehen koennte, immer her damit. :-)
Gruss
Peter
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 21 Apr 2003 - 02:48:07 CEST