Immer wieder: kernelpanic von rsh

From: Peter Much <pmc(at)citylink.dinoex.sub.org>
Date: Mon, 21 Apr 2003 00:17:49 GMT

In letzter Zeit macht eine von meinen 4.7 Maschinen immer oefter
eine kernelpanic. Und zwar immer bei derselben Anwendung, naemlich
wenn ich mit rsh die filesystem-dumps vom System herunter schiebe,
nachdem schon eine gute Weile Daten geflossen sind.
Stacktrace sagt jedesmal, der Crash ist in m_copym() via tcp_output,
tcp_usr_send, sosend, soo_write, dofilewrite, write, syscall2.

Solange kein Backup laeuft, ist das System voellig stabil. Es
arbeitet als Gateway fuer die Internet-Anbindung, es ist also
kaum denkbar, dass die Probleme aus genuinem Netzwerktraffic
herruehren.

Die weitere Analyse entpuppt sich leider als Huerdenlauf. Erste
boese Ueberraschung: Ein Pagingspace aus 2 mal 80% des RAM ist
zwar gem. "best practices" am sinnvollsten, taugt aber nicht zum
Dumpen - also erstmal die Filesysteme umgestrickt.
Dann weiter:
- INVARIANTS sollte genauere Fehlermeldungen aus m_copym() liefern,
  tatsaechlich sorgt es aber nur dafuer, dass der Kernel bei jeder
  Gelegenheit panict, und noch nichteinmal mehr komplett booten
  mag. (irgendwas mit ng_ether_attach: already present)
- Wenn ich INVARIANTS nur in kern/uipc_mbuf.c einschalte, dann
  passiert die panic wieder nur beim Backup, davor erscheint eine
  Meldung "panic: freeing free mbuf", der stacktrace sieht aber
  jetzt voellig anders aus als zuvor (und viel laenger), und das
  System kann dann keinen cache mehr synchronisieren und keinen
  dump schreiben.

An einen hardware-Fehler mag ich bei dem spezifischen und
reproduzierbaren Fehlerbild noch nicht recht glauben. Wie ich
weiter recherchieren soll, weiss ich allerdings auch nicht.

Nun bin ich also einigermaszen ratlos, denn einen Backup haette
ich eigentlich schon gern weiterhin. Wenn also jemand Ideen hat, wie
man so ein Problem weiter angehen koennte, immer her damit. :-)

Gruss
Peter

To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 21 Apr 2003 - 02:48:07 CEST

search this site