Kernel Panic mit 7.1

From: Alvar Freude <alvar(at)a-blast.org>
Date: Mon, 30 Mar 2009 15:24:20 +0200

Hallo,

auf meinem Server kommt es mit 7.1-RELEASE-p4 AMD64 zu häufigen Kernel
Panics. Vielleicht hat hier jemand einen Tipp, wie ich herausfinden kann,
ob es sich um einen Soft- oder Hardware-Fehler handelt ...

Dabei kommt das System meist noch nicht mal dazu, den Kernel-Dump zu
schreiben und hängt total.

Auch ein Versuch, die World im Single-User-Modus neu zu bauen hatte das
gleiche Ergebnis.

Ich hatte zu erst eine überfüllte und mit Filesystem-Fehlern versehene
Partition in Verdacht; von der ging noch nicht mal ein rsync auf eine
andere (mit dump & restore ging es dann, wenn einzen restored); oder wenn
ich da zum Beispiel mit dd aus /dev/zero größere Dateien
reingeschrieben habe, kam schon bei teilweise 80/90% Füllstand die
Meldung Filesystem voll -- und wenn ich dann weiter geschrieben habe auch
(IMHO reproduzierbar) ein Kernel Panic.

Auch ein make buildworld knallt früher oder später reproduzierbar.

Auch im Single-User-Modus!

Vorher lief die Maschine problemlos mit 6.0 drei Jahre; nach einem
Absturz habe ich die Gelegenheit genutzt, um auf 7.1 upzudaten (siehe
Diskussion letztens).

Ich *vermute*, dass es eher an der Hardware als an der Software liegt,
was meint Ihr?

Beispiel eines Falles aus Single-User-Modus, in dem der Kernel-Dump
gelang (Dump ist noch da, aber zum Debuggen kenne ich mich nicht gut
genug aus):

Fatal trap 12: page fault while in kernel mode
cpuid = 0; apic id = 00
fault virtual address = 0x721e1
fault code = supervisor read data, page not present
instruction pointer = 0x8:0xffffffff804a8761
stack pointer = 0x10:0xffffffffae13cb30
frame pointer = 0x10:0x721b9
code segment = base 0x0, limit 0xfffff, type 0x1b
                        = DPL 0, pres 1, long 1, def32 0, gran 1
processor eflags = resume, IOPL = 0
current process = 37 (usb4)
trap number = 12
panic: page fault
cpuid = 0
Uptime: 9m6s
Physical memory: 2033 MB
Dumping 265 MB: 250 234 218 202 186 170 154 138 122 106 90 74 58 42 26 10

Der "Current Prozess", bei dem er hängt, ist immer unterschiedlich, aber
der Syncer ist häufig dabei.

System ist ein FreeBSD 7.1-RELEASE-p4 mit ein par Kernel-Optionen:

# Firewall fest in Kernel, aber default alles offen und forwarding
erlauben
options IPFIREWALL
options IPFIREWALL_VERBOSE
options IPFIREWALL_DEFAULT_TO_ACCEPT
options IPFIREWALL_FORWARD

# fuer NAT (der internen IPs)
options IPDIVERT

# Statically Link in accept filters
options ACCEPT_FILTER_DATA
options ACCEPT_FILTER_HTTP

# Der Traffic Shaper (nicht genutzt)
options DUMMYNET

# Mit Dummynet soll man HZ auf 1000 setzen. Na dann ... ;)
options HZ=1000

Ciao
  Alvar

-- 
** Alvar C.H. Freude, http://alvar.a-blast.org/
** http://www.assoziations-blaster.de/
** http://www.wen-waehlen.de/
** http://www.perl-blog.de/

To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 30 Mar 2009 - 15:24:29 CEST

search this site