Re: Hardwarefehler ?

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Fri, 12 Feb 2010 19:09:40 +0100 (CET)

Henning Nelihsen <hn(at)maixit.de> wrote:
> ich habe bei einem neuen Rechner das Problem, dass er regelmäßig
> abstürzt und vermute einen Hardwarefehler.

Erstmal etwas Grundsätzliches: Die meisten Hardwarefehler
äußern sich in der Regel so, dass die Abstürze nicht exakt
reproduzierbar sind und an unterschiedlichen Stellen auf-
treten. Ist das bei Dir der Fall?

Falls defekten RAM o.ä. in Verdacht hast, solltest Du evtl.
einmal memtest86 laufen lassen. Wenn es keinen Fehler
findet, ist das zwar keine Garantie dafür, dass alles in
Ordnung ist, aber _wenn_ es einen Fehler findet, dann ist
da garantiert einer. ;-)

Ein paar Infos zu den "Abstürzen" wären noch ganz hilfreich.
Meistens gibt es einen von den folgenden Fällen:

1. Kernel-Panic.
2. Rechner friert ein bzw. stellt sich tot.
    2.1. Interrupts gehen noch (ping, Caps-Lock-LED, KDB)
    2.2. Nix geht mehr (naja, FW-Debugging geht fast immer)
3. Spontaner Reboot.
    (Kann auch der Reboot nach einer unerkannten Panic sein,
    die man nicht gesehen hat, weil gerade X läuft.)

Welcher der Fälle trifft bei Dir zu?

> dmesg sagt mir, dass ein pci controller Probleme macht (?)
> mir sagt die Fehlermeldung leider nichts, was genau bedeutet das und um welches device kann es sich handeln?

Naja, das ist erstmal keine Fehlermeldung. Das ist nur ein
Hinweis, dass für bestimmte Teile der Hardware (in diesem
Fall ein Interrupt-Controller und ein nicht näher spezi-
fiziertes Device) kein Treiber gefunden werden konnte.
Ob das tragisch ist oder nicht, muss man sich im Einzelfall
angucken.

Ein Interrupt-Controller ist allerdings ein grundlegender
Teil der Hardware. Wenn's dafür keinen Treiber gibt, ist
das kein so gutes Zeichen. Ich glaube aber nicht, dass die
Abstürze damit zusammenhängen.

> ps: das gesamte dmesg

Evtl. kann man noch mehr Informationen erhalten, wenn Du
den Kernel verbose bootest (ist ein Menüpunkt im Boot-
loader). Die Bootmeldungen findest Du im Anschluss auch
in /var/run/dmesg.boot.

> FreeBSD 8.0-RELEASE-p2 #0: Tue Jan 5 21:11:58 UTC 2010

Evtl. wäre ein Update auf 8-stable (RELENG_8) einen Versuch
wert. Möglicherweise wird dann der Interrupt-Controller
schon unterstützt.

Das hier ist jedenfalls eine richtige Fehlermeldung:

> AcpiOsExecute: failed to enqueue task, consider increasing the debug.acpi.max_tasks tunable

Hast Du das mal ausprobiert? Der Default ist 32.
Du könntest mal 64 oder so ausprobieren; dazu folgende
Zeile in /boot/loader.conf schreiben und rebooten:

debug.acpi.max_tasks="64"

Dann gucken, ob die obige Fehlermeldung immer noch kommt.
Die folgenden sind möglicherweise Folgefehler:

> ACPI Error (psparse-0633): Method parse/execution failed [\\_SB_.PCI0.HEC2.HSCI] (Node 0xffffff00019f4b60), AE_NO_MEMORY
> ACPI Error (psparse-0633): Method parse/execution failed [\\_GPE._L06] (Node 0xffffff00019feb80), AE_NO_MEMORY
> ACPI Exception: AE_NO_MEMORY, while evaluating GPE method [_L06] 20090521 evgpe-705

Das sieht jedenfall nicht so gut aus. Möglich, dass das
mit den Abstürzen zu tun hat. Das wäre evtl. ein weiterer
Grund, mal ein Update auf 8-stable zu erwägen, da dort der
ACPI-Code kürzlich aktualisiert wurde, wenn ich mich
richtig erinnere.

Auch ein BIOS-Update (sofern es eins gibt) wäre einen
Versuch wert; auch damit könnten ACPI-Probleme behoben
sein.

> Starting background file system checks in 60 seconds.

Ich persönlich rate von background-fsck ab. Ich habe damit
leider schon zu oft Bruch erlebt (ganz besonders dann, wenn
das System ohnehin schon instabil ist und ein Hardware-Defekt
vermutet wird!) und disable es daher grundsätzlich in
/etc/rc.conf.

Gruß
   Olli

-- 
Oliver Fromme, secnetix GmbH & Co. KG, Marktplatz 29, 85567 Grafing b. M.
Handelsregister: Registergericht Muenchen, HRA 74606,  Geschäftsfuehrung:
secnetix Verwaltungsgesellsch. mbH, Handelsregister: Registergericht Mün-
chen, HRB 125758,  Geschäftsführer: Maik Bachmann, Olaf Erb, Ralf Gebhart
FreeBSD-Dienstleistungen, -Produkte und mehr:  http://www.secnetix.de/bsd
"If Java had true garbage collection, most programs
would delete themselves upon execution."
        -- Robert Sewell
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Fri 12 Feb 2010 - 19:10:01 CET

search this site