spontane Reboots

From: Manfred <yoda(at)selma.de>
Date: Wed, 03 Oct 2007 00:53:19 +0200

Hi Leute,
seit ich meinen alten Celeron 700MHz, 512MB-RAM samt Board mit
Intel-Chip-Set gegen einen Pentium-M 1,73GHz, 2048MB-RAM mit SiS-Board
ausgetauscht habe, kann ich keine großen Partitionen mehr benutzen und
keine großen Datenmengen mit hoher geschwindigkeit kopieren.

Nicht das es nicht geht, das geht sehr gut aber nur für ein paar Minuten
(manchmal auch nur Sekunden) und dann gibt es einen Reboot....

 * Mein System ist ein FreeBSD-6.2-RELEASE-p7.
 * Mein Platten: 160 GB S-ATA für System; 2x320 GB S-ATA in SoftRAID
(atacontrol: ar0)

Ich hatte ursprünglich einen SiL3114-Controller drin, der lief im
700MHz-Celeron prima und im Pentium jetzt überhaupt nicht mehr. Der
on-Boar-Controller kann die Platten wenigstens (langsam) ansprechen,
aber wehe es sind mal größere Datenmengen, wie zum Beispiel 10GB oder
mehr am Stück...

In der "/var/log/messages" stehen dann solche Meldungen drin (DMA aktiv):

[CODE]Oct 2 07:58:29 erde kernel:
g_vfs_done():ar0s1a[WRITE(offset=315998748672, length=16384)]error = 1
Oct 2 07:59:00 erde kernel:
g_vfs_done():ar0s1a[WRITE(offset=315998748672, length=16384)]error = 1
[/CODE]
[CODE]
Zum Reboot stand dann immer etwas mit "alloc" oder so ähnlich. Da habe
ich aber kein Foto von.
[/CODE]

Dann habe ich zwei Nächte gegoogelt, und habe auch haufenweise Leute
gefunden die soein Problem hatten. Leider hatte da jeder etwas anderes
in Verdacht, keiner wusste was und eine Lösung war auch fern.

Letzte Nacht habe ich dann einen Post gefunden, in dem behauptet wurde,
das man das Problem durch deaktivieren von DMA umgehen kann. Nicht
schön, aber ich hab daraufhin in meinem System komplett überall DMA
abgeschaltet und er hatte schon etwas länger durchgehalten bis zum
Reboot....
Meistens wird der Reboot beim kopieren von dem RAID ausgelöst, das liegt
aber daran, das ich auf der Systemplatte kaum was mache. Wenn ich etwas
mit TAR packe und gleich durch "bzip2 -9" pipe, dann wird er langsammer
und es kommt sehr selten zum Reboot. Beim direkten kopieren (auch auf
USB-Platte) wird es in kurzer Zeit rebootet.

Und es sah dann so aus wie auf dem angehängten Foto.

All die Lösungen oder Vermutungen, die ich gelesen hatte trafen auf mein
System nicht zu.

Da wurden Dinge wie:

 - defekte Platte, kann nicht sein, in einem anderen Rechner läuft sie
super;
 - defekter Controller, kann nicht sein, da der PCI-SATA-Controller ein
Jahr ohne Probleme lief und auch der (neue) on-Board die selben Probleme
macht;
 - SoftRAID (auch gmirror), kann auch nicht sein, da es in allen anderen
Systemen in identischer Version super lief, ausserdem haben die meisten
das Problem auch ohne RAID und mit gmirror haben einige genau die
gleichen Probleme;

genann.

Ich vermute, das es mit dem SiS-Chip-Set zutun hat, aber dafür muss es
doch einen Workaround geben......?
Ein anderes Board kann ich nicht nehmen, da ich sonst die
Stromspareigenschaften der CPU nicht voll nutzen kann.

Vielleicht kann man im Kernel eine Option so modifizieren, das er die
IRQ nicht ganz so schnell hintereinander auslöst oder das er größere
Datenmängen in irgendeinen Puffer verwalten kann, oder sowas...

Was meint Ihr?
Ich kann diese Meldungen nicht wirklich interpretieren, weiß einer etwas?
Ich bin für Jeden Tip dankbar.

Gruß
Yoda

To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Wed 03 Oct 2007 - 02:26:10 CEST

search this site