Re: badmem fuer FreeBSD

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Tue, 21 Dec 2004 14:48:00 +0100 (CET)

Oliver Brandmueller <ob(at)e-gitt.net> wrote:
> On Fri, Dec 17, 2004 at 10:39:36AM +0100, Karsten Rothemund wrote:
> > nachdem ich seit dem Umstieg auf FreeBSD 5.3 auf meinem Heimdesktop
> > einige nicht erklaerbare Abstuerze (page faults) hatte, habe ich ueber
> > nacht mal memtest86 angeworfen.
> >
> > Mein Verdacht scheint sich zu bestaetigen: eines der RAM-Module hat wohl
> > einige (ich hoffe wenige) fehlerhafte Speicherzellen.

Altes Modul rauswerfen; wenn Gewährleistung (d.h. jünger
als 2 Jahre), dann Reklamation und Tausch; neues Modul
reinstecken.

> Mir ist eine solche Möglichkeit unter FreeBSD mit normalen Bordmitteln
> nicht bekannt. Ich würde das ehrlichgesagt auch nicht benutzen wollen.
> Die Erfahrung der letzten 20 jahre hat mir da eines gesagt: Bei Speicher
> und Festplatten ist eine kaputte Zelle oder ein bad block meist nur der
> Anfang der Probleme; so ein Ding zerlegt sich mit großer Freude und
> wachsender Geschwindigkeit weiter.

Jein. Bei Festplatten gebe ich Dir recht, da der durch
Oberflächenfehler (z.B. Headcrashes) verursachte Abrieb
im allgemeinen weitere Fehler nach sich zieht; so eine
Platte gehört tonnifiziert.

Bei RAM dagegen setzen sich solche Probleme normalerweise
nicht fort (es sei denn, er überhitzt sich so stark, daß
durch Elektromigration eine ständige Verschlimmerung statt-
findet). Meistens war bei der Herstellung ein winziger
Fehler im Wafer, der dazu führt, daß einige Spalten oder
Zeilen in der Zellenmatrix »schwächeln«.

Tru64 (ehemals DEC UNIX) hat ein nettes Feature im Kernel:
Wenn eine gewisse Anzahl korrigierbare ECC-Fehler auftre-
ten, kopiert der kernel den Inhalt der betroffenen Page an
eine freie Stelle und disabled sie vollständig (und loggt
dies natürlich, inkl. Angabe des DIMM-Steckplatzes und RAM-
Chips). Das ganze passiert vollautomatisch und ist in der
Praxis äußerst hilfreich. Der Admin kann anhand der Log-
Einträge (deren Menge bzw. Häufigkeit) selbst entscheiden,
ob er den RAM-Riegel ersetzt, aber auf jeden Fall läuft die
Kiste erstmal verläßlich weiter, wie es sich für einen Ser-
ver gehört.

> Wenn Du was gegen das Wegschmeißen hast: Speicherriegel und Prozessoren
> lassen sich mit wenig Aufwand in Schmuck und Schlüsselanhänger
> umarbeiten - gerade vor Weihnachten ist das doch ein guter Vorschlag,
> oder? :-)

Sofern man keine Allergie gegen das Zeug hat und auch keine
Bedenken wegen des Schwermetallgehalts ... ;-)

Gruß
   Olli (der zu Fasching/Karneval nicht als RAM geht)

-- 
Oliver Fromme, secnetix GmbH & Co KG, Oettingenstr. 2, 80538 München
Any opinions expressed in this message may be personal to the author
and may not necessarily reflect the opinions of secnetix in any way.
"In My Egoistical Opinion, most people's C programs should be indented
six feet downward and covered with dirt."
        -- Blair P. Houghton
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Tue 21 Dec 2004 - 14:49:20 CET

search this site