Re: Grown defects bei IDE / ATAPI

From: Bernd Walter <ticso(at)cicely12.cicely.de>
Date: Tue, 2 Sep 2003 11:11:50 +0200

On Tue, Sep 02, 2003 at 08:08:36AM +0200, Udo Erdelhoff wrote:
> Hi,
> On Mon, Sep 01, 2003 at 11:04:15PM +0200, Bernd Walter wrote:
> > > Die Zeiten, wo SCSI == Qualität, sind leider vorbei.
> >
> > Kann ich nicht bestätigen - mir rauchen immer noch mehr IDE Platten
> > ab, als SCSI, obwohl ich mit weitaus mehr SCSI Platten zu tun habe.
>
> wir haben @work habe so ca. 12000 Platten im Einsatz (können auch
> 15K sein, ich zähle die so selten), und bis auf ein paar Ausnahmen
> (wie die schon erwähnten Sun Workstations) sind das alles SCSI und
> fast ausschließlich Seagate. Jedenfalls sind das die Platten, die
> Qunix/DotHill/Artecon/Sun/IBM in ihren Servern oder RAIDs verbauen.
> Und ich habe im diesem Jahr noch keinen Tag erlebt, wo nicht
> mindestens eine Platte ausgefallen ist. Und es ist ganz klar so,
> daß die neueren RAIDs und Platten deutlich mehr Ausfälle zeigen
> als die alten.

Mit so vielen Platten hatte ich noch nicht gleichzeitig zu tun gehabt,
wobei es schon einige hundert bis tausend sind.
Aleine @home werkeln so an die hundert Platten, wobei diese Exemplare
inzwischen in die Jahre gekommen sind.
Daß heutige Platte mehr Ausfälle zeigen mag sicherlich sein.
Täglich einen Ausfall halte ich aber denoch für ungewöhnlich hoch.
Ich habe mich aber beim Plattenkauf auch niemals an High-End Modelle
gehalten.
Außnahmen gab es immer wieder, wenn der Einkauf sich bei einer
Bestellung zu dem High-End Modell der Vorgängerserien hat hinreißen
lassen, weil die geforderte Platte nicht lieferbar war.
Das Argument »die hat weniger gekostet und soll genauso schnell sein«
liegt denen scheinbar im Blut.
Von Stromaufnahme und Haltbarkeit wird da nie gesprochen...
In der Regel waren dieses dann auch die Platten die ausgefallen sind.

> > Natürlich muss man sich auch SCSI Platten sorgfälltig aussuchen.
> > HotSpare ist aber in der Tat ein Thema - wenn Platten Jahrelang
> > immer nur auf der gleichen Spur drehen, dann kann man die besser
> > gleich wegwerfen.
> > Son cronjob, der ab und an einen Zufälligen Block liest wirkt wunder.
>
> Das geht natürlich nur, wenn das RAID in Software gemacht wird. Wenn
> man allerdings ein externes RAID hat, wird das schon schwierig, da hat
> sowas der Controller zu machen. Und wenn er es nicht tut oder der
> Hersteller des RAIDs die Platten nicht sorgfältig selektiert, dann
> wird es Zeit, den Hersteller zu wechseln.

Ein Grund, warum ich externe Controller haße.
Die Dinger verschweigen einem größtenteils ECC Fehler und verhindern
direkten Plattenzugriff.
Ein paar IBM Platten hatten ja immerhin Temperatursensoren gehabt,
die ich schon als nützlich empfunden habe (die alten DGHS z.B.).
Und über den Sinn ECC Fehler zu sehen, bevor es zu einem tatsächlichen
Ausfall der Platte kommt brauche ich vermutlich auch nichts zu
erzählen.

> Mit wäre es ehrlich gesagt am liebsten, wenn in einem RAID nicht acht
> Platten von Hersteller A wären, sondern zwei von A, zwei von B, zwei
> von C, und zwei von D. Schön gemischt, damit einem ein Serienfehler
> nicht alles auf einmal zerlegt.

Ich habe zum Glück mit SCSI nur ein einziges mal ein echtes Problem mit
einem scheinbarem Serienfehler erlebt.
Waren damals Micropolis Platten, die mit einem Tag Differenz eingebaut
wurden und mit exakt diesem Tag Differenz ausgefallen sind.
Ist aber zum Glück während des Burn-In passiert.
Bei IDE kommt sowas natürlich öfters vor - wobei ich das auch nicht als
Serienfehler erklären kann wenn die Hersteller unterschiedlich sind.

> > Ich habe einen Fall erlebt, beide IDE Platten sind im Laufe der Zeit
> > ohne sich bemerkbar zu machen gestorben.
>
> Die Fälle kenne ich auch zur Genüge von SCSI, leider. 7 Platten
> als RAID 5, ein Hotspare, 4 davon innerhalb von 6 Stunden gestorben.
> Der RAID-Controller hat es zwar gemerkt, die HotSpare angeworfen
> und noch versucht, das RAID zu rebuilden, aber irgendwann war dann
> Essig. Da hilft nur noch das Backup.
>
> Der absolute Negativ-Hammer war aber der zeitgleiche Ausfall von
> 44 Platten in einem RAID mit 50 Platten. Der Hersteller durfte
> sich einiges anhören...

Sind natürlich extreme Fälle.
Sowas kenne ich aus meiner Praxis mit SCSI überhaupt nicht.

-- 
B.Walter                   BWCT                http://www.bwct.de
ticso(at)bwct.de                                  info(at)bwct.de
To Unsubscribe: send mail to majordomo.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Tue 02 Sep 2003 - 11:13:01 CEST

search this site