Re: FreeBSD auf SSD

From: Bernd Walter <ticso(at)cicely7.cicely.de>
Date: Fri, 4 Feb 2011 20:08:35 +0100

On Fri, Feb 04, 2011 at 06:59:15PM +0100, Oliver Fromme wrote:
> Bernd Walter wrote:
> > Man baut 200GB ein und bekommt 160GB netto.
> > 20% sind also Verlust.
>
> Ich meinte es eher andersherum: Man baut 160 GB ein, aber
> tatsächlich sind 200 GB drin, von denen 20% nicht nutzbar
> sind.

Sache der Perspektive.

> > > Ich glaube, man braucht sich nicht mehr Gedanken zu machen
> > > als bei herkömmlichen Festplatten, eher im Gegenteil:
> > >
> > > Bei einer Festplatte kann sehr plötzlich ein Totalausfall
> > > auftreten, vor dem man auch durch SMART nicht rechtzeitig
> > > gewarnt wird (z.B. durch einen Headcrash mit Abrieb oder
> > > durch einen Motorschaden). Bei einer SSD ist das dagegen
> > > äußerst unwahrscheinlich, da es keine mechanischen Kompo-
> > > nenten gibt. Der PEC-Verschleiß der Zellen tritt allmäh-
> > > lich auf und lässt sich durch SMART abfragen, so dass man
> > > rechtzeitig für Ersatz sorgen kann.
> >
> > Wenn es mal immer so wäre, aber statistisch gebe ich dir recht.
> > Ein Totalausfall ist bei einem SSD sehr selten.
>
> Ja, mir ist nur ein konkreter Fall bekannt, in dem eine SSD
> Opfer einer statischen Entladung wurde. Aber ich vermute,
> dass da der Besitzer nicht ganz unschuldig war; von allein
> tritt so eine Entladung normalerweise nicht auf. Und sowas
> kann einer herkömmlichen Festplatte natürlich auch passie-
> ren, ebenso wie sonstige Widrigkeiten (Spannungsspitze aus
> kaputtem Netzteil usw.). Wenn dagegen die Mama beim Putzen
> den Tower umschmeißt, macht das der SSD nichts, aber die
> Festplatte sieht dann alt aus. :-)

Ja - Elektrostatik, Überspannung und Co wird auch eine Festplatte
nicht überleben - immerhin gibt es bei einer Festplatte dann
die Hoffnung, dass ein Datenretter das noch kann, bei einem
SSD ist eben der Speicher elektrisch und somit möglicherweise
kaput.
Dafür gibt es bei einer Festplatte nur jede Menge andere
Ausfallmöglichkeiten, während mir bei SSD nur Radioaktive
Strahlung bekannt ist.

> > Das man den Verschleiß abfragen kann halte ich hingegen für ein
> > Gerücht - die Bits kippen einfach irgendwann und das ist bei
> > defekten Zellen deutlich unterhalb von einigen Jahren.
>
> Also, der Controller meiner SSD hier liefert jede Menge
> interessante Werte per SMART:
>
> - Raw_Read_Error_Rate
> - Retired_Block_Count
> - Program_Fail_Count
> - Erase_Fail_Count
> - Wear_Range_Delta
> - Reported_Uncorrect
> - ECC_Uncorr_Error_Count
> - Reallocated_Event_Count
> - SSD_Life_Left
> - Lifetime_Writes_GiB
> - Lifetime_Reads_GiB

Das Problem ist, dass das SSD technisch nur von auyfgetretenen
Fehlern berichten kann, aber nicht von bald auftretenden.
Also ein Bit kippt und dass lässt sich dann erfassen.
Ein gekipptes Bit ist harmlos, weil sich das per CRC (streng genommen
ist eine CRC etwas anderes, aber den Begriff benutzen Hersteller)
korigieren lässt.
Es lassen sich auch mehrere Fehler korigieren, aber man weiß nicht
wie viele Bits kippen, weil man nicht weiß wie viele Zellen in
einer Page vor dem kippen sind.
Man weiß wie viele Bits kippen dürfen, bis die Redundanz versagt
und man weiß wie viele schon gekippt sind, aber nicht wann wie
viele weitere kippen.
Und man weiß auch nicht warum Bits gekippt sind - Radioaktive Strahlung
oder zu großer Leckstrom, also wirklich defekte Zelle.
Auch da muss man sagen, dass bei einem Fehler in einer Zelle mit MLC
immer gleich 4 Bits betroffen sind und bei SLC lediglich 1 Bit.
Der einzige Schutz gegen eine plötzliche Anhäufung grenzwertige Zellen
ist die Tatsache, dass die beim verify anders lesen, als normal aber
das hilft nur bedingt.

Die Lifetime Werte dürften statistisch sein, also nichts exaktes.

Retired block count bezieht sich auf zu stark auffällig gewordene
Blöcke, die komplet aussortiert wurden - sicherlich ein wichtiger
Wert, weil der den Free-Pool reduziert.
Ebenso beziehen sich die anderen Werte auf konkret aufgetretene Fehler
und nicht auf Lesequalität.
Man muss sich vorstellen, dass digital gelesen wird - da gibt es eins
oder null, bzw 0-15 bei MLC, aber kein "gerade noch 1" oder "gerade
noch 0" und erst recht kein "nicht mehr ganz so deutlich 1 wie gestern".
Das ist etwas anders, als ein Buch lesen - wir werten beim lesen
gleichzeitig aus, ob die Schrift auf einer Seite verblasst ist oder das
Papier zerfällt, aber auch wir bemerken das nicht, wenn das Buch im
Regal steht.
Man kann glaue ich nicht oft genug sagen wie wichtig ein Backup ist,
auch in Bezug darauf, dass alles mal gelesen wird.
Ein kleveres SSD wird Daten, die mit vielen Bitfehlern noch korigiert
werden konnten umkopieren, aber mir ist keines bekannt, welches aus
Langeweile liest, weil das nämlich auf die Performance gehen kann.

Im Vergleich zu einer Festplatte ist das aber egal, weil eine
Festplatte ja letzlich ähnliche Probleme hat.

> und noch ein paar mehr. Ich bin mal gespannt, wie sich das
> entwickelt; mein smartd(8) hat da jedenfalls ein Auge drauf.

-- 
B.Walter <bernd@bwct.de> http://www.bwct.de
Modbus/TCP Ethernet I/O Baugruppen, ARM basierte FreeBSD Rechner uvm.
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Fri 04 Feb 2011 - 20:09:00 CET

search this site