Re: SATA Timeouts

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Wed, 28 Apr 2010 10:40:24 +0200 (CEST)

Robert Eckardt wrote:
> nach Upgrade meines Servers auf 8.0-RELEASE-p2 mit zwei RAID1-Spiegeln
> mit 1TB und 1,5TB Seagate SATA Disks erhalte ich Timeouts, die zum
> Brechen des Spiegels führen. Die Platten loggen keine Fehler und den
> Patch aus FreeNAS mit hw.ata.to=15 habe ich auch schon eingesetzt.
> (Obowhl es noch viele andere unterschiedliche Timeouttyen gibt.)
>
> Nach dem Wiederaufbauen des Spiegels läuft es wieder für ein paar Stunden.
> Die Timeouts scheinen in Verbindung mit smartd-Short-Tests aufzutreten.

Heißt das, dass das Problem _nicht_ mehr auftritt, wenn Du
den smartd (vorübergehend) ausschaltest? Hast Du das mal
getestet?

Wie sieht der entsprechende Abschnitt der smartd.conf genau
aus? Manchmal hat dort ein unscheinbarer Tippfehler einen
erheblichen Effekt, z.B. wenn man -c und -C verwechselt ...

> Lustigerweise scheinen die Timeouts aber nicht einmal eine Sekunde zu
> dauern, wie dem nachfolgenden Log zu entnehmen ist:

Die Timestamps muessen nicht unbedingt etwas bedeuten. Der
syslogd generiert sie i.allg. dann, wenn er einen Eintrag
bearbeitet. Wird der syslogd durch eine nicht reagierende
Festplatte blockiert (der Prozess befindet sich dann im
"disk-wait"-Status, erkennbar am "D" in ps), dann ent-
spricht der Timestamp erst dem Zeitpunkt des Endes des
Timeouts.

Ob das in diesem Fall auch so ist, kann ich allerdings
nicht mit Sicherheit sagen.

> Apr 27 03:02:34 gluon kernel: ad4: TIMEOUT - WRITE_DMA48 retrying (1 retry
> left) LBA=1953525167
> Apr 27 03:02:34 gluon kernel: ad4: TIMEOUT - WRITE_DMA48 retrying (0 retries
> left) LBA=1953525167
> Apr 27 03:02:34 gluon kernel: ad4: FAILURE - WRITE_DMA48 timed out LBA=1953525167

Hast Du mal beobachtet, wie sich die LBAs verteilen? Ich
nehme an, es sind jedesmal völlig unterschiedliche, oder?

Gruß
   Olli

-- 
Oliver Fromme, secnetix GmbH & Co. KG, Marktplatz 29, 85567 Grafing b. M.
Handelsregister: Registergericht Muenchen, HRA 74606,  Geschäftsfuehrung:
secnetix Verwaltungsgesellsch. mbH, Handelsregister: Registergericht Mün-
chen, HRB 125758,  Geschäftsführer: Maik Bachmann, Olaf Erb, Ralf Gebhart
FreeBSD-Dienstleistungen, -Produkte und mehr:  http://www.secnetix.de/bsd
(On the statement print "42 monkeys" + "1 snake":)  By the way,
both perl and Python get this wrong.  Perl gives 43 and Python
gives "42 monkeys1 snake", when the answer is clearly "41 monkeys
and 1 fat snake".        -- Jim Fulton
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Wed 28 Apr 2010 - 10:40:46 CEST

search this site