SATA Timeouts

From: Robert Eckardt <rol(at)robert-eckardt.de>
Date: Wed, 28 Apr 2010 08:59:55 +0200

Hi,

nach Upgrade meines Servers auf 8.0-RELEASE-p2 mit zwei RAID1-Spiegeln
mit 1TB und 1,5TB Seagate SATA Disks erhalte ich Timeouts, die zum
Brechen des Spiegels führen. Die Platten loggen keine Fehler und den
Patch aus FreeNAS mit hw.ata.to=15 habe ich auch schon eingesetzt.
(Obowhl es noch viele andere unterschiedliche Timeouttyen gibt.)

Nach dem Wiederaufbauen des Spiegels läuft es wieder für ein paar Stunden.
Die Timeouts scheinen in Verbindung mit smartd-Short-Tests aufzutreten.

Lustigerweise scheinen die Timeouts aber nicht einmal eine Sekunde zu
dauern, wie dem nachfolgenden Log zu entnehmen ist:
Apr 27 03:02:34 gluon kernel: ad4: TIMEOUT - WRITE_DMA48 retrying (1 retry
left) LBA=1953525167
Apr 27 03:02:34 gluon kernel: ad4: TIMEOUT - WRITE_DMA48 retrying (0 retries
left) LBA=1953525167
Apr 27 03:02:34 gluon kernel: ad4: FAILURE - WRITE_DMA48 timed out LBA=1953525167
Apr 27 03:02:34 gluon kernel: GEOM_MIRROR: Cannot write metadata on ad4
(device=gm0, error=5).
Apr 27 03:02:34 gluon kernel: GEOM_MIRROR: Cannot update metadata on disk ad4
(error=5).
Apr 27 03:02:34 gluon kernel: GEOM_MIRROR: Device gm0: provider ad4 disconnected.

Bei Tausch des Platten-Cage auf ein Liam Li Modell fingen die 1,5 TB
Platten plötzlich mit Klackgeräuschen an und der Start-Stop-Count zählte
z.T. alle 20s hoch. (Das Teil hat nur einen Molexstecker und ich vermute
die 1,5TB Platten reagieren empfindlich auf Spannungsschwankungen auf
der Backplane.)
Daher bin ich wieder zurück auf den alten (deutlich wartungsunfreundlicheren)
Cage gegangen. Start-Stops sind wieder vorbei, doch nun machen sich
die Timeouts wieder bemerkbar.
Die 1TB-Platte (ad4) und die SATA-Kabel habe ich auch schon getauscht.

Habt ihr noch eine Idee, was ich tauschen oder patchen könnte?

Grüße,
Robert

--
Dr. Robert Eckardt    ---    Robert.Eckardt(at)Robert-Eckardt.de
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Wed 28 Apr 2010 - 09:00:20 CEST

search this site