Re: server crash bei festplattenaktivität

From: Bernd Walter <ticso(at)cicely7.cicely.de>
Date: Fri, 27 Aug 2010 11:18:30 +0200

On Fri, Aug 27, 2010 at 09:47:07AM +0100, Marian Hettwer wrote:
> Hallo alle miteinander,
>
> ich habe hier einen remote root server, der mir seit ein paar Tagen
> sorgen bereitet.
>
> Beim nächtlichen cronjob der ein tar von einer Platte zur nächsten
> (backup zweck) baut, schmiert der server hart ab.
> Wenn man mit einer remote console rangeht steht er im fsck fest und
> bittet um Hilfe.
>
> Ich konnte die Sache ebend reproduzieren, als mir die Maschine bei
> einem "freebsd-update install" geplatzt ist.
> Leider hatte ich in dem Moment keine remote console zur Hand.
>
> dmesg und /var/log/messages sind leer und geben keine Infos.
>
> Was wäre denn als nächster Schritt ratsam? Ein script was "vmstat 1" >
> /root/foo.log schreibt?
> Mit welchen tools würdet ihr euch auf die Lauer legen um
> rauszubekommen was den panic verursacht?

Consolen-Log - evtl. auch crashdump, was ebenfalls die Logeinträge
sichert, sofern die Festplatte dann noch mag.
Alles aus dem Userland heraus kann nur vor dem Panic protokollieren
und ist damit vermutlich wertlos.

> Klar ist nur: Festplatten aktivität. Scheinbar auch auf der primären
> Platte.

Also Festplattenprobleme äußern sich meistens nicht in einem reboot,
sondern in Hänger.

> Die Kiste ist ein 8.0-release und ich wollte erstmal nen update auf
> 8.1 machen.

Das kann ich nicht empfehlen, wenn es derartige Probleme gibt, die
möglicherweise auf Hardware zurückzuführen sind.
Im Verdacht steht bei solchen Symptomen bei mir sehr hoch Netzteil,
RAM und Co, was dann Filesystem-Panics auslöst.
Ich finde es schon ziemlich bezeichnend, wenn der fsck Fehler finded,
deren Behebung er nicht alleine entscheiden will - da scheint irgendwas
aus der Strecke geblieben sein.
Auch die Tatsache, dass das nicht immer schon so war deutet auf ein
Verschleißteil als Ursache hin und nicht auf Software.
Natürlich kann es auch Software sein, aber deine Beschreibung klingt
nach einer anderen Ursache.

-- 
B.Walter <bernd@bwct.de> http://www.bwct.de
Modbus/TCP Ethernet I/O Baugruppen, ARM basierte FreeBSD Rechner uvm.
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Fri 27 Aug 2010 - 11:18:51 CEST

search this site