Re: Para FreeBSD?

From: Bernd Walter <ticso(at)cicely7.cicely.de>
Date: Wed, 28 Jul 2010 13:34:49 +0200

On Wed, Jul 28, 2010 at 12:23:23PM +0200, Oliver Fromme wrote:
> Bernd Walter wrote:
> > Harald Neuffer wrote:
> > > Oliver Fromme wrote:
> > > > Harald Neuffer wrote:
> > > > > ich habe einen Rechner mit 6.3-STABLE i386 mit komischen Verhalten. Er
> > > > > startet sich alle Stunde neu. Das heißt, er macht keinen normalen
> > > > > reboot, das Filesystem wird beim Runterfahren nicht gesynced.
> > > > >
> > > > > In Logfiles findet sich nichts, was Hinweise auf die Ursache geben
> > > > > könnte. Ein Watchdog läuft nicht auf der Maschine. Der Spuck kann durch
> > > > > ein "shutdown -p now" beendet werden, nach dem Einschalten läuft der
> > > > > Rechner wieder normal ohne die stündlichen Reboots.
> > > > >
> > > > > Das Verhalten hatte ich vor einem 3/4 Jahr schon mal mit den gleichen
> > > > > Symptomen. Was kann die Ursache sein?
> > > > >
> > > > > Hier noch ein Auszug vom last Kommando:
> > > > >
> > > > > reboot ~ Mon Jul 26 22:44
> > > > > reboot ~ Mon Jul 26 21:44
> > > > > reboot ~ Mon Jul 26 20:43
> > > > > reboot ~ Mon Jul 26 19:43
> > > > > reboot ~ Mon Jul 26 18:43
> > > > > reboot ~ Mon Jul 26 17:43
> > > > > reboot ~ Mon Jul 26 16:42
> > > > > reboot ~ Sat Jul 24 17:42
> > > >
> > > > An Bernds Überhitzungstheorie glaube ich nicht. Dafür ist
> > > > es viel zu gleichmäßig, und es erklärt nicht, warum nach
> > > > einem kurzzeitigen »shutdown -p now« die stündlichen Reboots
> > > > ausbleiben. Ich glaube auch nicht an einen cronjob, da
> > > > sich der Zeitpunkt des Reboot langsam nach hinten zu ver-
> > > > schieben scheint.
> >
> > Die verschieben sich aber Uhrzeit-abhängig.
>
> Nö, tun sie nicht. Anhand der oben genannten Zeitpunkte
> scheint der Zeitabstand konstant zu sein, nämlich ungefähr
> eine Stunde und 15 Sekunden.

Mag sein.

> Daher mein Verdacht, dass 15 Sekunden nach dem Reboot
> irgendetwas getriggert wird, was dann nach genau einer
> Stunde den nächsten Reboot verursacht. Das riecht
> eigentlich nach einem Watchdog. Aber was das genau
> ist, kann man man nur spekulieren. In solchen Fällen
> ist eine Ferndiagnose nahezu aussichtslos.

Auch denkbar, wobei ein Watchdog mit einer Stunde schon extrem
ungewöhnlich ist - normalerweise zählt ein Watchdog maximal
einige Sekunden bis wenige Minuten.

Was da aber wieder von der Wahrscheinlichkeit her gegen spricht
ist der 24. um 17:42 und der nächste (nach einem powerdown vermutlich)
erst am 26. um 16:42 - wäre schon erstaunlich, wenn ein Powerdown
ebenfalls diesen 15 Sekunden offset verursachen würde - das spricht
dann wieder mehr für die Uhrzeit als Auslöser.

> Ich würde mich mal vor die Console stellen, im Augen-
> blick des Reboots auf die Stoppuhr drücken und gucken,
> was nach 15 Sekunden genau los ist -- Ist er dann noch
> im BIOS-POST, oder in einem Zusatz-BIOS (z.B. RAID-
> Controller), im Boot-loader, oder bootet der Kernel
> bereits? Wenn man Glück hat, kann man's auf diese Weise
> vielleicht schonmal ein bisschen eingrenzen.
>
> > Spätere Uhrzeit (=> kühlere Umgebung!) gleich späterer Reboot.
> > Aber zugegeben: ich bin auch nicht so 100% davon überzeugt, allerdings
> > ist es für mich immer noch das plausibelste.
>
> Wenn ich Harald verstanden habe, startet er den Rechner
> nach dem »shutdown -p now« sofort wieder; er ist also
> allenfalls ein paar Sekunden oder Minuten aus. Ich denke
> nicht, dass dies zu einer hinreichenden Abkühlung führt,
> dass danach stunden- und tagelang kein Reboot mehr auf-
> tritt, dass aber nach dem nächsten normalen Neustart
> sofort wieder das Problem der stündlichen Reboots
> zurückkehrt.

Vorstellen kann ich mir das denoch.
Ich habe schon etliche Temperaturfehler gesehen, die erst
nach Tagen Betrieb Probleme machen.

> Oder habe ich Dich da missverstanden, Harald?
>
> > Vielleicht ist das aber auch ein Fehler, der von remote ausgelöst wird.
> > Und durch den power-down ist der Rechner länger offline, weswegen der
> > dieser remote-Auslöser dann erst mal aufgibt und eine Auszeit nimmt.
>
> Hmm. In der Tat, das wäre denkbar. Offenbar gibt es ja
> eine Remote-Management-Möglichkeit, mit deren Hilfe man
> den Rechner aus- und einschalten kann und Resets auslösen
> kann. Vielleicht spinnt ja dieses Remote-Management-Teil
> irgendwie? Das würde ich jetzt nicht ausschließen.
>
> Ich habe mit so Management-Zeugs schon die gruseligsten
> Erfahrungen gemacht und würde dem alles zutrauen.
> Vielleicht merkt es nach einem »shutdown -p now« und
> darauffolgendem Einschalten, dass der Rechner nun läuft
> und lässt ihn in Ruhe, aber bei einem »normalen« Hoch-
> fahren merkt es das aus irgendeinem Grund nicht und denkt
> sich nach einer Stunde: »Hmm, dat Ding löppt immer noch
> nicht, mal gucken, ob ich das mit 'nem Reset wieder in
> Gang kriege.«

Also ein externer Watchdog sozusagen.
Das würde dann wiederum auch obiges Uhrzeitphaenomen nach
offsensichtlichem powerdown erklären.
Selbst ein Onboard Management-Controller würde bei einem shutdown -p
weiterhin über Standby-Strom versorgt werden, aber vielleicht dann
trotzdem erst mal eine Zeit lang Ruhe geben.

> Wenn mir jemand sowas erzählen würde, würde ich es jeden-
> falls sofort glauben.

Ich auch.

-- 
B.Walter <bernd@bwct.de> http://www.bwct.de
Modbus/TCP Ethernet I/O Baugruppen, ARM basierte FreeBSD Rechner uvm.
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Wed 28 Jul 2010 - 13:35:23 CEST

search this site