Re: Para FreeBSD?

From: Bernd Walter <ticso(at)cicely7.cicely.de>
Date: Wed, 28 Jul 2010 10:22:01 +0200

On Wed, Jul 28, 2010 at 10:01:50AM +0200, Harald Neuffer wrote:
> Oliver Fromme wrote:
> >Harald Neuffer wrote:
> > > ich habe einen Rechner mit 6.3-STABLE i386 mit komischen Verhalten. Er
> > > startet sich alle Stunde neu. Das heißt, er macht keinen normalen
> > > reboot, das Filesystem wird beim Runterfahren nicht gesynced.
> > >
> > > In Logfiles findet sich nichts, was Hinweise auf die Ursache geben
> > > könnte. Ein Watchdog läuft nicht auf der Maschine. Der Spuck kann durch
> > > ein "shutdown -p now" beendet werden, nach dem Einschalten läuft der
> > > Rechner wieder normal ohne die stündlichen Reboots.
> > >
> > > Das Verhalten hatte ich vor einem 3/4 Jahr schon mal mit den gleichen
> > > Symptomen. Was kann die Ursache sein?
> > >
> > > Hier noch ein Auszug vom last Kommando:
> > >
> > > reboot ~ Mon Jul 26 22:44
> > > reboot ~ Mon Jul 26 21:44
> > > reboot ~ Mon Jul 26 20:43
> > > reboot ~ Mon Jul 26 19:43
> > > reboot ~ Mon Jul 26 18:43
> > > reboot ~ Mon Jul 26 17:43
> > > reboot ~ Mon Jul 26 16:42
> > > reboot ~ Sat Jul 24 17:42
> >
> >An Bernds Überhitzungstheorie glaube ich nicht. Dafür ist
> >es viel zu gleichmäßig, und es erklärt nicht, warum nach
> >einem kurzzeitigen »shutdown -p now« die stündlichen Reboots
> >ausbleiben. Ich glaube auch nicht an einen cronjob, da
> >sich der Zeitpunkt des Reboot langsam nach hinten zu ver-
> >schieben scheint.

Die verschieben sich aber Uhrzeit-abhängig.
Spätere Uhrzeit (=> kühlere Umgebung!) gleich späterer Reboot.
Aber zugegeben: ich bin auch nicht so 100% davon überzeugt, allerdings
ist es für mich immer noch das plausibelste.

Vielleicht ist das aber auch ein Fehler, der von remote ausgelöst wird.
Und durch den power-down ist der Rechner länger offline, weswegen der
dieser remote-Auslöser dann erst mal aufgibt und eine Auszeit nimmt.

> >Mein Eindruck ist eher, dass beim Booten irgendetwas ausge-
> >löst wird, was dann nach einer Stunde den Reboot verursacht.
> >Als erstes fällt mir da der Hintergrund-fsck ein, allerdings
> >beginnt der schon 60 Sekunden nach dem Booten, nicht erst
> >nach 60 Minuten (es sei denn, Du hast den Default geändert).
> Hallo,
>
> background_fsck ist bei meinen Rechnern immer auf "NO" in der
> /etc/rc.conf gesetzt.

Eine andere Sache, die mir gerade einfällt ist eine kaputte Festplatte.
Die kann natürlich auch thermisch abhängig sein, aber es gibt auch den
Fall, dass deren Firmware Mist baut und manche Rechner reseten die
Festplatten beim reboot nicht.

> Noch ein paar Hintergrund Informationen zu dem Rechner. Er läuft als
> Backup von Daten für einen Server, die Daten werden per rsync durch
> einen ssh-Tunnel übertragen. Das passiert aber nur einmal nachts, sonst
> macht der Rechner nichts. Der Rechner hat ein Intel DG33FB Motherboard,
> er macht sonst alles, wie es sein sollte, also kein Aufhängen oder
> Neustarts des Systems, was vielleicht auf eine fehlerhafte
> Stromversorgung hinweisen würde.
> >
> >Es kann natürlich auch irgendwas sein, was das BIOS macht;
> >es muss nicht FreeBSD sein. Bist Du sicher, dass im BIOS-
> >Setup nicht irgendwo ein Watchdog enabled werden kann?
> Ich habe leider keinen BIOS Zugriff, kann das aber nachholen, aber kann
> ich sowas bei einem Intel Desktop Board einstellen? Wenn ja, dann habe
> ich diese Option bei den BIOS Einstellungen übersehen.
> >
> >Hast Du so einen Reboot mal "live" an der Console verfolgt?
> Leider nein, ich sehe nur in /var/log/messages

Das ist schade.

> Jul 26 20:43:55 manuel-ersatz kernel: Trying to mount root from
> ufs:/dev/ad0s1a
> Jul 26 20:43:55 manuel-ersatz kernel: WARNING: / was not properly dismounted
> Jul 26 20:43:56 manuel-ersatz kernel: em0: link state changed to UP
> Jul 26 20:43:58 manuel-ersatz ntpd[647]: ntpd 4.2.0-a Fri Apr 11
> 12:08:09 CEST 2008 (1)
> Jul 26 20:43:58 manuel-ersatz ntpd[647]: no IPv6 interfaces found
> Jul 26 20:52:33 manuel-ersatz ntpd[647]: time reset +0.213396 s
> Jul 26 20:52:33 manuel-ersatz ntpd[647]: kernel time sync disabled 2041
> Jul 26 21:23:28 manuel-ersatz ntpd[647]: kernel time sync enabled 2001
> Jul 26 21:44:12 manuel-ersatz syslogd: kernel boot file is
> /boot/kernel/kernel
> Jul 26 21:44:12 manuel-ersatz kernel: Copyright (c) 1992-2008 The
> FreeBSD Project.
> Jul 26 21:44:12 manuel-ersatz kernel: Copyright (c) 1979, 1980, 1983,
> 1986, 1988, 1989, 1991, 1992, 1993, 1994

Liefert ein dmesg -a evtl mehr Informationen?
Manche BIOSe löschen das RAM beim booten nicht, weswegen man dann noch
auch den alten dmesg-Buffer zurückgreifen kann und auch Ausgaben sieht,
die nun wirklich nicht mehr auf Platte geschrieben werden konnten.
Im RAM Bereich gibt es auch potentielle Kandidaten, nämlich ein NMI
bei unkorigierbaren Fehlern.
RAM muss beim power-on einmal auf gültige Checksummen initialisiert
werden - evtl vergisst das BIOS das nach einem NMI-initiierten reboot
und das System läuft gleich wieder in die Falle.
Aber mit der RAM/ECC Theorie lässt sich die Regelmässigkeit noch weniger
erklären.

-- 
B.Walter <bernd@bwct.de> http://www.bwct.de
Modbus/TCP Ethernet I/O Baugruppen, ARM basierte FreeBSD Rechner uvm.
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Wed 28 Jul 2010 - 10:22:34 CEST

search this site