Re: 4.9-stabie: stabil im single-user-mode; freeze im multiuser-Betrieb?

From: Andreas Braukmann <braukmann(at)tse-online.de>
Date: Wed, 10 Dec 2003 23:14:26 +0100

Moin,

On 12/10/03 21:50:49 +0100 Bernd Walter wrote:

>> Hmmm. Ich muss mich revidieren: "es" passiert auch im single
>> user Modus :-/ (Ich wollte gerade mal einen Kernel mit DDB
>> bauen; beim Edieren der Kernel-Konfiguration fror die Kiste
>> dann ein ...)
>
> DDB wäre gut, um festzustellen, ob das System komplett einfriert,
> oder nur ein Deadlock vorliegt.

Ein "top" oder "systat" zeigt nur marginale CPU-Last fuer
"user", "sys" und "interrupt"; zumindest *vor* dem Einfrieren.
Den Kernel mit DDB konnnte ich dann doch noch erfolgreich
bauen und installieren. Vor dem Einfrieren laesst sich der
Debugger einwandfrei (auch mehrfach) aktivieren und wieder
beenden. Nach dem Einfrieren sieht es erst so aus, als ob
auch das "break to debugger" nicht mehr moeglich waere.
Ich wollte (nach einigen Minuten) gerade den reset-Knopf
betaetigen, als der Debugger doch noch "erschien". Aber
er liess sich dann nicht bedienen. Ich hab mal noch ein
paar Zeichen eingetippt und bin dann nach hause gefahren.
Mal schauen, ob die Kiste die Eingaben bis morgen Mittag
verarbeitet hat und sie am Debugger-Prompt auftauchen ...

> Da du auch 4.9 einsetzt vermute ich, daß das System im 32 bit mode
> läuft?

Ja; und ausserdem auch nur mit einem UP-Kernel. Aber genau
mit der Konfiguration hat das Ding die Lasttests ueberstanden.
Eine "Tortur" bestand z.B. darin, folgende Dinge "gleichzeitig"
zu erledigen (nachdem ein "einfacher" buildworld fuer aktuelle
Hardware kaum noch als "Lasttest" zu bezeichnen ist):
    - Endlosschleife "make -j12 buildworld"
    - 2 * Endlosschleife bonnie++ mit 2 GByte Testgroesse
      (groessere Tests mochte der bonnie unter -stable nicht)
      auf 2 Dateisystemen auf unterschiedlichen RAID-Volumes
    - 2 * Endlosschleife "cpdup $portstree" && rm -rf ziel"
      (unterschiedliche Quell- und Ziel-Dateisysteme)
    - Endlosschleife "scp monsterdatei andererHost:"
    - Endlosschleife "gzip / gunzip grosseDatei"

Dabei war die Kiste interaktiv problemlos und verzoegerungsfrei
zu bedienen. Und daher ruehrt meine Befuerchtung, dass es doch
irgendeine Hardwarekomponente sein koennte. :-/

>> P.S.: nein. Ich will nicht, dass die Hardware kaputt ist :-/
>
> Ist PC Technik nicht das schon vom Design her kaputt?

aeehm. ja, ... aber $ausflucht_der_woche

Ich habe noch die Platten mit der -current-Installation; die
muss ich morgen allerdings erst in andere Container umschrauben.
Leider ist sie nicht mehr auf exakt dem Stand (pre fstat; pre
Opteron boot-Katastrophe von kuerzlich), auf dem sie waehrend
meiner Tests stand.

Zur Not kann ich die beschriebene 4.9-Installation auch noch
an ein anderes K8S-Board und einen anderen RAID-Controller
(Adaptec 2120 statt 2200) haengen, um den Tod von Hardware-
Komponenten auszuschliessen oder zu bestaetigen.

Das Problem scheint zumindest nicht ACPI-abhaengig zu sein;
das Einfrieren passiert mit und ohne aktiviertem ACPI im BIOS.
Auch das ECC-Scrubbing und Chip-Kill habe ich mal testweise
ausgeschaltet.

-Andreas

To Unsubscribe: send mail to majordomo.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Wed 10 Dec 2003 - 23:20:58 CET

search this site