Re: Tyan K8S, bge(4) - friert -stable und -current ein

From: Andreas Braukmann <braukmann(at)tse-online.de>
Date: Sun, 28 Dec 2003 21:58:36 +0100

--On Sonntag, 28. Dezember 2003 19:57 Uhr +0100 Gregor Bittel wrote:

> Macht ja nix, meine Website ist ja noch online, die neuen
> Ausgaben von dem S2885 müssten beim eintreffen dieser
> Mail bereits hochgeladen sein (5.2-RC2, normal und einmal
> als verbose-Auszug).

Ich schick Dir nachher (oder morgen ;-)) mal meine Ausgaben
von dmesg, mptable und pciconf.

>> Inzwischen bin ich auch zu der Ueberzeugung gekommen, dass
>> es sich um ein pures Interrupt-(Routing)-bezogenes Problem
>> handelt.
>
> Das vermute ich auch - oder aber auch ein Defekt des Boards selbst,

Das ist eine stille Befuerchtung meinerseits, die ich aber erst
noch durch einen Kreuztest mit dem anderen Board (siehe weiter
unten) beweisen muesste.

> [...]
>> Morgen werde ich dem "einfrierendem" Board ein frisches BIOS
>> verpassen.
>
> Sind die (BIOS)-Versionen der beiden Boards unterschiedlich?

Ja. Das Board in der 1 HE Kiste (welches mit zumindest einer
BIOS-Setup/Kernel-Kombination stabil laeuft) hat ein sehr altes
BIOS welches zwischen "Erst-Release" und erstem offiziellem
Tyan-Update liegt. Das zweite (reproduzierbar einfrierende)
Board hat(te) ebenfalls ein rein Tyan-internes intermediate
release BIOS, welches zwischen dem aktuellen BIOS (laut Tyan
Website) und dem offiziellem Vorgaenger liegt.

Sowohl mit dem aktuellem BIOS (2.02) als auch mit der vorherigen
Version (2.01l) lassen sich die Freezes ebenfalls reproduzieren.
Mit dem 2.02 BIOS fror die Kiste schon beim ifconfig (single
user mode, natuerlich) ein. Die Aktivierung des Kernel-Debuggers
ist mir mit dem BIOS ueberhaupt nicht gelungen.
Mit dem 2.01l BIOS wurden aus den "Freezes" dann zum Teil echte
Panics (alle Ausgaben deuteten auf Interrupt-Kontext und Netz-
betrieb). Ich hab das nicht naeher untersucht und mir dann das
BIOS aus dem anderen Board kopiert. (BTW, ein fertig installier-
tes [von einem anderen Opteron Server, auf den ich zu Diagnose-
Zwecken leider, leider nicht zugreifen kann] Win 2003 liess sich
mit 2.01l oder 2.02 auch nicht mit aktivierten Netzwerk-Treibern
booten.)
Mit dem BIOS laeuft nun immerhin die "gute" Kernel-/Setup-Konfi-
guration (4.9-stable mit APICIO und SMP sowie "ACPI OFF" im BIOS)
auch auf dem "freeze"-Board.
Ganz interessant fand ich, dass sich (im Gegensatz zu vorherigen
Vergleichen) nun (auf dem ehemals einfrierendem Board) eine andere
Interrupt-Verteilung ergeben hat.

Ich muss nun zusehen, dass ich die eine Kiste endlich fuer den
Produktivbetrieb fertig bekomme. Dann will ich in den naechsten
Tagen die anderen (aktuelleren) BIOS-Versionen auf dem anderen
Board testen. Und zwar mit -stable, -current und amd64-current.

-Andreas

P.S.:

>> Fuer extrem aergerlich halte ich bei beiden Controllern, dass
>> sie mit angeflanschtem Battery-Backup nicht in einer 1 HE Riser-
>> Card zu betreiben sind. Jedenfalls dann nicht, wenn noch weitere
>> PCI-Slots im Ausbreitungsbereich des Controllers liegen.

> Hmpf...
> Da habe ich bei meinen Controllern noch nie darauf geachtet,
> weil ich meistens so Riesengehäuse nehme,

Naja, ich kaeme auch nie auf die Idee meinen 5400S in einen 1 HE
Server zu verpflanzen. Bei einem explizit als "low profile" ver-
marktetem Controller liegt der Gedanke aber wohl nicht so fern.

> daß die meisten Laufwerke auch darin Platz haben,

In der 1 HE Kiste stecken derzeit 4 * 73 GByte RAID 5; was will
man mehr? ;-) (Jede HE kostet am Zielstandort)
In die 2 HE Kiste passen 6 SCA-Kanister und ein vollwertiges 5,25"
Laufwerk fuer Wechselmedien.

To Unsubscribe: send mail to majordomo.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Sun 28 Dec 2003 - 21:58:46 CET

search this site