On Wed, May 25, 2005 at 03:32:36PM +0200, Oliver Fromme wrote:
> Bernd Walter <ticso(at)cicely12.cicely.de> wrote:
> > On Wed, May 25, 2005 at 12:43:18PM +0200, Oliver Fromme wrote:
> > > Matthias Fechner <idefix(at)fechner.net> wrote:
> > > > seit gestern bekomme ich die folgenden Meldungen:
> > > > swap_pager: indefinite wait buffer: device: ad2s1e, blkno: 2217, size: 4096
> > > > swap_pager: indefinite wait buffer: device: ad2s1e, blkno: 24272, size: 4096
> > > > ...
> > >
> > > Das bedeutet im allgemeinen, daß die Festplatte gerade am
> > > Sterben ist.
> >
> > Im allgemeinen - leider ist die Meldung letzlich ziemlich doof.
> > Genau gesagt bedeutet es, dass die Anforderung dem swap_pager
> > zu lange dauert.
> > Bei einem echten Plattenfehler sollte sich eigendlich der ATA-Treiber
> > mit Timeouts zu Wort melden.
>
> »sollte« -- tut er aber nicht.
:(
> > Hier mag es aber nur bedeuten, dass die Platte mit anderen Requests
> > derart ausgelastet ist, dass der Request vom swap_pager einfach nur
> > lange dauert.
>
> Das habe ich noch nie erlebt. Es ist anzunehmen, daß Re-
> quests des Swap-Pagers mit höchster Priorität behandelt
> werden, allein schon um Deadlocks zu vermeiden.
Wäre mal eine Überprüfung wert, macht aber wenig Sinn mit hoher
Prio zu arbeiten, falls man vorsorglich auslagert.
In der Meldung steht ja leider nicht mal ob es ein Schreib- oder
Lesezugriff war.
> > Sehr ärglich ist das im mit swap auf NFS, wo es diese Meldungen
> > bereits gibt, wenn man nur mal den Server rebootet.
>
> Das stimmt.
>
> > Was ich bis jetzt nur nicht weiß ist, ob das als Fehler oder Warnung
> > behandelt wird.
>
> Nach meiner Erfahrung hängen die betreffenden Prozesse nur
> und werden nicht etwa gekillt (wie es etwa bei Speicher-
> mangel gemacht wird) -- würde ja auch nichts nützen.
> Insofern ist es aus Sicht des Swap-Pagers »nur« eine War-
> nung.
In Anbetracht, dass ich hier ein paar Maschinen habe, die beim
reboot des NFS Servers mit einem Panic aussteigen bin ich da sehr
ein wenig Sketisch.
Der Panic ist sicherlich ein Bug - muss das mal mit einer aktuellen
OS Version überprüfen, aber es fällt mir schwer zu glauben, das so
ein Bug existieren kann, wenn der betroffene Prozess einfach nur
solange blockiert wird.
Letzlich weiß ich es aber nicht.
-- B.Walter BWCT http://www.bwct.de bernd(at)bwct.de info(at)bwct.de To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org with "unsubscribe de-bsd-questions" in the body of the messageReceived on Wed 25 May 2005 - 15:45:10 CEST