Re: Page Fault auf 6.1

From: Bernd Walter <ticso(at)cicely12.cicely.de>
Date: Tue, 24 Apr 2007 21:03:56 +0200

On Tue, Apr 24, 2007 at 08:04:43PM +0200, Nicola Tiling wrote:
>
> > In erster Linie mal die Zeile vom besagten sshd-Prozess.
> > Dann noch ein allgemeiner Blick nach Auffälligkeiten, z.B. ob
> > viele Prozesse auf das gleiche Ereigniss (MWCHAN-Spalte)
> > warten, oder viele Prozesse nur noch minimale Menge
> > physikalisches RAM (RSS-Spalte) belegen.
>
> Ja. Der sshd (PID 39251) sieht merkwürdig aus. Ansonsten gibt es jede Menge
> exim Prozesse die 0 Ram verbrauchen. Außerdem einen Zombie der wohl aus
> einem Cronjob kommt.

Ich habe das Gefühl, dass die Prozesse alle geswapped sind, weil die
Maschine unter akutem RAM Mangel gelitten hat.
Ich habe immer ein ungutes Gefühl dabei, wenn Prozesse geswapped sind,
da ich bereits zu 4.x Zeiten etliche Bugs dabei gesehen habe.
Seit dem baue ich sehr oft die Kernel mit NO_SWAPPING.
Zur Erklärung, swappen bedeutet, dass der komplette Prozess ausgelagert
ist und nur noch ein Eintrag in der Prozesstabelle vorhanden ist.
Im Gegensatz zu pagen, was nur einzelne Speicherseiten auslagert.
Das könnte vom Symptom her durchaus passen, dass hier ein Bug vorhanden
ist.
Du hast in dem Fall 2 Probleme - eines kannst du mit NO-SWAPPING umgehen,
das andere ist der RAM-Mangel, der meist nicht durch die physikalische
Ausstattung des Rechners, sondern durch eine ungewöhnlich hohe
Belastung begründed ist, die es zu beseitigen gilt.
Wenn meine Theorie stimmt kannst du evtl. mit der Prozessliste einen
Verdacht über den Auslöser bekommen.
Du erwähntest ja bereits Exim mit hoher Häufigkeit.
Kann gut sein, dass du die Anzahl der Exim-Prozesse stärker limitieren
musst - keine Ahnung wie das damit geht - ich benutze Sendmail.
Sonst reicht vermutlich nur eine entsprechend hohe Anzahl gleichzeitiger
SMTP Zugriffe, um die Maschine derart zu belasten.
Der Panic sollte dann zwar nicht passieren, aber die Maschine ist mit
Sicherheit ohnehin nicht mehr Reaktionsfreudig.
Das erklärt auch den Zombie - der Mutterprozess konnte sich wohl nicht
darum kümmern, weil er noch nicht gelaufen ist.

-- 
B.Walter                http://www.bwct.de      http://www.fizon.de
bernd(at)bwct.de           info(at)bwct.de            support(at)fizon.de
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Tue 24 Apr 2007 - 21:05:43 CEST

search this site