Re: Cluster wie Raid mit verteilten CPU-Ressourcen

From: Nils Beyer <NilsBeyer(at)web.de>
Date: Sun, 22 Jun 2003 01:24:07 +0200

Hallo Oliver,

"Oliver Fromme" <olli(at)secnetix.de> schrieb:
> Nils Beyer <NilsBeyer(at)web.de> wrote:
>> Aber ich möchte auch nicht, dass Du
>> nachher Ärger mit Deiner Firma kriegst, weil Du hier
>> Profi-Wissen für Lau rausgibst.
>
> Meine Chefs wissen das und lesen teilweise selbst hier mit.
> Die meisten Leute hier, denen ich Tips gebe, sind ohnehin
> Privatmenschen, die die Dienste einer Firma eher nicht in
> Anspruch nehmen würden. Darüberhinaus macht Secnetix noch
> viel mehr als Support per E-Mail, insofern sind meine paar
> Tips hier nichts, was die Firma in den Ruin treiben könnte.
> ;-)

Ok. ;-)))

>> Uff, *grübel*,
>> - synchrones Dateisystem bei beiden Rechnern (halt wie Raid)
>> - gemeinsames Betreiben und Rechnen von Anwendungen/Daemons
>
> Ja, das sagtest Du schon. Meine Frage zielte aber eher
> darauf ab, was Du _erreichen_ möchtest. Deine Aufzählung
> dagegen beschreibt schon Lösungsansätze (die für die zu
> erreichenden Ziele nicht zwangsläufig die besten sein
> müssen).

Ok, ich versuch's noch mal (ich kann wirklich nicht so gut
erklären, ist irgendwie angeboren).

Ich möchte zwei Rechner so zusammenbasteln, dass sie sich
versch. Dienste rechnerisch teilen. Die beiden Rechner
sollen für ca. 20 Laptops die Internet-Versorgung über
ISDN, Sat und DSL ermöglichen, ferner DHCP spielen und
ein ftp- und http-Server darstellen. Für die Außenwelt
sollen die beiden Rechner als Einer aussehen. Fällt
ein Rechner aus, soll man davon nichts merken, bis der
defekte Rechner wieder instandgesetzt und eingebaut
wurde.

>>> [...]
>>> Was genau sind die Anforderungen an die Verfügbarkeit, sprich,
>>> wie hoch darf eine Ausfallzeit maximal sein?
>>> Wie lange darf eine Recovery dauern?
>>
>> Ausfallzeit inkl. Recovery kann ruhig bis zu 1 Tag dauern.
>
> Oh, das ist viel. Die Dienste dürfen tatsächlich für einen
> ganzen Tag ausfallen? Dann wäre eine echte Cluster-Lösung
> der totale Overkill.

;-)
Die Dienste dürfen nicht für einen ganzen Tag ausfallen, dafür
soll doch der intakte Rechner zuständig sein und die Dienste
weiterführen bis der defekt wieder da ist.

>>> und wieviel kann für zusätzliche Hardware ausgegeben werden?
>>
>> Leider nix.
>
> Gut, das schränkt die Möglichkeiten schonmal deutlich ein.
> Ich gehe aber davon aus, daß Ihr ein Backup-System habt (es
> fehlte in Deiner Aufzählung).

In der Örtlichkeit [;-)], wo der Cluster+Laptops untergebracht
sind, nicht.

Es handelt sich aber nicht um firmentragende Daten.

> In diesem Fall und unter den genannten Voraussetzungen ist
> vielleicht ein einfaches Mischsystem mit Fail-Over das
> beste. Das erfordert keine zusätzliche Hardware und ist
> recht einfach aufzusetzen (ohne spezielle Kenntnisse).
> Dazu konfigurierst Du den ersten Rechner als NFS-Server,
> der alle Daten hält. Diese werden vom anderen Rechner
> gemountet. Somit ist sichergestellt, daß beide auf der
> identischen Datenbasis arbeiten. Zusätzlich synchroni-
> siert der zweite Rechner regelmäßig alle Daten auf seine
> lokale Platte, z.B. einmal pro Stunde. Falls dann der
> erste Rechner ausfällt, schwenkst Du auf dem zweiten ein-
> fach von NFS auf die lokale Platte um, und alles läuft
> weiter, wobei maximal die Daten der letzten Stunde ver-
> lorengegangen sind. Also Quasi Hot-Standby. Die Ausfall-
> zeit wäre dabei maximal ein paar Minuten. Man könnte dies
> auch mit Skripten automatisieren, aber da muß man schon
> ein bißchen aufpassen.

Danke für diesen Vorschlag. Das hört sich auch nicht
schlecht an.

> Das würde die Punkte Replikation und Redundanz/HA bei Dir
> lösen. Fehlt noch Load-Balancing. Da solltest Du Dich
> erstmal fragen, ob Ihr das überhaupt braucht -- habt Ihr
> soviel Last, daß ein Rechner alleine es nicht bewältigen
> kann? Glaube ich eigentlich nicht.

;-))
.-------------------------------------------------------.
|Der Cluster ist wirklich nur ein Experiment. Nix, womit|
|wir Geld verdienen. |
|Hat also eher Privat-Mann-Status. |
'-------------------------------------------------------'

Vielleicht ist wirklich ein "Notfall-Einsatzserver" ein-
facher und passender für dieses Experiment. Also, so in
der Art:

Fall 1 (alles i.O.):
--------------------
NotPC: "Hallo, HauptServer, lebst Du noch?" - "Hau' ab,
Du störst!" - "Ok, ich frag' aber in einer Minute nochmal."

Fall 2 (Server hat Probleme):
-----------------------------
NotPC: "Hallo, HauptServer, lebst Du noch?" - "Stööhn,
ächz" - "Warte, ich mach' für Dich weiter. Deine Stifte und
Vorlagen habe ich ja auch. Schick' mir mal eben schnell Deine
Daten, wo Du grade bist. Dann geh' nach Hause und leg' Dich
ins Bett. Morgen gebe ich Dir dann meine weiter gemachte
Arbeit und Du kannst dann wieder weitermachen."
;-))

> Für ein einfaches Load-Balancing würde es genügen, die
> Dienste auf beiden Rechnern zu konfigurieren, und dann
> z.B. per DNS Round-Robin zu verteilen. Oder einfach
> nach Diensten zu verteilen: Der eine macht Samba und NFS,
> der andere Apache und FTP. Das sollte man natürlich so
> aufteilen, daß die Last möglichst gleichmäßig verteilt ist.
> Und natürlich sollte man auf beiden Kisten alle Dienste
> konfigurieren, um bei einem Ausfall sofort umschwenken zu
> können.

Auch nicht schlecht. Vor allem, Alles wird mit Bordmitteln
gemacht. Wenn ich Lebens-Pings mit Skripten mache, wie
stelle ich fest, ob der eine Rechner ausgefallen ist? Mit
'ps -ax | grep <wassolllaufen>' und/oder 'ping'?

>> [Cold-Standby]
>> So war es eigentlich auch vorher gemacht worden. Der zweite
>> Rechner war wirklich nur ein Ersatzrechner, falls der erste
>> ausfällt. Aber jetzt haben wir uns gedacht, wofür soll der
>> zweite vollstauben ohne zu rechnen. ;-)
>
> Das ist aber kein technisches Argument. ;-)

Aber ein verständliches. ;-))

>>> Alle genannten Maßnahmen entbinden selbstverständlich nicht
>>> von der Pflicht, regelmäßig Backups anzufertigen.
>>
>> Ok.
>> ;-))
>
> Ich interpretiere das mal als »Ja, tun wir«.

Ähh, *g*, nee. Nicht dafür, wofür der Cluster eingesetzt wird.

> Ein totaler Datenverlust kann über das Schicksal einer Fir-
> ma entscheiden. Ein verläßliches Backup ist daher wichti-
> ger als alles andere. Ein RAID, Cluster oder was auch im-
> mer hilft z.B. nicht, wenn der Blitz einschlägt oder sonst
> eine Katastrophe passiert (auch menschliches Versagen kann
> dazugehören: wenn man die falsche Datei killt, ist die
> auch auf dem Mirror weg). Und das Backup sollte man nicht
> im gleichen Raum lagern, in dem sich die Rechner befinden.
> Es ist sehr bitter, wenn man den Wert eines Backups erst
> durch negative Erfahrungen schätzen lernen muß -- wenn es
> zu spät ist.

Das ist ein sehr schöner Absatz von Dir. Vielen Dank.
Backupen tun wir ja für die wichtigen Sachen. :-)

Viele Grüße,
Nils

To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Sun 22 Jun 2003 - 01:50:58 CEST

search this site