Re: LANG und UTF-8

From: Rocco Rutte <pdmef(at)cs.tu-berlin.de>
Date: Mon, 5 Dec 2005 16:38:36 +0000

Hi,

* Oliver Fromme [05-12-05 16:36:53 +0100] wrote:
>Rocco Rutte <pdmef(at)cs.tu-berlin.de> wrote:
> > * Oliver Fromme [05-12-05 14:06:24 +0100] wrote:
> > > Rocco Rutte <pdmef(at)cs.tu-berlin.de> wrote:
> > > > * Oliver Fromme [05-12-05 08:55:23 +0100] wrote:

>Solange nicht _alle_ Programme, die ich brauche, damit
>klarkommen, werde ich das gewiß nicht tun. Damit würde
>ich mir ja nur in den Fuß schießen. Das sehe ich ganz
>pragmatisch.

Ich habe auch lange gebraucht, bis ich dafür eine Lösung hatte (d.h.
über Environment und unter X11 der Terminalstring die wichtigsten
Programme fernsteuern, d.h. mal iso-8859-1[5] und mal UTF-8, je nach
System). Aber es geht ja leider nicht anders.

> > Jetzt sieht es eher so aus,
> > als ob man bei dem Zoo an Kodierungen bleiben will und statt auf einen
> > einheitlichen Standard zu migrieren lieber Unicode-Support einbaut.

>Warum sollte man trotz Unicode-Support nicht nach wie vor
>ISO8859 unterstützen? Das frißt doch kein Brot. 7bit-
>ASCII-Support hat man sowieso weiterhin.

Es ist nicht sehr teuer, ich weiss, aber mich stört, dass es in der
Anwendung immer wieder aufs neue gemacht werden muss.

> > > > dann wäre allen geholfen und man könnte
> > > > endlich mal die ganzen Würgarounds abschaffen (die ganze
> > > > Spezialbehandlung für Mail zum Beispiel,

> > > Hmm, was für Spezialbehandlung von Mails meinst Du?

> > Alle Kodierungsmechanismen.

>Das wird alles von MIME abgedeckt; dazu braucht's keine
>Spezialbehandlung.

Der Teil von MIME, der Header-Kodierung vorschreibt ist für mich die
Spezialbehandlung, weil er überflüssig wäre, wenn alle die gleiche
Kodierung benutzen würden. Die ASCII-Abbildung der Mailstruktur ist
okay bzw. prinzipiell nicht anders lösbar.

> > Ich habe zum Beispiel ein Perlskript als Mailfilter im
> > Einsatz, was Subjecttags entfernt; das geht nicht mit sed(1), weil
> > kaputte Clients auch ASCII-Worte in das Encoded Word einbauen.

>Wie meinst Du das?

Zum Beispiel:

Subject: =?iso-8859-15?q?Re%3A%20%5Btag%5D%20foo?=

für 'Re: [tag] foo'. Das ganze dann noch in anderen Kodierungen als
8859-15 und/oder base64 statt quoted-printable mit und ohne Folding
(wenn es dumm läuft dann noch an den blödesten Stellen).

>3. Du willst nicht ernsthaft 8-bit-Zeichen uncodiert in
> Mail-Header reintun, nehme ich an. Siehe RFC2822.

Gäbe es nur eine Kodierung, wäre auch 2822 hinfällig.

Es gibt zum Beispiel ernsthaft Leute, die Mail gern nur über XML lösen
wollen. Da bräuchte man sich für Clients nicht mit solchen "Details" wie
Kodierungen auseinandersetzen. Ich habe zum Beispiel letzens einen Text
vom slrn-Maintainer gelesen, der nach jemandem sucht, der dort
iconv()-Support einbaut. Hätte man das nicht auf Anwendungsebene sondern
eine Ebene tiefer, wäre das kein Problem. Aber so müsste man dort das
Rad nochmal neu erfinden. Und für Programm XYZ nochmal.

>4. Wenn Du in einem Programm (egal ob Perl oder sonstwas)
> Emails parsen willst, dann muß Dein Programm auch MIME
> können. Mit sed(1) allein ist es nicht getan.

Um zum Beispiel die Tags rauszufiltern müsste es reichen, weil man nach
RfC2047 IIRC nur die notwendigen Sachen kodieren soll und nicht stur
alles (soll, leider nicht muss). Aber das sind alles solche
Seiteneffekte der Standardvielfalt.

bye, Rocco

-- 
:wq!
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message

Received on Mon 05 Dec 2005 - 17:42:48 CET