Re: LANG und UTF-8

From: Rocco Rutte <pdmef(at)cs.tu-berlin.de>
Date: Mon, 5 Dec 2005 14:11:30 +0000

Hi,

* Oliver Fromme [05-12-05 14:06:24 +0100] wrote:
>Rocco Rutte <pdmef(at)cs.tu-berlin.de> wrote:
> > * Oliver Fromme [05-12-05 08:55:23 +0100] wrote:

>Wie schaffst Du es, die ganze Software zu vermei-
>den, die nicht mit Multibyte-Zeichen zurechtkommt?

Ich brauche nur Mail+News+Web, Compiler, Editor und TeX. Und die können es
alle. Gut, zsh kann es nicht aber dort brauche ich es auch extrem
selten.

>Die Problematik, die mit der Umstellung einhergeht, ist na-
>türlich (leider) nicht ganz vermeidbar. Jetzt sind halt
>erstmal die Programmierer gefragt, um alle gängigen Pro-
>gramme Unicode-Fit zu machen.

ACK. Aber meine Kritik ist unter dem Strich, dass man genau diese
Anpassung, weil sie ohnehin notwendig ist, nutzen könnte, um irgendwann
den Schalter auf "den" Standard umzulegen. Jetzt sieht es eher so aus,
als ob man bei dem Zoo an Kodierungen bleiben will und statt auf einen
einheitlichen Standard zu migrieren lieber Unicode-Support einbaut.

>Es wird natürlich immer eine
>gewisse Anzahl »Altlasten« geben -- Ich kenne eine Vielzahl
>Firmen, die eine eingekaufte oder selbstgestrickte Software
>einsetzen, bei der niemand mehr Anpassungen machen kann
>oder will -- »Unicode?!? Hör bloß auf, wir sind schon froh,
>daß das Zeug die Jahrtausendwende überstanden hat.«

Das könnte man bei Neuentwicklungen berücksichtigen.

> > dann wäre allen geholfen und man könnte
> > endlich mal die ganzen Würgarounds abschaffen (die ganze
> > Spezialbehandlung für Mail zum Beispiel,

>Hmm, was für Spezialbehandlung von Mails meinst Du?

Alle Kodierungsmechanismen. Die bekämpfen nicht das Problem sondern nur
die Symptome. Ich habe zum Beispiel ein Perlskript als Mailfilter im
Einsatz, was Subjecttags entfernt; das geht nicht mit sed(1), weil
kaputte Clients auch ASCII-Worte in das Encoded Word einbauen. Hätte man
nur einen Kodierstandard, müsste man nicht MIME-kodieren und ich könnte
sed(1) nehmen. Für andere Filter wird es aufwendiger und langsamer.

>Übrigens habe ich keine Probleme damit -- weder technische
>noch mentale -- wenn jemand UTF-8 in Mails oder Postings
>verwendet, sofern alles per MIME korrekt deklariert ist.

Sicher. Ich habe ja auch nicht gesagt, dass man es technisch nicht durch
Standards verkomplizieren und die dann sauber implementieren kann. Es
kann IMHO aber auch keine Dauerlösung sein.

>Allerdings wäre es theoretisch möglich, syscons Multibyte-
>fähig zu machen und die Zeichen auf einen existierenden
>ISO8859-Font zu mappen, und auf diese Weise per UTF-8 o.ä.
>ein Unicode-Subset zu supporten, das mit dem jeweiligen
>ISO8859-Font übereinstimmt. Aber das ist wieder eine ganz
>andere Sache.

Darf ich raten, dass die Motivation dafür ziemlich gering ist? Weil es
eh keiner wirklich haben will?

bye, Rocco

-- 
:wq!
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message

Received on Mon 05 Dec 2005 - 15:12:56 CET