Re: LANG und UTF-8

From: Bernd Walter <ticso(at)cicely12.cicely.de>
Date: Mon, 5 Dec 2005 15:38:05 +0100

On Mon, Dec 05, 2005 at 02:11:30PM +0000, Rocco Rutte wrote:
> Hi,
>
> * Oliver Fromme [05-12-05 14:06:24 +0100] wrote:
> >Rocco Rutte <pdmef(at)cs.tu-berlin.de> wrote:
> >> * Oliver Fromme [05-12-05 08:55:23 +0100] wrote:
>
> >Wie schaffst Du es, die ganze Software zu vermei-
> >den, die nicht mit Multibyte-Zeichen zurechtkommt?
>
> Ich brauche nur Mail+News+Web, Compiler, Editor und TeX. Und die können es
> alle. Gut, zsh kann es nicht aber dort brauche ich es auch extrem
> selten.
>
> >Die Problematik, die mit der Umstellung einhergeht, ist na-
> >türlich (leider) nicht ganz vermeidbar. Jetzt sind halt
> >erstmal die Programmierer gefragt, um alle gängigen Pro-
> >gramme Unicode-Fit zu machen.
>
> ACK. Aber meine Kritik ist unter dem Strich, dass man genau diese
> Anpassung, weil sie ohnehin notwendig ist, nutzen könnte, um irgendwann
> den Schalter auf "den" Standard umzulegen. Jetzt sieht es eher so aus,
> als ob man bei dem Zoo an Kodierungen bleiben will und statt auf einen
> einheitlichen Standard zu migrieren lieber Unicode-Support einbaut.

Du glaubst doch nicht ernsthaft, dass du die alten Kodierungen jemals
los wirst?
Wir reden hier von einer _zusätzlichen_ Kodierung!
Eine Anwendung muss auch in 20 Jahren noch in der Lage sein mit
heutigen Terminals zurecht zu kommen.

> >Es wird natürlich immer eine
> >gewisse Anzahl »Altlasten« geben -- Ich kenne eine Vielzahl
> >Firmen, die eine eingekaufte oder selbstgestrickte Software
> >einsetzen, bei der niemand mehr Anpassungen machen kann
> >oder will -- »Unicode?!? Hör bloß auf, wir sind schon froh,
> >daß das Zeug die Jahrtausendwende überstanden hat.«
>
> Das könnte man bei Neuentwicklungen berücksichtigen.

Ja sicher, und so lange benutzt man die kleinste gemeinsamme Variante.

> >> dann wäre allen geholfen und man könnte
> >> endlich mal die ganzen Würgarounds abschaffen (die ganze
> >> Spezialbehandlung für Mail zum Beispiel,
>
> >Hmm, was für Spezialbehandlung von Mails meinst Du?
>
> Alle Kodierungsmechanismen. Die bekämpfen nicht das Problem sondern nur
> die Symptome. Ich habe zum Beispiel ein Perlskript als Mailfilter im
> Einsatz, was Subjecttags entfernt; das geht nicht mit sed(1), weil
> kaputte Clients auch ASCII-Worte in das Encoded Word einbauen. Hätte man
> nur einen Kodierstandard, müsste man nicht MIME-kodieren und ich könnte
> sed(1) nehmen. Für andere Filter wird es aufwendiger und langsamer.

Auch auf die Gefahr hin mich zu wiederholen: Es ist eine _zusätzliche_
Kodierung, die bisherigen wird man nicht mehr los.

> >Übrigens habe ich keine Probleme damit -- weder technische
> >noch mentale -- wenn jemand UTF-8 in Mails oder Postings
> >verwendet, sofern alles per MIME korrekt deklariert ist.

Eben: ungeachtet dessen - mein Terminal muss nicht UTF8 können, damit
ich die 8859-1 kompatiblen Zeichen einer Mail lesen kann.

> Sicher. Ich habe ja auch nicht gesagt, dass man es technisch nicht durch
> Standards verkomplizieren und die dann sauber implementieren kann. Es
> kann IMHO aber auch keine Dauerlösung sein.

Es _ist_ eine Dauerlösung.
Die Technik von heute muss aleine per Defintition vom Finanzamt länger
als ein Jahr in Betrieb bleiben.
Und ich bin mir ziemlich sicher, dass ich in 20 Jahren noch Nadel-
drucker in Betrieb habe, die kein UTF8 können.
Und ich bin mir auch sicher, dass auch in 20 Jahren noch Mails mit
was anderem als UTF8 hier ankommen.

> >Allerdings wäre es theoretisch möglich, syscons Multibyte-
> >fähig zu machen und die Zeichen auf einen existierenden
> >ISO8859-Font zu mappen, und auf diese Weise per UTF-8 o.ä.
> >ein Unicode-Subset zu supporten, das mit dem jeweiligen
> >ISO8859-Font übereinstimmt. Aber das ist wieder eine ganz
> >andere Sache.
>
> Darf ich raten, dass die Motivation dafür ziemlich gering ist? Weil es
> eh keiner wirklich haben will?

Sorry, bislang konnte mir keiner den Sinn erklären.
Ohne Sinn kann man kaum eine echte Motivation erwarten.
Eine Anwendung muss sowieso mit non-UTF8 Terminals zurecht kommen.
Wenn syscons UTF8 könnte würde es nicht mehr darstellen können als
bisher.
Letzlich verschiebt man nur die Kodierung von der Anwendung ins
Terminal, wobei es in der Anwendung aber aus Kompatibilität immer
noch vorhanden sein muss.

-- 
B.Walter                   BWCT                http://www.bwct.de
bernd(at)bwct.de                                  info(at)bwct.de
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 05 Dec 2005 - 15:43:10 CET

search this site