Re: LANG und UTF-8

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Mon, 5 Dec 2005 14:06:24 +0100 (CET)

Rocco Rutte <pdmef(at)cs.tu-berlin.de> wrote:
> * Oliver Fromme [05-12-05 08:55:23 +0100] wrote:
> > Daß es Leute gibt, für die Unicode oder ISO10646 eine Er-
> > leichterung oder gar notwendig ist, stelle ich keineswegs
> > in Frage. Aber für mich als Englisch- und Deutschschrei-
> > benden ist es -- beim aktuellen Stand der verfügbaren Soft-
> > ware -- einfach nur ein überflüssiges Ärgernis.
>
> Aus deinem Blickwinkel würde ich dir da auch Recht geben. Aber IMHO hat
> UTF-8 das Potential, endlich einen Haufen Probleme ordentlich zu lösen
> aber es gibt leider wohl zu viele Leute mit dw. den
> für mich nicht nachvollziehbaren Zwang zu Rückwärtskompatibilität.

Ich finde es erstaunlich, daß Du das nicht nachvollziehen
kannst. Wie schaffst Du es, die ganze Software zu vermei-
den, die nicht mit Multibyte-Zeichen zurechtkommt?

Es mag wohl gehen, daß man UTF-8 nur auf ganz bestimmte An-
wendungen begrenzt (z.B. auf die Textverarbeitung). Aber
UTF-8 systemweit global verwenden zu wollen, ist nach mei-
ner Erfahrung zur Zeit schlicht unmöglich. (Und da ich
persönlich UTF-8 nicht brauche, ziehe ich es natürlich vor,
es nirgends zu verwenden, um den Aufwand und die Probleme
damit zu vermeiden. Meine Zeit ist mir zu schade dafür.)

> Wenn sich nämlich "alle" endlich mal auf genau 1 Standard für die
> Kodierung einigen könnten,

Na, das klappt sowieso nicht. UTF-8 ist ja auch nur für
westeuropäische Sprachen so richtig gut geeignet. Unsere
Freunde in Ostasien werden wohl eher UTF-16 oder eine an-
dere Kodierung von ISO10646 verwenden.

Davon abgesehen wird auch ASCII nicht aussterben, und auf
absehbare Zeit auch die ISO8559-Familie nicht. (Wir können
schon froh sein, daß ISO646-DE a.k.a. DIN66003 heutzutage
nicht mehr verwendet wird, außer bei einigen elektroni-
schen Schreibmaschinen. Unter DOS und frühen Windows-Ver-
sionen gab's sogar eine Codepage dafür.)

Die Problematik, die mit der Umstellung einhergeht, ist na-
türlich (leider) nicht ganz vermeidbar. Jetzt sind halt
erstmal die Programmierer gefragt, um alle gängigen Pro-
gramme Unicode-Fit zu machen. Es wird natürlich immer eine
gewisse Anzahl »Altlasten« geben -- Ich kenne eine Vielzahl
Firmen, die eine eingekaufte oder selbstgestrickte Software
einsetzen, bei der niemand mehr Anpassungen machen kann
oder will -- »Unicode?!? Hör bloß auf, wir sind schon froh,
daß das Zeug die Jahrtausendwende überstanden hat.«

In gewisser Weise ist die Situation mit der von IPv6 ver-
gleichbar. Ein kompletter Umstieg von IPv4 auf IPv6 ist
zur Zeit noch nicht realisierbar (außer in sehr begrenzten
Testumgebungen), und es gibt zahlreiche »Altlasten«, die
noch ein Weilchen mit IPv4 laufen müssen.

> dann wäre allen geholfen und man könnte
> endlich mal die ganzen Würgarounds abschaffen (die ganze
> Spezialbehandlung für Mail zum Beispiel,

Hmm, was für Spezialbehandlung von Mails meinst Du?

Übrigens habe ich keine Probleme damit -- weder technische
noch mentale -- wenn jemand UTF-8 in Mails oder Postings
verwendet, sofern alles per MIME korrekt deklariert ist.
Das wird bei mir dann halt automatisch nach ISO8859-1 oder
-15 konvertiert (da ich keine Displays besitze, die native
UTF-8 können).

> was evtl. mit lokalisierten
> Toplevel-Domains noch viel schlimmer werden wird).

Das kommt drauf an, wie gewisse Komitees das designen.
Wenn es so gemacht wird wie bei den Second-Level-Domains
(IDNA mit Punycode oder etwas ähnliches), sehe ich da kein
grundsätzliches Problem. Zumindest kein zusätzliches.
(Wohlgemerkt, IDNA ist keine perfekte Lösung, erfüllt aber
innerhalb seiner Parameter seinen Zweck.)

> > PS: Achja, wie hieß doch gleich der Consolen-Font, der
> > UTF-8 enthält? Finde ich in /usr/share/syscons/fonts grade
> > irgendwie nicht ...
>
> ...was IMHO ziemlich schade ist.

Die Ironie meiner Frage ist wohl an Dir vorbeigegangen (da
sieht man mal wieder, daß man doch ab und zu einen Smiley
setzen sollte). :-)

Daß es technisch nicht möglich ist, einen UTF-8-Font für
den syscons-Textmodus zu erstellen, wurde in diesem Thread
ja bereits erwähnt.

Allerdings wäre es theoretisch möglich, syscons Multibyte-
fähig zu machen und die Zeichen auf einen existierenden
ISO8859-Font zu mappen, und auf diese Weise per UTF-8 o.ä.
ein Unicode-Subset zu supporten, das mit dem jeweiligen
ISO8859-Font übereinstimmt. Aber das ist wieder eine ganz
andere Sache.

Gruß
Olli

-- 
Oliver Fromme,  secnetix GmbH & Co. KG, Marktplatz 29, 85567 Grafing
Dienstleistungen mit Schwerpunkt FreeBSD: http://www.secnetix.de/bsd
Any opinions expressed in this message may be personal to the author
and may not necessarily reflect the opinions of secnetix in any way.
"Perl will consistently give you what you want,
unless what you want is consistency."
        -- Larry Wall
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message

Received on Mon 05 Dec 2005 - 14:08:07 CET