Re: LANG und UTF-8

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Mon, 5 Dec 2005 17:31:05 +0100 (CET)

Oliver Fromme <olli(at)lurza.secnetix.de> wrote:
> Das Problem ist allerdings noch viel grundlegender, da die
> Namen ja im Dateisystem gespeichert werden müssen. Und da
> UFS keinen direkten Unicode-Support hat (im Gegensatz zum
> NTFS und ISO9660), bleibt einem da nicht viel anderes üb-
> rig, als auf ISO8859 auszuweichen. Dasselbe gilt für die
> entsprechenden Tools (dump/restore usw.). UTF-8 ist als
> Kodierung für ein herkömmliches UFS übrigens ungeeignet, da
> es passieren könnte, daß eine Multibyte-Sequenz das Byte
> 0x2f enthält, was der UFS-Code als Verzeichnistrenner in-
> terpretieren würde.

Da muß ich mich korrigieren (sorry). Der Fall mit dem 0x2f
kann nicht vorkommen, da alle UTF8-Zeichen ab dem zweiten
Byte im Interval 0x80-0xbf ligen.

Das ändert allerdings nichts am grundlegenden Problem. Und
außerdem wäre UTF8 als Speicherformat für ein Dateisystem eh
kompletter Blödsinn; da würde man stattdessen gleich direkt
32bit-Unicode nehmen.

Gruß
   Olli

-- 
Oliver Fromme,  secnetix GmbH & Co. KG, Marktplatz 29, 85567 Grafing
Dienstleistungen mit Schwerpunkt FreeBSD: http://www.secnetix.de/bsd
Any opinions expressed in this message may be personal to the author
and may not necessarily reflect the opinions of secnetix in any way.
"I have stopped reading Stephen King novels.
Now I just read C code instead."
        -- Richard A. O'Keefe
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 05 Dec 2005 - 17:37:06 CET

search this site