Sortierung mit de_DE.UTF-8

From: Dominik Brettnacher <dominik(at)brettnacher.org>
Date: Fri, 3 Apr 2009 12:38:50 +0200 (CEST)

Hallo zusammen,

ich experimentiere gerade mit Unicode und damit auch den ganzen
Lokalisierungseinstellungen herum. Mich hat gerade eine Sache verwundert:

1. Sortierung mit de_DE.ISO8859-1 funktioniert so, wie für
deutsche Wörter erwartet:

% LC_COLLATE=de_DE.ISO8859-1 sort test
Bär
Bar
Bargeld
Bußgeld
Bus
Butter

2. dasselbe mit de_DE.UTF-8 führt zu folgendem Ergebnis:

% LC_COLLATE=de_DE.UTF-8 sort test
Bar
Bargeld
Bus
Butter
Bußgeld
Bär

Hier werden also die deutschen Sonderzeichen nicht richtig einsortiert.
Technisch gesehen ist das kein Wunder, denn die mit LC_COLLATE definierte
Ordnung für de_DE.UTF-8 kann mit Umlauten vermutlich nichts anfangen:

% ls -l /usr/share/locale/de_DE.UTF-8/LC_COLLATE
lrwxr-xr-x 1 root wheel 28 Aug 24 2008
/usr/share/locale/de_DE.UTF-8/LC_COLLATE -> ../la_LN.US-ASCII/LC_COLLATE

Ich bin nun weniger von der Funktionsweise der ganzen Locale-Geschichten
überrascht, allerdings habe ich erwartet, dass das Setzen von de_DE.UTF-8
auch eine Ordnung benutzt wird, die im Deutschen üblich ist, auch wenn es
davon mehrere gibt. Man hätte ja stattdessen einen symbolischen Link auf
../de_DE.ISO8859-1/LC_COLLATE setzen können.

Hat das einen Hintergrund, ist das irgendwie standardisiertes Verhalten?
Vielleicht kann mich da jemand erhellen.

-- 
Gruß,
Dominik
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Fri 03 Apr 2009 - 12:38:53 CEST

search this site