Hallo zusammen,
ich experimentiere gerade mit Unicode und damit auch den ganzen
Lokalisierungseinstellungen herum. Mich hat gerade eine Sache verwundert:
1. Sortierung mit de_DE.ISO8859-1 funktioniert so, wie für
deutsche Wörter erwartet:
% LC_COLLATE=de_DE.ISO8859-1 sort test
Bär
Bar
Bargeld
Bußgeld
Bus
Butter
2. dasselbe mit de_DE.UTF-8 führt zu folgendem Ergebnis:
% LC_COLLATE=de_DE.UTF-8 sort test
Bar
Bargeld
Bus
Butter
Bußgeld
Bär
Hier werden also die deutschen Sonderzeichen nicht richtig einsortiert.
Technisch gesehen ist das kein Wunder, denn die mit LC_COLLATE definierte
Ordnung für de_DE.UTF-8 kann mit Umlauten vermutlich nichts anfangen:
% ls -l /usr/share/locale/de_DE.UTF-8/LC_COLLATE
lrwxr-xr-x 1 root wheel 28 Aug 24 2008
/usr/share/locale/de_DE.UTF-8/LC_COLLATE -> ../la_LN.US-ASCII/LC_COLLATE
Ich bin nun weniger von der Funktionsweise der ganzen Locale-Geschichten
überrascht, allerdings habe ich erwartet, dass das Setzen von de_DE.UTF-8
auch eine Ordnung benutzt wird, die im Deutschen üblich ist, auch wenn es
davon mehrere gibt. Man hätte ja stattdessen einen symbolischen Link auf
../de_DE.ISO8859-1/LC_COLLATE setzen können.
Hat das einen Hintergrund, ist das irgendwie standardisiertes Verhalten?
Vielleicht kann mich da jemand erhellen.
-- Gruß, Dominik To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org with "unsubscribe de-bsd-questions" in the body of the messageReceived on Fri 03 Apr 2009 - 12:38:53 CEST