Re: Umlautproblem, nicht trivial

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Mon, 19 Mar 2012 15:49:39 +0100 (CET)

Polytropon <freebsd(at)edvax.de> wrote:
> Oliver Fromme wrote:
> > Das eigentliche Problem ist, dass sich offenbar viele
> > Programme, die von Linuxern stammen, einen Teufel um die
> > Locale-Einstellungen des Betriebssystems scheren und
> > stattdessen ihr eigenes Süppchen kochen.
>
> Zumeist scheint das verwendet zu werden, was die jeweilige
> Desktop-Umgebung als "Standard" definiert, wobei es diese
> Desktop-Umgebung ist, die die Einstellungen vorgibt (und
> nicht etwa die des Betriebssystems honoriert).

Ja, das fällt ebenfalls unter »Programme, die von Linuxern
stammen«. Das mag wie ein blödes Vorurteil klingen, aber
man kann das ganz klar beobachten, dass es bei Software,
die aus der Linux-Ecke kommt, mit Portabilität und Nutzung
existierender Standard-APIs nicht weit her ist.

> > Einfache Lösung: Bei mir gibt es keine Umlaute in Datei-
> > namen. Wenn ich mal von irgendjemandem (meistens sind
> > das Windowser) Dateien mit Umlauten oder anderen nicht-
> > ASCII-Zeichen erhalte, lasse ich da als erstes ein
> > Skript drüberlaufen, das die geeignet ersetzt.
>
> Diese Lösung beseitigt die Ursache, nich aber das Problem. :-)

Doch, für mich ist dadurch das Problem ganz klar beseitigt. :)

> Natürlich hat man es bei "unseren Umlauten" (ö, ä, ü und ß)
> sehr einfach mit der Ersetzung, wenn allerdings dänische,
> schwedische oder gar chinesische Sonderzeichen dazukommen,
> wird es schwierig.

Ich hatte durchaus schon Dateien mit anderen diakritischen
Zeichen und Ligaturen im Namen (ç, æ, ï, ñ, ...). Mein
Skript lässt die diakritischen Zeichen einfach weg bzw.
löst die Ligaturen auf. Das mag nicht in jeder denkbaren
Sprache die korrekte Umschreibung sein, aber für meine
Zwecke genügt das vollkommen.

> Prinzipiell aber folge ich seit meinem UNIX-Einstieg
> Deinem Beispiel. Keine Umlaute, keine Leerzeichen. Niemals.
> Und wenn man das von Anfang an durchexerziert, eckt man
> programm- und skriptseitig nicht an.

Welches Problem hast Du denn mit Leerzeichen? Die haben
doch immer den Code 32, egal ob ASCI, ISO-8859 oder UTF.
Ich benutze durchaus Leerzeichen in Dateinamen. Ich finde,
Unterstriche in längeren Dateinamen sehen schrecklich aus,
und bestimmte wortorientierte Edit-Funktionen der Shell
funktionieren dann nicht mehr so gut.

Bei mir sind im prinzip alle ASCII-Zeichen von 32 bis 126
in Dateinamen "erlaubt", abgesehen natürlich vom Schräg-
strich, der als Verzeichnistrenner fungiert.

Eine Ausnahme mache ich (gezwungenermaßen) in Bereichen,
die per Samba an Windows-Rechner exportiert werden, weil
Windows bestimmte Zeichen (leider!) nicht mag, wie etwa
den Doppelpunkt. Finde ich ziemlich behämmert, aber ich
kann's leider nicht ändern.

Gruß
   Olli

-- 
Oliver Fromme, secnetix GmbH & Co. KG, Marktplatz 29, 85567 Grafing b. M.
Handelsregister: Registergericht Muenchen, HRA 74606,  Geschäftsfuehrung:
secnetix Verwaltungsgesellsch. mbH, Handelsregister: Registergericht Mün-
chen, HRB 125758,  Geschäftsführer: Maik Bachmann, Olaf Erb, Ralf Gebhart
FreeBSD-Dienstleistungen, -Produkte und mehr:  http://www.secnetix.de/bsd
"In My Egoistical Opinion, most people's C programs should be indented
six feet downward and covered with dirt."
        -- Blair P. Houghton
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 19 Mar 2012 - 15:50:03 CET

search this site