Re: Umlaute und andere Sonderzeichen in Dateinamen konvertieren?

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Mon, 17 Mar 2014 18:39:16 +0100 (CET)

Polytropon <freebsd(at)edvax.de> wrote:
> Ich denke mal, es geht um die Handhabbarkeit von Umlauten
> in Dateinamen unter _widrigen_ Umständen - das sind jene,
> mit denen man nicht rechnet, die man nicht bedenken mag
> und von Anfang an wegdiskutiert, nur daß sie einem in
> einem denkbar unwahrscheinlichen Fall doch plötzlich
> auf die Füße fallen. :-)

Das ist ausnahmsweise mal ein Fall, wo ich vollkommen nicht
Deiner Meinung bin. :-)

Dateinamen, die Umlaute enthalten, sind absolut problemlos
zu handhaben. Ich (und meine Kollegen) arbeiten täglich mit
sowas. Zu erzählen, es gäbe damit unter ominösen widrigen
Umständen Probleme, ist nichts weiter als FUD. Das Gegenteil
ist der Fall: Wer sich angewöhnt, statt »ä« immer »ae« zu
tippen, erzeugt damit Probleme, da dies eine verlustbehaftete
Konvertierung ist, die zu Zweideutigkeiten führen kann und
die nicht automatisiert rückgängig gemacht werden kann.

Jedes mir bekannte gängige Tool, das mit Dateinamen hantiert,
ist 8bit-clean. Ebenso jede übliche Shell. Wenn jemand
trotzdem ein Problem hat, ist das nichts weiter als eine
Folge einer Fehlkonfiguration, die behoben gehört (vermutlich
LC_CTYPE nicht oder falsch gesetzt, siehe Handbook). Das
ist maximal eine Ausrede, aber kein Argument.

Und selbst, wenn man den Umlaut nicht eingeben kann, weil
man eine unpassende Tastaturbelegung hat, dann tippt man halt
stattdessen "?" und überlässt es dem Globbing der Shell.
Oder man verwendet die Tab-Completion.

Die _einzige_ Stelle, wo man mit Umlauten aufpassen muss,
ist, wenn mehrere verschiedene Betriebssysteme die Dateien im
Zugriff haben, die unterschiedliche Kodierungen verwenden und
nicht automatisch dazwischen konvertiert wird. Aber wenn man
in so einer heterogenen Umgebung arbeitet, dann muss man sich
mit dieser Thematik ohnehin auseinandersetzen und es einmal
sinnvoll konfigurieren. Ich habe z.B. mein Samba daheim so
eingestellt, dass Umlaute, die per SMB von Windows-Kisten
kommen, funktionieren und auch korrekt wieder per NFS an die
anderen nicht-Windows-Rechner exportiert werden. Das ist
keine Zauberei.

> Man könnte auch sagen: Irgendwann hat mal jemand die
> englische Sprache und damit den 7-Bit-ASCII-Zeichensatz
> zum Maß aller Dinge in der Computerwelt bestimmt, also
> sollte man es nicht wagen, da "mehr" zu wollen. :-)

Nein. ASCII wurde vor genau 51 Jahren aus der Taufe gehoben,
und zwar von einem US-amerikanischen Komitee. Es war für
Telegraphie-Zwecke in den USA gedacht, nicht mehr und nicht
weniger.

Sich heute immer noch auf US-ASCII einschränken zu wollen,
ist ein sinnloser Anachronismus. Wir leben in Deutschland,
und zu unserer Sprache gehören Umlaute, und es gibt keinen
Grund, warum man gezwungen sein sollte, darauf zu verzichten.
Die Russen verwenden auch munter kyrillische Zeichen und
haben damit keine Probleme.

> [...] kannst Du Dir sicher vorstellen, was
> für Probleme man konstruieren kann, wenn man sich
> nur genug anstrengt. :-)

Eben, das ist doch alles arg konstruiert.

Mit der gleichen Argumentation könnte man sich auch auf den
Standpunkt stellen, dass man Groß- und Kleinschreibung in
Dateinamen vermeiden sollte. Das könnte sonst unter widrigen
Umständen auch mal zu Problemen führen. Schließlich gibt
es Dateisysteme, die nicht zwischen Groß- und Kleinbuchstaben
unterscheiden können, was zu Kollisionen führen kann. Und
am besten sollte man Dateinamen nicht länger als acht Zeichen
plus drei Zeichen Suffix machen. Das könnte sonst unter
widrigen Umständen ... Schließlich gibt es ... Genau.

> Bei Umlauten haben wir glücklicherweise die Situation,
> daß wir sie recht angenehm durch "Standardzeichen"
> umschreiben können (z. B. "ae" statt 'ä', "sz" statt
> 'ß' usw.),

Das nennst Du "recht angenehm"? Ich finde das furchtbar und
völlig inakzeptabel.

Übrigens, laut Duden wird "ß" mit "ss" umschrieben (nicht
"sz"), wenn es aus technischen Gründen erforderlich ist.
Früher war mal "sz" bei Zweideutigkeiten erlaubt, aber diese
Ausnahmeregelung wurde abgeschafft, seit "ß" in Eigennamen
auch als Großbuchstabe verwendet werden darf (R160 im Duden).

Gruß
   Olli

-- 
Oliver Fromme,  secnetix GmbH & Co. KG,  Marktplatz 29, 85567 Grafing
Handelsregister:  Amtsgericht Muenchen, HRA 74606, Geschäftsfuehrung:
secnetix Verwaltungsgesellsch. mbH, Handelsreg.: Amtsgericht München,
HRB 125758, Geschäftsführer:  Maik Bachmann,  Olaf Erb,  Ralf Gebhart
FreeBSD-Dienstleistungen/-Produkte + mehr: http://www.secnetix.de/bsd
"I made up the term 'object-oriented', and I can tell you
I didn't have C++ in mind."
        -- Alan Kay, OOPSLA '97
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 17 Mar 2014 - 18:39:27 CET

search this site