Re: Umlautproblem, nicht trivial

From: Polytropon <freebsd(at)edvax.de>
Date: Mon, 19 Mar 2012 18:09:42 +0100

On Mon, 19 Mar 2012 15:49:39 +0100 (CET), Oliver Fromme wrote:
> Polytropon <freebsd(at)edvax.de> wrote:
> > Oliver Fromme wrote:
> > > Das eigentliche Problem ist, dass sich offenbar viele
> > > Programme, die von Linuxern stammen, einen Teufel um die
> > > Locale-Einstellungen des Betriebssystems scheren und
> > > stattdessen ihr eigenes Süppchen kochen.
> >
> > Zumeist scheint das verwendet zu werden, was die jeweilige
> > Desktop-Umgebung als "Standard" definiert, wobei es diese
> > Desktop-Umgebung ist, die die Einstellungen vorgibt (und
> > nicht etwa die des Betriebssystems honoriert).
>
> Ja, das fällt ebenfalls unter »Programme, die von Linuxern
> stammen«. Das mag wie ein blödes Vorurteil klingen, aber
> man kann das ganz klar beobachten, dass es bei Software,
> die aus der Linux-Ecke kommt, mit Portabilität und Nutzung
> existierender Standard-APIs nicht weit her ist.

Das trifft also auf 95% aller GUI-Programme in den Ports
zu. :-(

> > Natürlich hat man es bei "unseren Umlauten" (ö, ä, ü und ß)
> > sehr einfach mit der Ersetzung, wenn allerdings dänische,
> > schwedische oder gar chinesische Sonderzeichen dazukommen,
> > wird es schwierig.
>
> Ich hatte durchaus schon Dateien mit anderen diakritischen
> Zeichen und Ligaturen im Namen (ç, æ, ï, ñ, ...). Mein
> Skript lässt die diakritischen Zeichen einfach weg bzw.
> löst die Ligaturen auf. Das mag nicht in jeder denkbaren
> Sprache die korrekte Umschreibung sein, aber für meine
> Zwecke genügt das vollkommen.

Mit Ersetzung kann man recht viel machen, solange es
ein "Stammzeichen" (ñ -> n) oder eine Ersetzung (ö -> oe)
gibt. Bei nicht-so-europäischen Sprachen wird das schon
schwierig.

Und: Nein, für Russisch habe ich eine "Emulation" erfunden.
A 6 B r g E E: )I( 3 N N: K JI M H O n P C T Y (I) X
U, 4 W W, -b bI b -) I-O R. Damit geht's auch, wenn man
genug Phantasie mitbringt. :-)

> > Prinzipiell aber folge ich seit meinem UNIX-Einstieg
> > Deinem Beispiel. Keine Umlaute, keine Leerzeichen. Niemals.
> > Und wenn man das von Anfang an durchexerziert, eckt man
> > programm- und skriptseitig nicht an.
>
> Welches Problem hast Du denn mit Leerzeichen?

Das Leerzeichen ist der Parametertrenner. Spätestens
in "Quick-&-dirty-Skripten" macht sich das bemerkbar.
Der Unterstrich ist angenehmer, man muß\ nicht\ jedes
Leerzeichen maskieren "oder sie in" Anführungszeichen
einschließen. Programme wie XMMS ersetzen die Leer-
zeichen bei der Titelanzeige beispielsweise wieder
durch Leerzeichen, dann sieht es besser aus.

> Die haben
> doch immer den Code 32, egal ob ASCI, ISO-8859 oder UTF.
> Ich benutze durchaus Leerzeichen in Dateinamen. Ich finde,
> Unterstriche in längeren Dateinamen sehen schrecklich aus,
> und bestimmte wortorientierte Edit-Funktionen der Shell
> funktionieren dann nicht mehr so gut.

Mittlerweile hat beispielsweise Opera gelernt, Ctrl+[<-]
und Ctrl+[->] auf _ als Wortgrenzen anzuwenden. Natürlich
hast Du ansonsten recht, daß Editierfunktionen auf solchen
Dateinamen etwas unelegant werden. Aber wann editiert man
schon mal einen 100stelligen Dateinamen... :-)

> Eine Ausnahme mache ich (gezwungenermaßen) in Bereichen,
> die per Samba an Windows-Rechner exportiert werden, weil
> Windows bestimmte Zeichen (leider!) nicht mag, wie etwa
> den Doppelpunkt. Finde ich ziemlich behämmert, aber ich
> kann's leider nicht ändern.

Oder Dateinamen wie NUL: oder COM1:, die sind auch sehr
beliebt. :-)

Ein anderer Fall, wo man vorsichtig sein sollte, ist ISO-9660.
Mit sehr langen Dateinamen (ebenso wie mit sehr großen Dateien)
läßt sich das ISO-Image nicht mehr korrekt aufbauen (mkisofs -J).

-- 
Polytropon
Magdeburg, Germany
Happy FreeBSD user since 4.0
Andra moi ennepe, Mousa, ...
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 19 Mar 2012 - 18:09:52 CET

search this site