Re: Umlaute und andere Sonderzeichen in Dateinamen konvertieren?

From: Polytropon <freebsd(at)edvax.de>
Date: Fri, 21 Mar 2014 12:07:03 +0100

On Fri, 21 Mar 2014 10:44:28 +0100 (CET), Oliver Fromme wrote:
> Polytropon <freebsd(at)edvax.de> wrote:
> > Praxis - das ist ein gutes Stichwort! Mir ist vor ein paar
> > Jahren mal Arztpraxis-Software untergekommen, wo man zwar
> > Umlaute in Namen eingeben konnte, dieser bei jeglichen
> > Druckausgaben aber fehlten. Herr "Jrg Mller" mußte also
> > als "Joerg Mueller" eingegeben werden.
>
> Das ist ganz klar ein Bug (und zwar ein eklatanter) in der
> betreffenden Software, die ihrem Entwickler dafür um die Ohren
> gehauen hört, damit es unverzüglich behoben wird.

Sehe ich auch so, aber solcherlei Software kann man eben
für paar tausend Euro pro Quartal sehr professionell vor-
finden. Übrigens war es dieselbe Software, in der ich mal
den Rechnungsposten namens "Intelegenztests, standardisierte"
gefunden habe - naja, wenigstens nicht "standartisiert". :-)

> Aber das ist gewiss kein Argument dafür, generell auf Umlaute
> zu verzichten.

Nein, generell definitiv nicht, das wollte ich auch nie
behauptet haben.

> > > Beim Inhalt (nicht Namen) von Textdateien verwende ich entweder
> > > ISO 8859 oder UTF-8, je nach Einzelfall. Mein Editor macht
> > > das in der Regel automatisch; Mails und Skripte z.B. werden in
> > > ISO 8859 verfasst, bestimmte andere Dokumente dagegen in UTF-8
> > > inkl. BOM.
> >
> > Wie hast Du das konfiguriert + welcher Editor ist es, daß
> > das so reibungslos funktioniert?
>
> Ich verwende "joe". Das hat traditionelle Gründe, weil ich
> halt aus der alten CP/M- und MS-DOS-Ecke komme (WordStar,
> TP usw.) und joe per Default das gleiche Bedienkonzept und
> die gleiche Tastaturbelegung hat.

Ist ja Wahnsinn... joe war auch einer meiner ersten Editoren
unter FreeBSD, ist auch installiert, nur etwas in Vergessen-
heit geraten. Natürlich kenne ich die vielen coolen Dinge,
die der kann. Ich selbst komme aus dem TP-Umfeld, wo dieses
Bedienkonzept ja auch vorzufinden war.

> Meine Shell-Sessions laufen (zur Zeit noch) immer mit
> LC_CTYPE=de_DE.ISO8859-15. Wenn ich joe mit einer Datei
> starte, die UTF-8-kodiert ist (erkennbar am BOM; er kann
> es aber auch ohne BOM mit Hilfe einer Heuristik erkennen),
> dann "übersetzt" er es automatisch für mein Locale, d.h.
> ich merke es gar nicht, wie die Datei kodiert ist. So
> sollte es ja auch idealerweise sein. Das geht sogar
> gemischt: Ich kann in einer joe-Session gleichzeitig
> eine UTF-8-kodierte Datei und eine ISO-8859-kodierte Datei
> geöffnet haben.

Hmmm... da ist meine Version wohl noch zu alt, ich kriege
beim Versuch, unter ISO8859-1 eine Datei mit chinesischen
Schriftzeichen und deutschen Umlauten zu öffnen, den
schönsten Zeichensalat (A-Tilde Backslash oder Paragraphen-
zeichen oder sowas wie å¯FäºQæ°´åºS).

Vielleicht funktioniert das aber nur bei Dateien mit BOM
verläßlich - oder meine Software ist schlichtweg zu alt,
das kommt bei mir häufiger vor. :-)

> Wenn ich dann irgendwann mal meine Shell-Sessions per default
> auf UTF-8 umswitche, muss ich an joe gar nichts ändern, und in
> meinem less-Wrapper muss ich ggf. die Konvertierungsrichtung
> ändern.

Wie machst Du diese Art der Shell-Umschaltung?

> > > > > Und selbst, wenn man den Umlaut nicht eingeben kann, weil
> > > > > man eine unpassende Tastaturbelegung hat, dann tippt man halt
> > > > > stattdessen "?" und überlässt es dem Globbing der Shell.
> > > > > Oder man verwendet die Tab-Completion.
> > > >
> > > > Genau dies ist ja eine Frage der Shell, ob die das so
> > > > macht, wie man will.
> > >
> > > Naja, sogar die krude csh/tcsh kann das.
> >
> > Plus daß zur deutlichen Darstellung auch das Terminal noch
> > mitmachen sollte. :-)
>
> Damit Globbing und Tab-Completion funktionieren, muss das
> Terminal nicht unbedingt mitmachen.

Ich sagte ja: Darstellung, nicht, daß man nicht auch im
Blindflug sein Ziel erreichen könne. :-)

> > > Ja, ich habe Deinen Smiley gesehen. Aber ich finde nicht,
> > > dass das Dahintersetzen eines Smileys es gestattet, jeden
> > > beliebigen Unsinn zu schreiben. ;-)
> >
> > Ach schade, ich dachte nur. Jedenfalls hast Du den Unsinn
> > zweifelsfrei als solchen erkannt. Das ist heute keine
> > Selbstverständlichkeit mehr.
>
> Das Problem ist nur, dass es immer Leute gibt, die das nicht
> erkennen und es für bare Münze nehmen. Smileys werden da
> gerne auch mal ausgeblendet. Daher war ich so frei, es zu
> kommentieren.

Aha, diesen menschlichen Charakterzug kannte ich bisher noch
nicht. Ich dachte, das wäre bekannte und akzeptierte Konven-
tion. Man lernt bekanntlich nie aus, vor allem nicht auf
dieser Mailingliste (was positiv ist).

> > > Warum sollte man für deutschsprachige Texte von UTF-8 auf UTF-16
> > > umstellen wollen?
> >
> > Warum sollte man für deutschsprachige Texte von ISO-8859-1 oder -15
> > auf UTF-8 umstellen wollen?
>
> Weil dann mehr Zeichen verwendet werden können, wie etwa den
> Gedankenstrich (n-dash oder m-dash) oder die in Deutschland --
> und auch anderswo -- üblichen gerichteten Anführungszeichen.
> (Als Work-around verwende ich manchmal die »französischen«
> Anführungszeichen, die es auch in ISO 8859 gibt.)

Das kann man direkt in der Eingabe machen. Mit LaTeX geht
das natürlich auch bequem, wobei die Eingabedatei dann
"plain ASCII" bleibt - obwohl ich persönlich da auch so
faul bin und \usepackage{german} sowie \usepackage[latin1]{inputenc}
benutze, um Umlaute direkt und Anführungszeichen
"`bequemer"' eingeben zu können.

> Und selbstverständlich können in deutschsprachigen Texten auch
> zahlreiche andere Zeichen vorkommen, die es in ISO 8859 nicht
> gibt, und sei es nur, weil man den Namen eines Mitmenschen
> korrekt wiedergeben möchte, oder ein fremdsprachliches Zitat,
> oder ein Wort in Lautschrift, oder oder oder.

Das mag ein Grund sein, warum LaTeX im kooperativen,
länder- und sprachübergreifenden Textschaffensbereich
so beliebt ist. :-)

> > Sinnvoll und korrekt - da stimme ich völlig zu. Die
> > Realität zeigt aber immer wieder durch besonders "schöne"
> > Beispiele, daß das auch nach hinten losgehen kann. Alles
> > weitere erfährst Du in der Schlatildefracterstrasse in
> > Berlin. :-)
>
> Ja sich, wenn man's drauf anlegt, kann man jeden Fortschritt
> durch "böse" Beispiele ausbremsen.

Fortschritt ist jener Schritt, den wir machen, um die Welt
Schritt für Schritt komplizierter zu machen - habe ich
manchmal den Eindruck. Jedenfalls hat sich dank unserer
Diskussion mein Meinungsbild über UTF-8 durchaus in eine
aktuell zeitgemäßere Auffassung verschoben.

Hoffentlich können unsere Nachkommen, wenn sie überhaupt
noch digitale Daten lesen können, diese Informationen
noch nachvollziehen.

> > > Der Duden hat zwar keine eigene authoritative Macht, aber er
> > > dokumentiert die Regeln der amtlichen Rechtschreibung, die vom
> > > Rat für deutsche Rechtschreibung festgelegt werden.
> >
> > Das tut er nicht mehr. Er gibt vielmehr die Empfehlungen
> > des Duden-Verlags (als einer von vielen, neben Bertelsmann
> > und anderen) wieder.
>
> Die Darstellung ist nicht ganz richtig. Wie gesagt, das
> amtliche Regelwerk wird vom Rat für deutsche Rechtschreibung
> festgelegt.

In der Praxis hat es wenig Bedeutung, da die sich ständig
ändernden Regeln nicht den Weg zu den Menschen finden, die
sie anwenden können bzw. sollen (amtliche Stellen).

Dazu sagt 1 BvR 1640/97 im 2. Leitsatz: "Regelungen über
die richtige Schreibung für den Unterricht in den Schulen
fallen in die Zuständigkeit der Länder."

Der Rat für _Rechtschreibung_ maßt sich allerdings auch
an, Aspekte der Sprache regeln zu wollen, die nicht in dem
Bereich der Rechtschreibung, sondern der Grammatik oder der
Interpunktion oder gar der Typographie fallen. Von daher
ist allein der Name des Gremiums schon sehr ungünstig
gewählt.

Glücklicherweise ist das alles hinfällig, seit funktionaler
Analphabetismus sich in der Mitte der Gesellschaft etabliert
hat. ;-)

Übrigens habe ich bereits nach weniger als einer Minute
schon Rechtschreibfehler auf der Webseite des o. g. Rates
gefunden. Sehr schöne Vorbildfunktion.

> Es wird vom Duden aufgegriffen, der es im
> wesentlichen unverändert wiedergibt, aber _zusätzlich_
> Empfehlungen für die Fälle gibt, wo die amtlichen Regeln
> mehrdeutig sind oder mehrere Möglichkeiten zulassen (und
> solche Fälle gibt es eine ganze Menge).

Diese Ausnahmen sind der Regelfall. :-)

> Die Konkurrenten
> des Duden machen es natürlich genauso, wobei sich deren
> Empfehlungen teilweise unterscheiden. Das hat dazu geführt,
> dass z.B. Verlage sich die ihnen genehmen Empfehlungen des
> Duden und seiner Konkurrenten herausgepickt haben und zu
> einem eigenen internen Regelwerk zusammengestellt haben.

Es gibt auch "Duden anderer Hersteller", z. B. den "Wahrig"
von Bertelsmann, der sich als eigenständiges, dem Duden
gleichwertiges Regelwerk versteht. Zudem gibt es die
verschiedensten "Hausorthographien" bei Verlagen und
Zeitungsredaktionen, die mit den amtlichen Regelungen
nichts mehr zu tun haben. Da man aber auch argumentieren
kann, daß die Angestellten nicht gezwungen werden können,
bestimmte Schreibweisen zu verwenden...

> Ich persönlich mache es ganz ähnlich und picke mir die
> Empfehlungen heraus, die ich für sinnvoll halte, und versuche,
> diese zumindest konsistent anzuwenden (was mir nicht immer
> gelingt). In bestimmten Fällen ignoriere ich Empfehlungen
> auch bewusst.

Das ist völlig in Ordnung und Dein (d. h. unser aller) _Recht_.

> Die Rechtschreibung hat natürlich keine "Gesetzeskraft", und
> jeder kann so schreiben, wie er will. Das war schon immer
> so, auch vor den Reformen. Die amtlichen Regeln sind aber
> (und waren schon immer) verbindlich für den Unterricht an
> Schulen und den Schriftverkehr von Behörden.

An den Schulen gelten länderspezifische Relegungen (s. o.),
und die Realität dürfte noch erschreckender sein. Mangelnde
Sprachkenntnisse konnte ich in meiner Zeit an der Uni auch
bei den Lehramtsstudenden Deutsch beobachten, und zwar sehr
deutlich. Da ist es dann auch egal, ob man im Unterricht
dann den Duden 21, 22 oder 23, den Wahrig, Pons oder sonst
ein Wörterbuch für "maßgebend" erklärt, wenn nach ein paar
Jahren die als richtig gelehrte Schreibweise wieder falsch
ist ("leid tun" - "Leid tun" - "leidtun", oder "kennenlernen" -
"kennen lernen" - "kennenlernen").

Von daher müßte man sich eigentlich fragen, ob sich jede
Schulnote im Fach Deutsch verwaltungsgerichtlich anfechten
ließe, denn anders als in Mathematik, wo ein Rechenergebis
entweder richtig oder falsch ist, ist in Deutsch vieles
Auslegungssache geworden.

> Ich weiß von
> Behördenmitarbeitern, dass es für sie sogar spezielle
> Schulungen zu diesem Thema gibt/gab. Aber dass jetzt jeder
> Behördenbrief in perfektem "Amtsdeutsch" abgefasst ist, darf
> man natürlich nicht erwarten. Das sind ja auch alles nur
> Menschen.

GIbt es da keinen Rechtsanspruch drauf? "Ihren Steuerbescheid
weise ich zurück, da er 3 Rechtschreibfehler enthält und somit
nicht rechtswirksam ist." :-)

> > > Ich habe
> > > deswegen auf den Duden verwiesen, weil ihn die meisten daheim
> > > im Regal stehen haben, im Gegensatz zum amtlichen Regelwerk.
> >
> > Dabei ist es auch wichtig, welche _Ausgabe_ es ist, da
> > diese sich sehr stark widersprechen bzw. unterscheiden,
> > sowohl vom amtlichen Regelwerk als auch von sich selbst
> > untereinander. Duden ist also nicht gleich Duden! :-)
>
> Natürlich; die Sprache ändert sich ja ständig. Ist ja keine
> tote Sprache wie Latein. Ich persönlich habe einen aktuellen
> Duden im Regal stehen, sowie die 20. Auflage (nur aus
> historischem Interesse).

Sprache ändert sich hauptsächlich durch den Gebrauch durch
die Menschen. Mit den Rechtschreibreformen hat man aber,
wie schon in Nazi-Deutschland, versucht, die Sprache "von
oben herab" zu steuern und zu beeinflussen, sie um
Nuancen zu reduzieren, die sie ausmachen, und "Regeln"
inkonsistent und unsinnig aufzustellen. Man kommt sich
fast schon ein bißchen wie in "1984" vor. Wo die Sprache
versagt, verstummen dann auch irgendwann die Gedanken.
Daß die "neue Rechtschreibung" flächendeckend - oder
sollte es "Flächen deckend" heißen? - nicht beherrscht
wird, mag dies unterstreichen. Viele Wörter wurden neu
"begründet" (vgl. "Volksetymologie"), andere wurden
aus der Sprache entfernt. Anstatt wirklich Dinge zu
vereinfachen (was ich persönlich begrüßt hätte), wurde
das richtige Schreiben sinnlos verkompliziert. Die
Inkonsequenz wurde konsequent durchgehalten. :-)

zur Zeit -> zurzeit, aber nicht: zutisch, zubett
zu Hause -> zuhause, aber nicht: nachhause
Mayonnaise -> Majonäse, aber nicht: Krüsanteme
Thunfisch -> Tunfisch, aber nicht: Tron
so genannt -> sogenannt, aber nicht: sogemacht
so daß -> sodass, aber nicht: soauch
kennenlernen -> kennen lernen -> kennenlernen
leid tun -> Leid tun -> leidtun

Man kann jeden Deutschlehrer in den Wahnsinn treiben,
indem man ihn fragt, warum "zusammen schreiben" aus-
einander, "auseinanderschreiben" aber zusammen ge-
schrieben werden soll. Von "viel versprechenden"
Lehrern will ich gar nicht sprechen. :-)

> > > > Da das ß eine Ligatur von Lang-s und Rund-s ist und bei
> > > > [...]
> > >
> > > Es _war_ mal eine Ligatur. Heutzutage wird es aber weitgehend
> > > als eigenständiger Buchstabe angesehen.
> >
> > Das darf man so sehen. Dann ist die Frage, wieviele Buchstaben
> > das deutsche Alphabet hat, aber mit "27" zu beantworten (oder
> > mit "30", wenn man die Umlaute auch als Buchstaben ansieht).
>
> Also, ich habe in der Grundschule (1. Kl.) gelernt, dass
> das Alphabet 26 Buchstaben hat, und dann gibt es noch Ä, Ö,
> Ü und ß, also insgesamt 30 Buchstaben. Das "scharfe s" wurde
> immer als eigenständiger Buchstabe angesehen.

Das "scharfe S" ist auch so ein Überbleibsel, das unsinnig
ist. Wir unterscheiden ja schriftsprachlich nicht, ob z. B.
S weich ("singen") oder scharf ("los") gesprochen wird - an
beiden Stellen schreiben wir dasselbe Zeichen, nämlich 's'.
Da aber 'ß' ein 'ss' ist, und 'ss' immer scharf gesprochen wird,
wird 'ß' folglich auch scharf gesprochen. Es müßte also nicht
"das scharfe S", sondern "die scharfen S" heißen. :-)

Typische Fehler hier sind z. B. "Vielfachmeßer" oder "Verweiß",
aber glücklicherweise erscheint das nicht im "Zeugniss". :-)

> Dass es früher
> mal aus einer Ligatur entstanden war, habe ich erst sehr viel
> später erfahren (und nicht in der Schule).

Das mag sicher von Schule zu Schule, wahrscheinlich sogar
von Land zu Land unterschiedlich gehandhabt worden sein
(und vielleicht sogar im zeitlichen Kontext Änderungen
erfahren haben). In "meiner" 1. Klasse POS wurde es so
erklärt, daß alle "ss", die man nicht trennen kann, als
'ß' geschrieben werden. Die Frage, warum das Zeichen denn
Eszett und nicht Eses heißt, wurde so beantwortet, daß
es (deutlich) früher wirklich mal aus 's' und 'z' bestand
und man dies auf manchen Straßenschildern sogar noch heute
(aufgrund der Schriftart) sehen könne, aber heute ein Eszett
für zwei S steht. Das ist auch der Grund, warum es bei
Großschreibung wieder in diese "zerfällt". Tja, Wissen
im Wandel der Zeit. :-)

-- 
Polytropon
Magdeburg, Germany
Happy FreeBSD user since 4.0
Andra moi ennepe, Mousa, ...
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Fri 21 Mar 2014 - 12:07:38 CET

search this site