Re: Umlautproblem, nicht trivial

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Tue, 20 Mar 2012 13:31:53 +0100 (CET)

Polytropon <freebsd(at)edvax.de> wrote:
> Oliver Fromme wrote:
> > Polytropon <freebsd(at)edvax.de> wrote:
> > > Mit Ersetzung kann man recht viel machen, solange es
> > > ein "Stammzeichen" (ñ -> n) oder eine Ersetzung (ö -> oe)
> > > gibt. Bei nicht-so-europäischen Sprachen wird das schon
> > > schwierig.
> >
> > Da ich diese Sprachen nicht spreche, ist mir das sowas von
> > egal.
>
> War's mir bisher auch, bis ich Dateien namens "Klotz Klotz
> Klotz Klotz Klotz" oder ????? aus China bekam. Da weiß man
> gar nicht, wie man ersetzen soll. :-)

Ist mir noch nicht passiert. Und wenn, dann hätte ich dafür
ebenfalls ein praktisches Skript, das die Dateien einfach
durchnummeriert:

$ renumber 1 %03d *
$ ls
001
002
003
004
..

Ist auf jeden Fall besser als "Klotz Klotz Klotz".

> > Meine Skripte kommen sämtliche damit zurecht, auch wenn sie
> > nur mal schnell zusammengezimmert sind. Wenn man mal weiß,
> > wie es funktioniert, macht man die Quotes automatisch an
> > die richtigen Stellen, ohne nochmal darüber nachdenken zu
> > müssen.
>
> Ist sicher eine Lektion, die man mal lernen muß. Mittlerweile
> habe ich mich auch dran gewöhnt, immer "..." um Dateinamen
> zu machen, das hilft bei den meisten Problemfällen.

Bei Variablen hilft es sogar immer, nicht nur meistens.
Beispiel:

for FILE in *; do stat -f %z -- "$FILE"; done

Funktioniert ohne Einschränkungen mit jedem denkbaren
Dateinamen, den UFS zulässt.

> > Aber im Ernst. Ich bin (unter anderem) Programmierer und
> > verwende Unterstriche in Namen von Variablen, Funktionen
> > und so weiter. Die sind Teil des Namens und werden wie
> > Buchstaben behandelt, und beim wortweisen Springen und
> > Löschen sollen sie auch so behandelt werden. So bin ich
> > es gewohnt.
>
> Hmmm... interessanter Ansatz, finde ich gut (da ich die
> Unterstriche der KaMehlSchreibWeise vorziehe). Da muß man
> wohl wirklich einen professionellen Editor verwenden, um
> diese (sinnvolle) Funktion effektiv nutzen zu können.

Naja, mit dem Attribut "professionell" bin ich vorsichtig.
Er sollte zumindest die Features haben, die ich benötige,
und dazu gehören auch sinnvolle Funktionen für wortweise
Bearbeitung. Im optimalen Fall kann man auch einstellen,
was als Wortgrenze angesehen wird und/oder welche Zeichen
zu einem Wort gehören und welche nicht.

Das gleiche gilt für die Shell. Ich habe mir Editor und
Shell so konfiguriert, dass die Tastenfunktionen weitgehend
übereinstimmen. Es wäre irritierend, wenn sich z.B. das
wortweise Springen oder Löschen in der Shell anders verhält
als im Editor.

> Im aktuellen Fall (der mir solche Grenzen mal wieder nahe-
> gebracht hat) war es so, daß Dateinamen aus Dateiinhalten
> automatisch generiert worden sind, und zwar aus einem "Batzen"
> Datenwiederherstellungsergebnisse. Statt mit 000383665625238.doc
> zu enden, sind inhaltliche Elemente in die neuen Dateinamen
> eingeflossen. Leider war das aber für ein ISO-9660-Dateisystem
> zu lang.

Gut, bei generierten Dateinamen gelten wieder spezielle
Voraussetzungen, je nach konkretem Fall. Und wenn das
ganze dann auf ein Dateisystem verfrachtet werden soll,
das spezielle Einschränkungen hat, muss man aufpassen.
Das hat jetzt aber eigentlich nichts mit Leerzeichen vs.
Unterstrichen zu tun.

> > Ich habe z.B. Verzeichnisse, die »Urlaub 2011« heißen (mit
> > Fotos drin). Das ist nicht 100stellig. Und ich habe nicht
> > den geringsten Grund, da auf ein Leerzeichen zu verzichten.
> > Das ist lesbar, sieht gut aus und ist noch dazu korrektes
> > Deutsch.
>
> Der Computer ist aber englisch! :-)

Meiner ist überwiegend taiwanesisch, glaube ich. :-)

> > > Ein anderer Fall, wo man vorsichtig sein sollte, ist ISO-9660.
> > > Mit sehr langen Dateinamen (ebenso wie mit sehr großen Dateien)
> > > läßt sich das ISO-Image nicht mehr korrekt aufbauen (mkisofs -J).
> >
> > Ich brenne nur noch selten Dateien auf CDs oder DVDs.
>
> Bei mir war's leider eine Kundenanforderung.

Ok, das gibt's natürlich. Ich sprach jetzt eher davon, wie
ich es privat mache. Wenn eine Kunde partout irgendwas will
(und dafür bezahlt), dann kriegt er das auch bei uns. :-)

> > Und
> > wenn, dann verwende ich RockRidge (mkisofs -R oder -r), das
> > sich um die ganzen Dateinamen kümmert, oder ich verpacke die
> > Dateien in ein Containerformat, oder ich brenne gleich ein
> > UFS auf die Scheibe.
>
> Das können die Hanseln in MICROS~1-Land doch wieder nich lesen...

Ist für mich (privat) glücklicherweise nicht relevant; da
ich keine Microsoft-Produkte besitze.

Halt, stimmt nicht, ich habe irgendwo noch Installations-
Disketten für MS-DOS 3.3, die bei meinem ersten eigenen PC
dabeiwaren.

> Man hätte tatsächlich eine UFS-DVD oder eine tar-DVD draus
> machen können - für _mich_ wäre das die richtige Wahl gewesen.

Ich habe einmal eine Datei, die größer als 4 GB war, mit
rar auf eine DL-DVD gebrannt (ohne -R und ohne -J). rar
kann ein Archiv automatisch in kleinere Teile splitten.
Das konnte der Windows-Mensch, für den die DVD gedacht
war, problemlos lesen. Evtl. geht das auch mit zip, aber
rar war auf der BSD-Kiste ohnehin schon installiert, daher
habe ich das genommen.

Im äußersten Notfall kommt man auch ganz ohne Archivformat
oder anderes Dateisystem aus, indem man unter BSD (oder
anderem UNIX) einfach split -b verwendet, und unter Windows
kann man die Teile dann wieder mit copy /b zusammenbauen.

Gruß
   Olli

-- 
Oliver Fromme, secnetix GmbH & Co. KG, Marktplatz 29, 85567 Grafing b. M.
Handelsregister: Registergericht Muenchen, HRA 74606,  Geschäftsfuehrung:
secnetix Verwaltungsgesellsch. mbH, Handelsregister: Registergericht Mün-
chen, HRB 125758,  Geschäftsführer: Maik Bachmann, Olaf Erb, Ralf Gebhart
FreeBSD-Dienstleistungen, -Produkte und mehr:  http://www.secnetix.de/bsd
"C is quirky, flawed, and an enormous success."
        -- Dennis M. Ritchie.
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Tue 20 Mar 2012 - 13:32:14 CET

search this site