Re: Praxistips: Umlaute usw. in Shell-Skripten umkodieren

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Fri, 21 Mar 2014 13:20:53 +0100 (CET)

Oliver Fromme wrote:
> [...]
> Das Skript könnte dann einmal testweise die Datei als UTF-8
> interpretieren (d.h. mit iconv nach /dev/null) und schauen,
> ob das mit einem Fehler abbricht oder nicht:

Da ist mir eine Zeile abhanden gekommen.
Der Schnipsel müsste so aussehen:

if iconv -f UTF-8 -t UCS-4 <DATEI >/dev/null 2>&1; then
        FILE_CODING=UTF-8
else
        FILE_CODING=ISO8859-15
fi

Andere Skript- oder Programmier-Sprachen haben natürlich
auch ihre Konstrukte, um mit Kodierungen umzugehen.

In Python z.B. gibt es die String-Methoden encode() und
decode(), mit denen man zwischen Unicode und diversen
Kodierungen konvertieren kann. Weitere diverse nützliche
Funktionen findet man im Modul "locale", beispielsweise
die Funktion getpreferredencoding(), die das gleiche
liefert wie das Shell-Kommando "locale charmap", also
z.B. "ISO8859-15" oder "UTF-8". Das Resultat kann direkt
als Parameter für encode() und decode() verwendet werden.

Gruß
   Olli

-- 
Oliver Fromme,  secnetix GmbH & Co. KG,  Marktplatz 29, 85567 Grafing
Handelsregister:  Amtsgericht Muenchen, HRA 74606, Geschäftsfuehrung:
secnetix Verwaltungsgesellsch. mbH, Handelsreg.: Amtsgericht München,
HRB 125758, Geschäftsführer:  Maik Bachmann,  Olaf Erb,  Ralf Gebhart
FreeBSD-Dienstleistungen/-Produkte + mehr: http://www.secnetix.de/bsd
We're sysadmins.  To us, data is a protocol-overhead.
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Fri 21 Mar 2014 - 13:21:03 CET

search this site