Oliver Fromme wrote:
> [...]
> Das Skript könnte dann einmal testweise die Datei als UTF-8
> interpretieren (d.h. mit iconv nach /dev/null) und schauen,
> ob das mit einem Fehler abbricht oder nicht:
Da ist mir eine Zeile abhanden gekommen.
Der Schnipsel müsste so aussehen:
if iconv -f UTF-8 -t UCS-4 <DATEI >/dev/null 2>&1; then
FILE_CODING=UTF-8
else
FILE_CODING=ISO8859-15
fi
Andere Skript- oder Programmier-Sprachen haben natürlich
auch ihre Konstrukte, um mit Kodierungen umzugehen.
In Python z.B. gibt es die String-Methoden encode() und
decode(), mit denen man zwischen Unicode und diversen
Kodierungen konvertieren kann. Weitere diverse nützliche
Funktionen findet man im Modul "locale", beispielsweise
die Funktion getpreferredencoding(), die das gleiche
liefert wie das Shell-Kommando "locale charmap", also
z.B. "ISO8859-15" oder "UTF-8". Das Resultat kann direkt
als Parameter für encode() und decode() verwendet werden.
Gruß
Olli
-- Oliver Fromme, secnetix GmbH & Co. KG, Marktplatz 29, 85567 Grafing Handelsregister: Amtsgericht Muenchen, HRA 74606, Geschäftsfuehrung: secnetix Verwaltungsgesellsch. mbH, Handelsreg.: Amtsgericht München, HRB 125758, Geschäftsführer: Maik Bachmann, Olaf Erb, Ralf Gebhart FreeBSD-Dienstleistungen/-Produkte + mehr: http://www.secnetix.de/bsd We're sysadmins. To us, data is a protocol-overhead. To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org with "unsubscribe de-bsd-questions" in the body of the messageReceived on Fri 21 Mar 2014 - 13:21:03 CET