Re: Mail-Datei Zeichenkodierung reparieren

From: Polytropon <freebsd(at)edvax.de>
Date: Mon, 9 Jun 2014 07:48:47 +0200

On Mon, 09 Jun 2014 07:28:40 +0200, Marc Santhoff wrote:
> On Mo, 2014-06-09 at 07:04 +0200, Polytropon wrote:
> > On Mon, 09 Jun 2014 06:32:23 +0200, Marc Santhoff wrote:
> > > Und viel wichtiger: Da ich das in claws mail nicht ändern kann, möchte
> > > ich die Dateien nachträglich durch einen Filter schicken, um eine
> > > menschenlesbares Format, also "wie angezeigt" bekomme. Geht das mit
> > > FreeBSD-Bordmitteln?
> >
> > Grundsätzlich ja, mit "Suchen & Ersetzen", z. B. mit sed. Man
> > muß nur die auftretenden =-Encodierungen in die gewünschten
> > Zeichen rückwandeln (z. B. Umlaute).
> >
> > Do kannst aber auch folgendes Tool benutzen:
> >
> > http://www.fourmilab.ch/webtools/qprint/
> >
> > Es läßt sich unter FreeBSD bauen und benutzen.
>
> Sehr gut, ist mir am liebsten, weil ...
>
> > Aus einem Text wie
> >
> > Mir ist übel, äh was löten, dazu Äther,
> > etwas Öl - ein Übergriff mit Schmeißweg.
> >
> > wird dann
> >
> > % ./qprint --encode test.txt
> > Mir ist =FCbel, =E4h was l=F6ten, dazu =C4ther,
> > etwas =D6l - ein =DCbergriff mit Schmei=DFweg.
> >
> > Wie gesagt - hier siehst Du die "üblichen Verdächtigen" und
> > könntest das auch mit sed lösen:
> >
> > % sed 's/=FC/ü/g; s/=E4/ä/g; s/=F6/ö/g; s/=C4/Ä/g; s/=D6/Ö/g; s/=DC/Ü/g; s/=DF/ß/g; s/=$//g' test.txt
> >
> > Das ist mit Bordmitteln, sieht aber grausam aus und ist
> > wahrscheinlich in entscheidenden Punkten unvollständig. :-)
>
> ... ich dann nicht das ganze Format auseinandernehmen muß und bei zig
> E-Mails später mal Fehler finde. Z.B. ein Gleichheitszeichen, wie wird
> das wohl kodiert? ;)

Das = wird als =3D codiert, was man dem o. g. sed-Aufruf noch
anfügen könnte. Wenn man vollkommen wahnsinnig wäre. ;-)

Aber es gibt ja noch á, È und andere Zeichen aus ISO-8859-1
oder -15, die in E-Mails vorkommen können. Das o. g. Programm
scheint das alles ganz gut zu handhaben.

> Vielen Dank, damit komme ich zum Ziel. Das "archiver"-Plugin für claws
> mail möchte leider nicht mit mir spielen.

Ich selbst benutze Sylpheed (der "funktionale Vorgänger" von
Claws, wenn ich das richtig verstanden habe), wo die Nachrichten
lokal im MH-Format gespeichert werden. Die Nachrichten beinhalten
verschiedene Header, wobei

        Content-Type: text/plain; charset=ISO-8859-1
        Content-Transfer-Encoding: quoted-printable

der hier relevante sein dürfte. Es kann aber auch

        Content-Type: text/plain; charset=US-ASCII
        Content-Transfer-Encoding: 7bit

vorkommen, vermutlich eine Art "automatische Erkennung", die
greift, wenn keine separat zu codierenden Zeichen (also wirklich
nur 7-Bit-ASCII-Zeichen - keine Umlaute oder dergleichen) in
der Nachricht vorkommen. In einem solchen Fall ist wahrscheinlich
gar keine Konvertierung notwendig.

Ob das Programm aber mit

        Content-Type: text/plain; charset=UTF-8
        Content-Transfer-Encoding: 8bit

umgehen kann, müßte man mal ausprobieren - vermutlich nicht, denn
in diesem Fall ist es ja kein QP. Also sollte man vor eine Kon-
vertierung am besten einen grep-Test vorschalten, der die Fälle,
wo das Programm nicht einzusetzen ist, abfiltert. Aber vermutlich
gehe ich hier wieder von zu komplizierten Voraussetzungen aus. :-)

-- 
Polytropon
Magdeburg, Germany
Happy FreeBSD user since 4.0
Andra moi ennepe, Mousa, ...
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 09 Jun 2014 - 07:48:59 CEST

search this site