Re: Mail-Datei Zeichenkodierung reparieren

From: Polytropon <freebsd(at)edvax.de>
Date: Mon, 9 Jun 2014 08:46:44 +0200

On Mon, 09 Jun 2014 08:07:32 +0200, Marc Santhoff wrote:
> On Mo, 2014-06-09 at 07:48 +0200, Polytropon wrote:
> > On Mon, 09 Jun 2014 07:28:40 +0200, Marc Santhoff wrote:
> > > Vielen Dank, damit komme ich zum Ziel. Das "archiver"-Plugin für claws
> > > mail möchte leider nicht mit mir spielen.
> >
> > Ich selbst benutze Sylpheed (der "funktionale Vorgänger" von
> > Claws, wenn ich das richtig verstanden habe),
>
> Soll so sein. Ich muß mal gucken, ob Sylpheed nicht besser ist. Claws
> ist noch relativ jung und manchmal etwas "eckig". Tatsächlich habe ich
> es behalten, als ich verschiedene News-Reader ausprobiert habe, das
> gefiel mir am besten und ich benutze es nur für usenet. Pan2 hat damals
> irgendwelche Entwicklungswege genommen, die mir keinen Spaß gemacht
> hatten.

Soweit die Mailablage in einem kompatiblen Format ist, könnte
man Sylpheed "parallel drüberbenutzen", ansonsten in mbox
exportieren und dann in Sylpheed wieder als mbox importieren.

> > Ob das Programm aber mit
> >
> > Content-Type: text/plain; charset=UTF-8
> > Content-Transfer-Encoding: 8bit
> >
> > umgehen kann, müßte man mal ausprobieren - vermutlich nicht, denn
> > in diesem Fall ist es ja kein QP. Also sollte man vor eine Kon-
> > vertierung am besten einen grep-Test vorschalten, der die Fälle,
> > wo das Programm nicht einzusetzen ist, abfiltert. Aber vermutlich
> > gehe ich hier wieder von zu komplizierten Voraussetzungen aus. :-)
>
> Ja, zu kompliziert. Ich will wirklich nur intressante Threads als
> lesbaren Text speichern. Mehr als die notwendigsten Informationen aus
> dem Header brauche ich nicht und will ich noch rauswerfen. Klar, am
> Header stolpert qprint manchmal, wenn dort Kodierungen nicht erkannt
> werden oder seltsame Zeichenketten drinstehen, aber das stört mich
> erstmal nicht. Claws mail gibt es halt nur so raus, und was anderes zu
> schreiben, in Python oder so, bin ich dann doch zu faul. Ich hoffe ja,
> daß nach den nächsten Update das Archiver-Plugin funktioniert und kann,
> was ich will. ;)
>
> Beispiel:
> injection-Info: mx05.eternal-september.org; posting-host="dfa301b718dd7151cdb0fa0fa92237c6";
> logging-data="3490";
>
> Da klemmt's natürlich an den Gleicheitszeichen.

Genau, das wäre so ein typischer falsch-positiver Fall.

> Error: bad equal sign escape "="d" at byte 4351 (0x10FF) of input.
> Injection-Info: mx05.eternal-september.org;
> posting-hostýfa301b718dd7151cdb0fa0fa92237c6";
> Error: bad equal sign escape "="3" at byte 4401 (0x1131) of input.
> Error: bad equal sign escape "="a" at byte 4428 (0x114C) of input.
> Error: bad equal sign escape "="U" at byte 4475 (0x117B) of input.
>
> Ich brauche aber nur Subject, From, Datum und vielleicht noch Msg-ID.
> Wenn die ID kaputt geht kann ich es über das Subject trotzdem ggf.
> nochmal raussuchen.

Das ist ja insoweit auch korrekt, da die Header nicht zum
Nachrichtentext gehören. Man müßte dann ggf. nur die wirklich
gewünschten Header (z. B. From:, Date:, Subject:) übernehmen,
alle anderen Header verwerfen, und dann den Nachrichtentext
konvertieren, wenn er zuvor als mit dem entsprechenden Header
"Content-Transfer-Encoding: quoted-printable" angezeigt worden
ist - ansonsten 1:1 übernehmen. Das Suchmuster wäre also, daß
der Nachrichtentext nach einer Leerzeile beginnt (der "Zwischen.
raum zwischen Headern und Textkörper). Das qprint-Tool ist
also nur auf den Nachrichtentext anzuwenden, und das auch nur,
wenn die Voraussetzungen stimmen. Neben möglichen unter-
schiedlichen Codierungen könnten dann auch Multipart-Nach-
richten vorkommen...

In den Headern kann sowas ja auch vorkommen, hier ist dann
neben der QP-Konvertierung noch die Zeichensatzdeklaration
zu löschen, z. B. "Subject: =?ISO-8859-1?Q?Gesangs=FCbung?="
würde zu "Gesangsübung" reduziert werden. Auch in Adreß-
feldern wie From:, To:, Cc: o. dgl. kann sowas vorkommen
(z. B. Klarnamen mit "Sonderzeichen" vor E-Mail-Adressen).

Schau Dir zusätzlich nochmal die Manpage von qprint an, unter
Umständen reicht da schon die Option -n (keine Fehlerprüfung),
um die falsch-positiven Treffer zu übergehen.

-- 
Polytropon
Magdeburg, Germany
Happy FreeBSD user since 4.0
Andra moi ennepe, Mousa, ...
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 09 Jun 2014 - 08:46:54 CEST

search this site