Re: ripit klemmt bei Sonderzeichen

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Mon, 28 Jun 2010 13:49:37 +0200 (CEST)

Marc Santhoff <M.Santhoff(at)web.de> wrote:
> 1: Demis Roussos / Die großen Erfolge
>
> 0: none of the above
>
> Choose: 1
> Malformed UTF-8 character (unexpected non-continuation byte 0x65,
> immediately after start byte 0xdf) in unpack at /usr/local/bin/ripit
> line 8525.

Ich hätte besser zunächst Deine nächste Mail lesen sollen,
bevor ich auf die erste antworte. :-)

Also, ganz offenbar ist der Titel ISO8859-codiert, während
ripit stattdessen UTF8 erwartet: 0xdf ist das Zeichen »ß«
in ISO8859-1/-15, siehe /usr/share/misc/latin1, und 0x65
ist der im Wort »großen« darauffolgende Buchstabe »e«,
siehe /usr/share/misc/ascii oder die ascii(7)-Manpage.

In UTF8 dagegen ist die Sequenz 0xdf 0x65 ungültig.

Die Frage ist jetzt, wer recht hat, CDDB oder ripit.
(Im schlimmsten Fall ist das nicht richtig definiert, d.h.
manche Einträge verwenden UTF8 und andere ISO8859 oder
sonst irgendwas. Würde ich CDDB zutrauen.)

> Danach kommt nix mehr, nur noch zwei ^C. Muß wohl doch mal den
> Maintainer fragen.

Dass ripit dann einfach nichts mehr tut, ist natürlich
nochmal ein extra Bug, gleichgültig ob es mit UTF8 recht
hat oder nicht.

Gruß
   Olli

-- 
Oliver Fromme, secnetix GmbH & Co. KG, Marktplatz 29, 85567 Grafing b. M.
Handelsregister: Registergericht Muenchen, HRA 74606,  Geschäftsfuehrung:
secnetix Verwaltungsgesellsch. mbH, Handelsregister: Registergericht Mün-
chen, HRB 125758,  Geschäftsführer: Maik Bachmann, Olaf Erb, Ralf Gebhart
FreeBSD-Dienstleistungen, -Produkte und mehr:  http://www.secnetix.de/bsd
"And believe me, as a C++ programmer, I don't hesitate to question
the decisions of language designers.  After a decent amount of C++
exposure, Python's flaws seem ridiculously small." -- Ville Vainio
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 28 Jun 2010 - 13:49:58 CEST

search this site