Re: Umlaute jetzt erlaubt in domainnames

From: Oliver Fromme <olli(at)lurza.secnetix.de>
Date: Fri, 5 Mar 2004 19:29:57 +0100 (CET)

Christian Weisgerber <naddy(at)mips.inka.de> wrote:
> Oliver Fromme <de-bsd-questions(at)de.FreeBSD.org> wrote:
> > Hat TRNIC in der Türkei das »punktlose i« für IDNA-Domains
> > zugelassen?
>
> Das weiß ich nicht. Ich wollte nur darauf hinaus, dass
> 1. 'ß' nicht das einzige problematische Zeichen und

Das bezweifle ich gewiß nicht.

> 2. eine eineindeutige, aber lokaleabhängige Groß-Klein-Abbildung
> keine hinreichende Bedingung

Du meinst »Bedingung für das Vermeiden von Problemen«?
Hmm. In dem von Dir geschilderten Fall (i/I) ist es
jetzt relativ kompliziert, und ich bin nicht ganz sicher,
ob ich Deinem Punkt 2. zustimmen kann oder nicht. :-)
Du könntest aber durchaus recht haben.

> Nein. Nochmal zur Erklärung für die Leute, die kein UTF-8 lesen
> können:
>
> | klein | groß
> ----------+-----------------+--------------
> Türkisch | i-ohne-Punkt | I
> | i | I-mit-Punkt
> ----------+-----------------+--------------
> anders | i | I
> ----------+-----------------+--------------

Danke, jetzt ist es klar.

Das türkische Locale ist auf jeden Fall nur für die Client-
Applikation von Bedeutung. Sobald diese einen Domainnamen
in irgendeinem Internet-Protokoll verwendet (typischerweise
für eine DNS-Anfrage), so ist er IDNA-codiert und unter-
liegt nur noch dem C-Locale. DNS-Nameserver müssen unter
dem C-Locale bzw. POSIX-Locale laufen, also US-ASCII.

In diesem Fall ist also lediglich die Client-Application in
der Verantwortung, daß sie das mit dem i/I irgendwie kor-
rekt gebacken kriegt. Die Frage ist nun, was in dem Zusam-
menhang »korrekt« ist und was nicht. Entscheidend dürfte
sein, wie sich existierende Software bisher im türkischen
Locale vehalten hat, wenn sie (herkömmliche) Domainnamen
handhaben mußte, die die US-ASCII-Buchstaben »i« oder »I«
enthielten. Da Leute in der Türkei vermutlich keine Pro-
bleme damit haben, auf microsoft.com zuzugreifen (zumindest
keine _technischen_ Probleme), muß das wohl bisher so funk-
tiert haben, daß die türkischen Groß/Kleinumwandlungsregeln
ignoriert worden sind.

Unter FreeBSD scheint es in der Tat so: tr_TR.ISO8859-9/
LC_CTYPE ist ein Symlink auf la_LN.US-ASCII/LC_CTYPE, d.h.
7Bit-US-ASCII.

Gruß
   Olli

-- 
Oliver Fromme, secnetix GmbH & Co KG, Oettingenstr. 2, 80538 München
Any opinions expressed in this message may be personal to the author
and may not necessarily reflect the opinions of secnetix in any way.
"The scanf() function is a large and complex beast that often does
something almost but not quite entirely unlike what you desired."
        -- Chris Torek
To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Fri 05 Mar 2004 - 19:30:28 CET

search this site