You are on page 1of 18

ICANN 33

2 November 2008

Tina Dam, Director, IDN Program
tina dam@icann org
tina.dam@icann.org
‫ ﻣﺪﻳﺮ ﻋﻼﻗﺎت إﻗﻠﻴﻤﻴﺔ – اﻟﺸﺮق اﻷوﺳﻂ‬،‫ﺑﺎهﺮ ﻋﺼﻤﺖ‬
baher.esmat@icann.org
Agenda
ƒ IDN definitions and basics
ƒ How does IDNs work
à including examples of applications and their various implementations
ƒ IDN wiki facility
IDN  iki f ilit
ƒ IDN TLD introduction processes
ƒ IDN TLD technical string requirements

2
Characters in the DNS

ƒ Search on 
Search on “US
US‐ASCII character set
ASCII character set”
ƒ The DNS can handle all US‐ASCII characters
à Examples: 
p
‚ (a…z), (0…9), (‐)
‚ ( ) SPACE 
‚ (!) EXCLAMATION MARK 
‚ (") QUOTATION MARK 
‚ (#) NUMBER SIGN 
‚ ($) DOLLAR SIGN 
‚ (%) PERCENT SIGN 
‚ (&) AMPERSAND 
‚ ( ) APOSTROPHE 
(') APOSTROPHE 
Characters  DNS  and domain names
Characters, DNS, and domain names…

ƒ All TLD registries have implemented the LDH rule
All TLD  i t i  h  i l t d th  LDH  l

à Domain names can only contain:
‚ (a,b,…z)
‚ (0,1,…9)
‚ (‐)
()
ƒ That was before internationalization….
IDN Definitions
ƒ Internationalized domain names are:
à Names with characters other than the standard ASCII 
(a,b,…z), (0,1,…9), (‐)

ƒ Example: 
xn--ngbrx4e.tld Å tld.‫ﻋﺮﺑﻲ‬

ƒ IDNs are about localized solutions
à But need to be ‘internationalized’ due to the global nature 
of the Internet

5
IDNs ‐‐ What we have / what we need
IDNs 
ƒ IDNs have existed as second level since 2003
à under web protocol standards
à email protocol standards are underway (IETF)
ƒ We also need IDN TLDs
à 北京.中国; [xn‐‐1lq90i.xn‐‐fiQs8S]

Domain  ASCII domain  domainname.TLD


Availability 
y names icann.org
g
((a, b,...,z), (0,1,…,9), (‐)
 b )  ( )  ( )
Today
IDN second level 실례.TLD
‐under various existing TLDs

Future 
Addition
IDN TLDs 실례. 테스트
6
Why Internationalization?

ƒ DNS handling US‐ASCII character set
à a natural choice at the time
à no expectation to current commercial value
à Unicode was not available

ƒ IDNs a natural expansion for global usability
à allow users to use domain names in local scripts
à no need to learn US‐ASCII, user choice

à some applications have implemented IDNA
à still need internationalization of TLD
IDNA –– Protocol Functionality
IDNA 
•Domain Name Resolution Process:

http://www.실례.test Local Server


xn‐‐9n2bp8q.test Root Server

IP address of 
End-user / Client
xn‐‐9n2bp8q.test
b
.test Server
IDNA is a client based protocol:
11. User types in 실례
User types in 실례.test in for example a browser
test in for example a browser
2. 실례.test gets converted to Unicode, 
‐ if not already entered as such
3. IDNA conversion Æ xn‐‐9n2bp8q.test 실례.test Server
9
Displayed Form vs. Stored Form
ƒ Historically the domain name you register is also the domain 
names stored and usable in the DNS
ƒ This is changed with introduction of IDNs

ƒ The stored form usually gives no meaning 
à Example: ‫ﻓﺮﺳﺎﻟﻨﻬﺮ‬.tld Æ
tld Æ xn‐‐mgbtbg2evaoi.tld
xn‐‐mgbtbg2evaoi tld
ƒ However, there are exceptions:
à xn‐‐gibberish ‐
g decodes into the Arabic characters ‫ٯٲٳٳ‬٨٧٩‫ٮ‬
à xn‐‐trademark ‐ with different versions of trademarks
à This is coincidentally and hence not intentionally, but implementations 
showing xn– to the user is a concern

ƒ xn‐‐ prefix indicates to application software that the label needs 
to be decoded back into Unicode for proper display to the user
IDNA protocol and IDN wiki –– try it out
IDNA protocol and IDN wiki 

ƒ http://idn.icann.org
htt //id i
ƒ http://josefsson.org/idn.php
‚ IDNA ToASCII
‚ IDNA ToUnicode

ƒ If you can’t type in an IDN then search for your favorite 
newspaper online and copy‐paste it
à or you can copy
or you can copy‐past text from the IDN wiki
past text from the IDN wiki

ƒ Try copy / paste between applications you normally use
y py p pp y y

11
IDN wiki  at  http://idn.icann.org 

12
Status of the .test wiki 
Status of the  test wiki 
ƒ Purpose of the IDNwiki:
à Introduce users to IDN TLDs
à Applications test environment for usability
à Registry information about user problems
ƒ Conduct an experiment with IDN TLDs
à not a pre‐requisite for production in root zone
à no registrations are available
ƒ Functions as a “normal wiki”, user access

13
IDN TLD Introduction Processes
Implementation of Country‐code IDN TLDs – Fast Track
‐ implementation of recommended policy from IDNC WG
‐ review of contractual elements and relationship to IDN TLD operators
i   f  t t l  l t   d  l ti hi  t  IDN TLD  t
‐ review of technical requirements for IDN TLD management

Country‐code IDN TLDs – Long Term
‐ Full policy that caters for all
‐ Follows the full ccNSO Policy Development Process

New Generic TLDs
‐ New ongoing policy for new gTLDs
‐ Includes internationalized domains
‐ Focus on non‐ASCII squatting & confusingly similarity solutions
14
IDN TLD Technical Requirements I 
ƒ The label must be a valid internationalized domain name, as 
The label must be a valid internationalized domain name  as 
specified in technical standards 
http://www.icann.org/en/topics/idn/rfcs.htm. This includes the 
following, non‐exhaustive, list of limitations:

à Must only contain Unicode code points that are defined as “Valid” in The 
Unicode Codepoints and IDNA (Internet Draft “draft‐faltstrom‐idnabis‐
tables”)

à Must be fully Normalization Form C compliant, as described in Unicode 
Standard Annex #15: Unicode Normalization Forms.

à Must not contain characters with a mixture of directionality properties.

à Must not contain any leading or trailing digits (of any kind of digits)
Must not contain any leading or trailing digits (of any kind of digits).

15
IDN TLD Technical Requirements II
ƒ The label must meet the relevant criteria of the ICANN 
Guidelines for the Implementation of Internationalized 
Domain Names. This includes the following, non‐
exhaustive, list of limitations:

à All code points in a single label will be taken from the same script 
as determined by the Unicode Standard Annex #24: Unicode Script 
P
Property.  
t   

à Exceptions are permissible for languages with established 
orthographies and conventions that require the commingled use 
of multiple scripts.  However, even in the case of this exception, 
visually confusable characters from different scripts will not be 
allowed to co‐exist in a single set of permissible code points 
unless a corresponding policy and character table is clearly 
defined.  
16
IInternationalization of the internet means that 
i li i   f  h  i    h  
the internet is equally accessible from all 
l
languages and scripts
  d  i
‫ﺷﻜﺮًا ﻟﻜﻢ‬
‫ﻢ‬
tina.dam@icann.org
http://icann.org/topics/idn

You might also like