Identificador de Recursos Internacionalitzat
L'article o secció necessita millores de format. |
L'Identificador de Recursos Internacionalitzat (IRI) va ser definit el 2005 per l'Internet Engineering Task Force (IETF) com un nou estàndard d'Internet per estendre l'esquema existent de l'Identificador Uniforme de Recursos (URI).[1] El nou estàndard es va publicar a RFC 3987.
Mentre que els URIs es limiten a un subconjunt dels caràcters ASCII, els IRI poden contenir caràcters del conjunt de caràcters universals (Unicode / ISO 10646), incloent caràcters kanji xinesos o japonesos, coreans, ciríl·lics, i altres.
Sintaxi
[modifica]Els IRIs suposen una ampliació dels URIs utilitzant Unicode, donat que els URIs estaven limitats a l'ASCII, amb molts menys caràcters. Els IRIs podrien representar-se amb una seqüència d'octets, però per definició es defineixen com una seqüència de caràcters, de manera que puguin pronunciar-se o escriure's.[2]
Compatibilitat
[modifica]Per tal de conservar la compatibilitat amb sistemes que no admeten el nou format, s'efectua una conversió de IRIs a URIs.[2]
Per a aplicacions i protocols que no permeten la utilització directa d'IRIs, els IRIs s'han de convertir primer a Unicode utilitzant la norma de composició canònica (NFC).
A continuació s'han de convertir tots els punts de codi no-ASCII de l'IRI a UTF-8, i els bytes resultants han de ser codificats percentualment, per tal de produir un URI vàlid.
Exemple: l'IRI Ῥόδος es converteix en l'URI /%E1%BF%AC%CF%8C%CE%B4%CE%BF%CF%82
Segons quina sigui la implementació, els punts de codi ASCII que són caràcters URI no vàlids poden codificar-se de la mateixa manera.[3]
Aquesta conversió és fàcilment reversible; per definició, la conversió d'un IRI a un URI i al revés de URI a IRI produirà un IRI que és semànticament equivalent a l'IRI original, tot i que pot diferir en la seva representació exacta.
Alguns protocols poden imposar transformacions addicionals. Per exemple. Punycode per a etiquetes DNS.
Referències
[modifica]- ↑ Gangemi, Aldo; Presutti, Valentina «The bourne identity of a web resource». Proceedings of Identity Reference and the Web Workshop (IRW). National Research Council (ISTC-CNR) [Roma, Italy], 2006, pàg. 3. «Notice that IRIs (Internationalized Resource Identifier) [11] are supposed to replace URIs in next future.»
- ↑ 2,0 2,1 Duerst, M. «RFC 3987». Network Working Group. Internet Engineering Task Force, Standards Track, 2005 [Consulta: 12 octubre 2014].
- ↑ Hendler, Hrsg. Dieter Fensel; Hrsg. John Domingue; Hrsg. James A.. Handbook of Semantic Web Technologies. 1. Aufl.. Berlín: Springer-Verlag GmbH, 2010. ISBN 978-3-540-92912-3 [Consulta: 12 octubre 2014].
Vegeu també
[modifica]Enllaços externs
[modifica]- Activitat d'internacionalització del W3C (anglès)
- [1] (anglès)
- Llista d'esquemes d'URIs registrats (anglès)