En décembre dernier, Google a fait une découverte intéressante sur l'encodage utilisé par les pages web des sites du monde entier. De l'histoire du web, l'Unicode vient pour la première fois de dépasser l'Ascii ainsi que les encodages européens classiques.
L'ASCII était en 2001 utilisé par quasi une page sur 2 et une page sur 4 seulement pour l'ISO 8859-1 et 1252. L'unicode avec l'UTF-8 semble enfin mettre tout le monde d'accord après de longues années et permet de représenter toutes les langues du monde entier sans problème. Chez Google, toutes les requêtes sont traduites en Unicode avant d'être réellement traitées, l'avancée de l'Unicode au niveau du web ne lui est de fait pas désagréable.
L'unicode 5.1 vient lui d'être publié ce 4 avril dernier avec plus de 100.000 caractères, il est désormais supporté par Google.
L'ASCII était en 2001 utilisé par quasi une page sur 2 et une page sur 4 seulement pour l'ISO 8859-1 et 1252. L'unicode avec l'UTF-8 semble enfin mettre tout le monde d'accord après de longues années et permet de représenter toutes les langues du monde entier sans problème. Chez Google, toutes les requêtes sont traduites en Unicode avant d'être réellement traitées, l'avancée de l'Unicode au niveau du web ne lui est de fait pas désagréable.
L'unicode 5.1 vient lui d'être publié ce 4 avril dernier avec plus de 100.000 caractères, il est désormais supporté par Google.
Liens
Moving to Unicode 5.1 (280 Clics)
Envoyer une nouvelle à un ami