Posts Tagged “Web”

l’UTF-8

L’encodage le plus pratique pour échanger des textes constitués de caractères Unicode est UTF-8 "UTF"(Unicode Transformation Format). Il associe à tout numéro Unicode une suite d’un ou plusieurs octets (jusqu’à quatre octets pour un seul caractère) !!

 Avantages

    * Universalité puisque on peux représenter les milliers de caractères d’Unicode.
    * Compatibilité avec US-ASCII : Un texte en US-ASCII est codé identiquement en UTF-8.
    * Interopérabilité du fait qu’un caractère est découpé en une suite d’octets (et non en mots de plusieurs octets)
    * Efficacité pour les langues utilisant beaucoup les caractères US-ASCII
    * Fiabilité :Il s’agit d’un codage auto-synchronisant (en lisant un seul octet on sait si c’est le premier d’un caractère ou non).
    * C’est le codage de base de XML, et donc le plus courant aujourd’hui.

Utilisation

Le protocole HTTP permet très facilement d’indiquer le type de codage dans le header. Il suffit d’indiquer

Content-Type: text/html; charset=utf-8

Pour un document HTML ou  pour un document de type texte.

Content-Type: text/plain; charset=utf-8

Pour un document HTML, il suffit d’insérer dans la section head

<meta http-equiv=Content-Type content="text/html; charset=utf-8" />

Pour un document XML, le type de codage est indiqué sur la première ligne du document comme suit

<?xml version="1.0" encoding="UTF-8"?>

A noter qu’on peut utiliser indifféremment UTF-8 ou utf-8

Tags:

Comments Pas de commentaire »