au sommaire


    L'ASCII (American Standard Code for Information Interchange - Code standard américain pour l'échange d'information) est le format de codage de données texte qui a longtemps été le plus répandu sur Internet.

     

    La norme ASCII de base

    Apparu en 1963, l'ASCII était fondé sur le codage utilisé pour l'envoi de données télégraphiques.

    La première mouture, codée sur 7 bits, édictait 128 valeurs :

    • les 10 chiffres numériques,
    • les 26 caractères de l'alphabet en minuscule et en majuscule,
    • les caractères de ponctuation : virgule, point d'exclamation, etc.
    • certains caractères de contrôle : tabulation horizontale, fin de ligne...

    A titre d'exemple, la lettre "m" correspond aux 7 bits : "110 1101" tandis que la lettre "A" correspond à la suite : "100 0001".

    Toutefois, cette première version ne prenait pas en compte les caractères accentués de langues telles que le Français : à, é, î...

     

    L'ASCII étendu

    En 1981, conjointement à l'apparition de l'IBMIBM PC, une norme ASCII étendue a été proposée, avec un codage sur 8 bits. Elle intégrait 128 valeurs supplémentaires, intégrant les caractères accentués. La norme ISOISO 8859-1, également connue sous le nom de "Latin-1", est apparue pour sa part en 1987. Elle inclut :

    • les lettres de l'alphabet accentuées, en minuscule,
    • les lettres de l'alphabet accentuées, en majuscule
    • certains signes courant tels que ©, £, §...

    Le symbole de l'euro € a été ajouté à une version ultérieure, appelée ISO 8859-15, publiée en 1999.

     

    L'Unicode

    En 1991, un consortium intégrant des entreprises telles que AppleApple, IBM, MicrosoftMicrosoft et Xerox, a proposé une nouvelle norme, l'UnicodeUnicode, en vue de disposer d'une représentation numérique unifiée pour chaque caractère de toutes les langues du monde. L'Unicode intègre les 128 caractères de l'ASCII original.

    Unicode est peu à peu devenu la norme en vigueur pour le codage des caractères sur Internet, en particulier avec le standard UTF-8.

    La chanteuse Madonna représentée à partir de caractères ASCII. © text-image.com
    La chanteuse Madonna représentée à partir de caractères ASCII. © text-image.com