Developpez.com - C
X

Choisissez d'abord la catégorieensuite la rubrique :

next up previous contents index
Next: Le code ascii Up: Les jeux de caractères Previous: Les jeux de caractères

Sous-sections

Les normes

L'histoire des jeux de caractères pour les besoins de l'informatique débute avec le codage EBCDIC (sur 8 bits) utilisé par IBM et le codage ASCII (sur 7 bits) utilisé par le reste du monde. Le code EBCDIC n'est pas une norme, mais le code ASCII est une norme de l' ANSI.

En 1963, l' ISO crée une norme internationale à partir de la norme ASCII et, internationalisation oblige, elle réserve 10 caractères pour des variantes nationales. La France (dans une norme NF) en utilisera 5 pour y caser des lettres accentuées (à ç é è ù) laissant de côté l'accent circonflexe si cher aux académiciens français, le tréma et les ligatures. Cette norme est donc inutilisable pour écrire réellement en français, mais il faut dire à la décharge de l' ISO, qu'en utilisant un code à 7 bits, cela était impossible.

En 1988, l' ISO édite une nouvelle norme de jeu de caractères à 8 bits cette fois pour prendre en compte les particularités des langues européennes. Mais la diversité est telle qu'il n'est pas possible de mettre tous les signes typographiques dans un seul jeu de 256 caractères. Les langues ont donc été regroupées en familles, et la norme ISO-8859 comprend plusieurs jeux de caractères. Celui qui nous intéresse est celui qui est prévu pour les langues d'europe occidentale et qui est référencé ISO-8859-1 ou ISO-LATIN-1. Malheureusement, les français ne sont pas de très bons lobbyistes dans les instances internationales, et aussi incroyable que cela puisse paraître, la ligature \oe du français a été oubliée !

Pour en savoir plus

Il existe un excellent article de Jacques André et Michel Goosens sur les problèmes de normalisation de codage de caractères, librement accessible via l' URL :
http://www.univ-rennes1.fr/pub/gut/publications . Il s'agit de la revue << les cahiers de GUTenberg >> , et l'article en question est dans le cahier 20. Pour le problème de la ligature \oe, voir le cahier 25.


next up previous contents index
Next: Le code ascii Up: Les jeux de caractères Previous: Les jeux de caractères
Bernard Cassagne
1998-12-09
Contacter le responsable de la rubrique C