Jeux de caractères codés sur un octet et multioctets
Le jeu de caractères ASCII définit les caractères compris dans la plage 0x00 à 0x7F. Il existe de nombreux autres jeux de caractères, principalement européens, qui définissent les caractères de la plage 0x00 - 0x7F identiques au jeu de caractères ASCII et définissent également un jeu de caractères étendus à partir de 0x80 - 0xFF. Un jeu de caractères à un octet (SBCS) 8 bits est suffisant pour représenter le jeu de caractères ASCII et les jeux de caractères pour de nombreuses langues européennes. Toutefois, certains jeux de caractères non européens, tels que le Kanji japonais, incluent beaucoup plus de caractères que ne peuvent être représentés dans un schéma de codage d’octets unique, et nécessitent donc l’encodage de jeu de caractères multioctets (Mo CS).
Remarque
De nombreuses routines SBCS de bibliothèque d’exécution Microsoft gèrent les octets, les caractères et les chaînes multioctets selon les besoins. Plusieurs jeux de caractères multioctets définissent le jeu de caractères ASCII comme un sous-ensemble. Dans de nombreux jeux de caractères multioctets, chaque caractère de la plage 0x00-0x7F est identique au caractère qui a la même valeur dans le jeu de caractères ASCII. Par exemple, dans les chaînes de caractères ASCII et MBCS, un caractère null d’un octet ('\0') a la valeur 0x00 et représente le caractère null de fin.
Un jeu de caractères multioctets peut comporter à la fois des caractères de 1 octet et 2 octets. Une chaîne de caractères multioctets peut contenir un mélange de caractères à octet unique et double octet. Un caractère codé sur deux octets est constitué d’un octet de tête et d’un octet de fin. Dans un jeu de caractères multioctets, les octets de tête sont compris dans une plage et les octets de fin dans une autre. Lorsque ces plages se chevauchent, vous devrez peut-être évaluer le contexte pour déterminer si un octet donné fonctionne comme un octet de prospect ou un octet de fin.
Voir aussi
Internationalisation
Routines du runtime C universel par catégorie