Caratteri multibyte e wide
Un carattere multibyte è un carattere composto da sequenze di uno o più byte. Ogni sequenza di byte rappresenta un singolo carattere nel set di caratteri esteso. I caratteri multibyte vengono utilizzati nei set di caratteri, ad esempio Kanji.
I caratteri "wide" sono codici carattere multilingue costituiti sempre da 16 bit. Il tipo per le costanti carattere è char
, mentre per i caratteri "wide" il tipo è wchar_t
. Poiché i caratteri "wide" vengono sempre rappresentati con dimensione fissa, l'utilizzo di tali caratteri semplifica la programmazione con i set di caratteri internazionali.
Il valore letterale stringa a caratteri "wide" L"hello"
diventa una matrice di sei Integer di tipo wchar_t
.
{L'h', L'e', L'l', L'l', L'o', 0}
La specifica Unicode è una specifica per caratteri "wide". Le routine di libreria di runtime per la conversione tra caratteri multibyte e "wide" includono mbstowcs
, mbtowc
, wcstombs
e wctomb
.