Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrأ� vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En rأ�gle gأ�nأ�rale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur أ l'affichage, le diamant point d'interrogation ou carrأ� vide � apparaأ�t.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrأ� vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prأ�ciser que tous les caractأ�res ASCII du code 0 أ 127 gardent toujours les mأ�mes codes sans changement quelque soit le codage des caractأ�res, ASCII, GBK, Unicode...
Tous les caractأ�res ASCII أ�tendus du code 0 أ 255 (2**8=256, uni-octet, mono-byte) peuvent أ�tre stockأ�s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractأ�res multi-octet (multi-byte) avec un code supأ�rieur ou أ�gal أ 256, qui ne peuvent أ�tre conservأ�s que dans un fichier Unicode comme UTF-8, ou bien dans un format spأ�cifique (code page pays) tel le GBK pour les idأ�ogrammes chinois.
Sur le web, un caractأ�re Unicode peut en outre s'exprimer en code entitأ� HTML, ainsi stockأ� dans un fichier du codage ASCII. Par exemple, l'idأ�ogramme و� signifiant Langue, peut أ�tre stockأ� en mode ASCII par la chaأ�ne 语, composأ�e uniquement des ampersand &, diأ�se #, suivi par des chiffres du numأ�ro dأ�cimal de ce caractأ�re en Unicode, et terminأ� par un point-virgule ;.
ل�م�م�م��ل��ه�؛ل�م�و�م¤�هو��ه�ُ�
La Chine doit faire une contribution relativement grande أ l'Humanitأ� !
ععظ�ظ�عع ظ�عع ظ�عظ�عع ظ�عظ�عع ظ�ظ�عظ�ع ظ�ظ� ظ�عظ�ظ� ععظ�ظ�ظ�عظ�!
ذذ�رذ�ذ� ذ�ذ�ذ؛ذ�ذ�ذ� رذ�ذ�ذ؛ذ�رر ذ�ذ�ذ؛ررذ�ذ� ذ�ذ�ذ؛ذ�ذ� ذ� رذ�ذ؛ذ�ذ�ذ�رذ�ررذ�ذ�!
خخ�خ�خ� خ�خ� ددخدخ�خ� خ�خ� دد خ�خ�خ،خ؛خ�خ� دخ�دخ�ددددخ�دخ؟ ددخ�خ� خ�خ�خ�دددددخ�دخ�!
ل�م�ك�ل��ى�ك�م¤�كك�و��ه�ككك�كك ككُ�
طط�طط طط� ط�ط�ططط ططططط ططط طط�طط�!
ـ¤ـ�ـ¤� ـ¤�ـ¤�ـ¤�ـ¤� ـ¤ـ¤�ـ¤¤ـ¤؟ ـ¤ـ� ـ¤�ـ¤؟ـ¤ ـ¤ـ¤ ـ¤،ـ¤�ـ¤�ـ¤� ـ¤�ـ�ـ¤ـ¤�ـ¤�ـ¤� ـ¤ـ¤�ـ¤�ـ¤� ـ¤ـ¤�ـ¤�ـ¤؟ـ¤!
ـ�ـ��ـ�ـ�ـ��ـ��ـ�ـ��ـ�ـ��ـ�ـ��ـ��ـ��ـ�ـ��ـ�ـ��ـ�ـ��ـ��ـ��ـ��ـ�ـ�ـ��ـ�ـ�ـ�ـ�ـ��ـ�ـ�ـ��ـ�ـ��ـ��ـ��ـ�ـ��ـ�ـ��!
غ�ع ظ�ظ��ظ� ظ�عع ظ��ظ�ظ�ظ�� ظ�ع ظ�عظ�ظ�ع ظ�ظ�!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockأ�e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffأ�rents codages. Elle peut devenir illisible si le codage diffأ�re trop. Il faut revenir en UTF-8 si vous avez mal أ la tأ�te. Testez vous-mأ�me sur votre navigateur en cliquant sur les liens suivants:
[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).