ASCII 和 UTF-8 内容的倒置效果

Cette page encodée en ANSI/ASCII (charset=Windows-1252) a été mal interprétée par le navigateur en charset=Windows-1255: Hebrew (Windows-1255).

Ã©

UTF-8 => ASCII

Page stockֳ©e en fichier local en format Unicode UTF-8 interprֳ©tֳ©e par erreur en ASCII

�

ASCII => UTF-8

Page stockֳ©e en fichier local en format ASCII interprֳ©tֳ©e par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en Ã©

Il Ã©tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrי vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En rטgle gיnיrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur א l'affichage, le diamant point d'interrogation ou carrי vide � apparaמt.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrי vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de prיciser que tous les caractטres ASCII du code 0 א 127 gardent toujours les mךmes codes sans changement quelque soit le codage des caractטres, ASCII, GBK, Unicode...

Tous les caractטres ASCII יtendus du code 0 א 255 (2**8=256, uni-octet, mono-byte) peuvent ךtre stockיs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractטres multi-octet (multi-byte) avec un code supיrieur ou יgal א 256, qui ne peuvent ךtre conservיs que dans un fichier Unicode comme UTF-8, ou bien dans un format spיcifique (code page pays) tel le GBK pour les idיogrammes chinois.

Sur le web, un caractטre Unicode peut en outre s'exprimer en code entitי HTML, ainsi stockי dans un fichier du codage ASCII. Par exemple, l'idיogramme 语 signifiant Langue, peut ךtre stockי en mode ASCII par la chaמne 语, composיe uniquement des ampersand &, diטse #, suivi par des chiffres du numיro dיcimal de ce caractטre en Unicode, et terminי par un point-virgule ;.

Citation de Mao pour tester:

中国应对人类作出较大的贡献！

La Chine doit faire une contribution relativement grande l''Humanitי!

ويتعين على الصين تقديم اسهامات اكبر للبشرية!

Китай должен сделать больший вклад в человечество!

Κίνα θα πρέπει να συμβάλει περισσότερο στην ανθρωπότητα!

中国は人類に大きな貢献をしてください！

בסין יש תרומה גדולה לאנושות!

चीन मानव जाति के लिए एक बड़ा योगदान करना चाहिए!

จีนควรจะให้มีส่วนร่วมมากขึ้นเพื่อมนุษยชาติ!

چین باید سهم بیشتری به انسان را!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockיe dans le disque dur en format ANSI/ASCII. Mais je vous propose de l'afficher en diffיrents codages. Elle peut devenir illisible si le codage diffטre trop. Il faut revenir en ASCII si vous avez mal א la tךte. Testez vous-mךme sur votre navigateur en cliquant sur les liens suivants:

ASCII 和 UTF-8 内容的倒置效果

Citation de Mao pour tester:

זה¾›וי¦ˆז„ט§ (0)

זƒ³ז¥ו—ן¼ | ט¯·7/7ח”µט¯ט”ח³» ☎ 00 33 467 790 487 (ח”µט¯)

ASCII 和 UTF-8 内容的倒置效果

Citation de Mao pour tester:

זה¾›וי¦ˆז„ט§ (0)

זƒ³ז¥ו—ן¼ | ט¯·7/7ח”µט¯ט”ח³» ☎ 00 33 467 790 487 (ח”µט¯)

זה¾›וי¦ˆז„ט§ (0)

זƒ³ז¥ו—ן¼ | ט¯·7/7ח”µט¯ט”ח³» ☎ 00 33 467 790 487 (ח”µט¯)