Inversion of codings of UTF-8 and ASCII characters

Cette page encodée en Unicode (charset=UTF-8) a été mal interprétée par le navigateur en charset=ISO-8859-4: Baltic (ISO-8859-4).

Ã©

UTF-8 => ASCII

Page stockÃŠe en fichier local en format Unicode UTF-8 interprÃŠtÃŠe par erreur en ASCII

�

ASCII => UTF-8

Page stockÃŠe en fichier local en format ASCII interprÃŠtÃŠe par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en Ã©

Il Ã©tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrÃŠ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En rÃ¨gle gÃŠnÃŠrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur Ã l'affichage, le diamant point d'interrogation ou carrÃŠ vide � apparaÃŽt.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrÃŠ vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de prÃŠciser que tous les caractÃ¨res ASCII du code 0 Ã 127 gardent toujours les mÃĒmes codes sans changement quelque soit le codage des caractÃ¨res, ASCII, GBK, Unicode...

Tous les caractÃ¨res ASCII ÃŠtendus du code 0 Ã 255 (2**8=256, uni-octet, mono-byte) peuvent ÃĒtre stockÃŠs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractÃ¨res multi-octet (multi-byte) avec un code supÃŠrieur ou ÃŠgal Ã 256, qui ne peuvent ÃĒtre conservÃŠs que dans un fichier Unicode comme UTF-8, ou bien dans un format spÃŠcifique (code page pays) tel le GBK pour les idÃŠogrammes chinois.

Sur le web, un caractÃ¨re Unicode peut en outre s'exprimer en code entitÃŠ HTML, ainsi stockÃŠ dans un fichier du codage ASCII. Par exemple, l'idÃŠogramme č¯ signifiant Langue, peut ÃĒtre stockÃŠ en mode ASCII par la chaÃŽne 语, composÃŠe uniquement des ampersand &, diÃ¨se #, suivi par des chiffres du numÃŠro dÃŠcimal de ce caractÃ¨re en Unicode, et terminÃŠ par un point-virgule ;.

Citation de Mao pour tester:

ä¸åŊåēå¯šäēēįąģäŊåēčžå¤§įč´ĄįŽīŧ

La Chine doit faire une contribution relativement grande Ã l'HumanitÃŠ !

ŲŲØĒØšŲŲ ØšŲŲ Ø§ŲØĩŲŲ ØĒŲØ¯ŲŲ Ø§ØŗŲØ§ŲØ§ØĒ Ø§ŲØ¨Øą ŲŲØ¨Ø´ØąŲØŠ!

ĐĐ¸ŅĐ°Đš Đ´ĐžĐģĐļĐĩĐŊ ŅĐ´ĐĩĐģĐ°ŅŅ ĐąĐžĐģŅŅĐ¸Đš Đ˛ĐēĐģĐ°Đ´ Đ˛ ŅĐĩĐģĐžĐ˛ĐĩŅĐĩŅŅĐ˛Đž!

ÎÎ¯ÎŊÎą Î¸Îą ĪĪÎĪÎĩÎš ÎŊÎą ĪĪÎŧÎ˛ÎŦÎģÎĩÎš ĪÎĩĪÎšĪĪĪĪÎĩĪÎŋ ĪĪÎˇÎŊ ÎąÎŊÎ¸ĪĪĪĪĪÎˇĪÎą!

ä¸åŊã¯äēēéĄãĢå¤§ããĒč˛ĸįŽãããĻãã ããīŧ

××Ą×× ××Š ×Ē×¨××× ××××× ××× ××Š××Ē!

ā¤āĨā¤¨ ā¤Žā¤žā¤¨ā¤ĩ ā¤ā¤žā¤¤ā¤ŋ ā¤āĨ ā¤˛ā¤ŋā¤ ā¤ā¤ ā¤Ŧā¤Ąā¤ŧā¤ž ā¤¯āĨā¤ā¤Ļā¤žā¤¨ ā¤ā¤°ā¤¨ā¤ž ā¤ā¤žā¤šā¤ŋā¤!

ā¸ā¸ĩā¸ā¸ā¸§ā¸Ŗā¸ā¸°āšā¸Ģāšā¸Ąā¸ĩā¸Ēāšā¸§ā¸ā¸Ŗāšā¸§ā¸Ąā¸Ąā¸˛ā¸ā¸ā¸ļāšā¸āšā¸ā¸ˇāšā¸ā¸Ąā¸ā¸¸ā¸Šā¸ĸā¸ā¸˛ā¸ā¸´!

ÚÛŲ Ø¨Ø§ÛØ¯ ØŗŲŲ Ø¨ÛØ´ØĒØąÛ Ø¨Ų Ø§ŲØŗØ§Ų ØąØ§!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockÃŠe dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffÃŠrents codages. Elle peut devenir illisible si le codage diffÃ¨re trop. Il faut revenir en UTF-8 si vous avez mal Ã la tÃĒte. Testez vous-mÃĒme sur votre navigateur en cliquant sur les liens suivants:

Currencies |

Clock |

Translation |

Dictionaries |

Writing |

Encode

Inversion of codings of UTF-8 and ASCII characters

Citation de Mao pour tester:

Give us feedback (1)

Want to come? | Call us 7/7 ☎ 00 33 467 790 487 (Phone)