Caractères codés UTF-8, UTF-16, ISO-8859-1, UCS-2

Caractères codés UTF-8, UTF-16, ISO-8859-1, UCS-2

Messagepar JPL » 13 Février 2012, 19:15

:)
Pour mkd* les codes ne vont pas trop changer, car il sont prévus pour les langages de programmation ASCII (7 bits) voire ASCII étendu (8 bits) pour certains documents.
Les commentaires sont repérés par les caractères : '/', '*', '#', '%', etc. qui sont tous des caractères ASCII codés sur les 7 premiers bits d'un octet. Donc rien ne change (pour l'instant). vu que les codes sont les mêmes pour toutes ces normes. mkd* se contente de recopier tous les octets des commentaires et ne prévoit pas de détecter les caractères qui composent les commentaires.
Seul UTF-16 (2 octets minimum) nous obligerait à réviser de nos codes source. Cette norme ne semble pas être d'actualité car ce codage occuperait plus de place pour le stockage des informations.
Donc pas de changement pour les codes :!:

ASCII est codé sur 7 bits
ISO-8859-1 est codé fixe sur 8 bits (1 octet)
UTF-8 multilingue est codé variable sur 1 à 6 octets.
UCS-2 de Windows nécessite une option spéciale de compilation et n'est pas un codage reconnu par tous, ce n'est pas une norme.

Références :
Commentaires sur les chaînes de caractères
Correspondances des codes UTF-8, UTF-16.

mkd* : mkd, mkdcpp, mkdcppw, mkdasm, etc.
Dernière édition par JPL le 13 Février 2012, 19:48, édité 6 fois au total.
Raison: mise à jour.
JPL Administrateur
Avatar de l’utilisateur
JPL
Administrateur
 
Messages: 59
Inscrit le: 19 Février 2010, 17:22

Retour vers Discussions générales sur les codes sources

Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit and 2 invités

cron