Neste artigo
O que é ASCII?
ASCII (American Standard Code for Information Interchange) est un standard d'encodage de caractères publié en 1963 qui attribue des valeurs numériques à 128 caractères. Il comprend 33 caractères de contrôle (codes 0-31 et 127), un caractère espace (code 32) et 94 caractères imprimables incluant lettres, chiffres et ponctuation.
L'ASCII est devenu le fondement de l'encodage de texte moderne. Les 128 premiers points de code Unicode sont identiques à l'ASCII, assurant la rétrocompatibilité. Chaque programmeur rencontre les valeurs ASCII en travaillant avec la manipulation de caractères, les protocoles binaires ou la validation de données.
Como funciona a codificação ASCII
L'ASCII utilise 7 bits pour représenter chaque caractère, permettant exactement 128 valeurs uniques (0 à 127). L'encodage est divisé en caractères de contrôle, caractères imprimables et des plages organisées pour les chiffres, les majuscules et les minuscules.
- Caractères de contrôle (0-31, 127) — codes non imprimables comme NULL (0), TAB (9), LF (10), CR (13) et ESC (27) qui contrôlent le traitement du texte
- Plage imprimable (32-126) — espace (32), chiffres 0-9 (48-57), majuscules A-Z (65-90), minuscules a-z (97-122), et symboles de ponctuation
- Motifs de conception — les majuscules et minuscules diffèrent exactement de 32 (bit 5), rendant la conversion de casse une opération sur un seul bit
Experimente gratuitamente — sem cadastro
Explorar a tabela ASCII →Quando usar uma referência ASCII
Avoir la table ASCII à portée de main est essentiel pour de nombreuses tâches courantes de programmation et de débogage.
- Validation de caractères — vérifier si un octet tombe dans la plage ASCII imprimable (32-126) lors de l'assainissement des entrées ou de la construction de parseurs
- Débogage de protocoles — de nombreux protocoles réseau (HTTP, SMTP, FTP) utilisent du texte ASCII pour les en-têtes et les commandes, connaître les codes de caractères aide à analyser le trafic brut
- Manipulation de bits — la table ASCII révèle des motifs comme la conversion chiffre-vers-valeur (soustraire 48), le basculement de casse (XOR avec 32) et l'identification des caractères de contrôle
Perguntas frequentes
Quelle est la différence entre ASCII et Unicode ?
L'ASCII définit 128 caractères sur 7 bits. Unicode est un sur-ensemble qui définit plus de 149 000 caractères à travers tous les systèmes d'écriture. Les 128 premiers points de code Unicode (U+0000 à U+007F) sont identiques à l'ASCII, donc tout texte ASCII valide est aussi un Unicode UTF-8 valide.
À quoi servent les caractères de contrôle ASCII ?
Les caractères de contrôle (0-31 et 127) étaient conçus à l'origine pour contrôler les machines télétype et les imprimantes. Aujourd'hui, les plus utilisés sont NULL (0) pour la terminaison de chaîne en C, TAB (9) pour l'indentation, LF (10) pour les sauts de ligne Unix, CR (13) pour les sauts de ligne Windows (CR+LF) et ESC (27) pour les séquences d'échappement terminal.
Pourquoi les majuscules et minuscules diffèrent-elles de 32 en ASCII ?
C'est intentionnel. Le A majuscule est 65 (0100 0001) et le a minuscule est 97 (0110 0001) — ils ne diffèrent que par le bit 5. Cela rend la conversion de casse extrêmement efficace : basculer le bit 5 pour changer la casse, définir le bit 5 pour forcer les minuscules, effacer le bit 5 pour forcer les majuscules.