Table des caractères Unicode/U0000

bloc Unicode (U+0000-007F) qui contient les mêmes caractères que l'ASCII

Table des caractères Unicode U+0000 à U+007F (0 à 127 en décimal).

Commandes C0 et latin de base (Unicode 1.1)Modifier

Utilisés pour l’alphabet latin et certains symboles et signes de ponctuation. Ce sous-ensemble contient tous les caractères invariants des jeux de caractères ISO/CEI 646, les positions variantes correspondant à la version américaine (US-ASCII), compatible avec le jeu de caractère ISO/CEI 8859-1.

Les caractères U+0000 à U+001F et U+007F sont des caractères de contrôle C0, et seuls quelques-uns (U+0009, U+000A, U+000D) sont normalisés pour le codage de textes et ont un comportement bien défini par Unicode (les autres sont ignorables dans les recherches de texte et leur usage n’est pas recommandé, car ils dépendent de protocoles spécifiques). Le caractère U+0020 (espace) est parfois aussi considéré comme un caractère de commande de format.

Table des caractèresModifier

 v · d · m 
en
fr
0123456789ABCDEF
U+0000  
NUL
 
SOH
 
STX
 
ETX
 
EOT
 
ENQ
 
ACK
 
BEL
 
BS
 
HT
 
LF
 
VT
 
FF
 
CR
 
SO
 
SI
U+0010  
DLE
 
DC1
 
DC2
 
DC3
 
DC4
 
NAK
 
SYN
 
ETB
 
CAN
 
EM
 
SUB
 
ESC
 
FS
 
GS
 
RS
 
US
U+0020  
SP
! " # $ % & ' ( ) * + , - . /
U+0030 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U+0040 @ A B C D E F G H I J K L M N O
U+0050 P Q R S T U V W X Y Z [ \ ] ^ _
U+0060 ` a b c d e f g h i j k l m n o
U+0070 p q r s t u v w x y z { | } ~  
DEL

HistoriqueModifier

Version initiale Unicode 1.1Modifier

C'est la version actuelle, qui n’a pas été modifiée depuis. Elle est basée sur la variante américaine (US-ASCII) de la norme ISO/CEI 646, dont elle étend l'ancien codage sur 7 bits seulement avec une identité des valeurs numériques des points de code Unicode/ISO/CEI 10646 et des valeurs des codets de l’ancienne norme.

Voir aussiModifier

Sources externesModifier

Articles connexesModifier

Notes et référencesModifier

  1. DerivedAge.txt, base de données sur le site Unicode.