Table des caractères Unicode/U0000
Cette page contient des caractères spéciaux ou non latins. Si certains caractères de cet article s’affichent mal (carrés vides, points d’interrogation, etc.), consultez la page d’aide Unicode.
Table des caractères Unicode U+0000 à U+007F (0 à 127 en décimal).
Commandes C0 et latin de base (Unicode 1.1)Modifier
Utilisés pour l’alphabet latin et certains symboles et signes de ponctuation. Ce sous-ensemble contient tous les caractères invariants des jeux de caractères ISO/CEI 646, les positions variantes correspondant à la version américaine (US-ASCII), compatible avec le jeu de caractère ISO/CEI 8859-1.
Les caractères U+0000 à U+001F et U+007F sont des caractères de contrôle C0 (ou de commandes, formalisés dans la norme ISO 6429) et seuls quelques-uns (U+0009, U+000A, U+000D) sont normalisés pour le codage de textes et ont un comportement bien défini par Unicode (les autres sont ignorables dans les recherches de texte et leur usage n’est pas recommandé, car ils dépendent de protocoles spécifiques). Le caractère U+0020 (espace) est parfois aussi considéré comme un caractère de commande de format.
Table des caractèresModifier
en fr | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0000 | NUL |
SOH |
STX |
ETX |
EOT |
ENQ |
ACK |
BEL |
BS |
HT |
LF |
VT |
FF |
CR |
SO |
SI |
U+0010 | DLE |
DC1 |
DC2 |
DC3 |
DC4 |
NAK |
SYN |
ETB |
CAN |
EM |
SUB |
ESC |
FS |
GS |
RS |
US |
U+0020 | SP |
! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+0030 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+0040 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
U+0050 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
U+0060 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
U+0070 | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
HistoriqueModifier
Version initiale Unicode 1.0Modifier
C'est la version actuelle, qui n’a pas été modifiée depuis l’unification d’Unicode, dans sa première version stable 1.1, avec la norme révisée ISO/CEI 10646-1 qui avait fait les mêmes choix antérieurs. Elle est basée sur la variante américaine (US-ASCII) de la norme ISO/CEI 646, dont elle étend l'ancien codage sur 7 bits seulement avec une égalité des valeurs numériques des points de code Unicode/ISO/CEI 10646 et des valeurs des codets de l’ancienne norme.
Voir aussiModifier
Liens externesModifier
- (en) [PDF] C0 Controls and Basic Latin, tableau sur le site Unicode.
- (fr) [PDF] Commandes C0 et latin de base, tableau sur le site Unicode.
Articles connexesModifier
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Grec et copte
- Arménien
- Hébreu
- Arabe
- Syriaque
- N’ko
- Samaritain
- Mandéen
- Arabe étendu – B
- Dévanâgarî
- Bengalî
- Singhalais
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Syllabaires autochtones canadiens
- Ogam
- Runes (ou futhark)
- Hanounóo
- Khmer
- Mongol (ou bitchig)
- Limbou
- Bougui (ou bouguinais, bugi, lontara)
- Taï tham (ou lanna)
- Balinais
- Batak
- Lepcha
- Ol tchiki
- Extensions védiques
- Ponctuation générale
- Exposants et indices
- Symboles techniques divers
- Casseau
- Symboles mathématiques divers – A
- Symboles mathématiques divers – B
- Copte
- Tifinaghe
- Ponctuation – supplément
- Symboles et ponctuation CJC
- Katakana
- Lissou (ou lisu, Fraser)
- Vaï
- Cyrillique étendu – B
- Bamoun (ou bamoum, shü-mom)
- ’Phags pa
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Rejang
- Javanais
- Cham
- Taï viêt
- Meitei mayek
- Formes de présentation arabes – A
- Formes verticales
- Formes de compatibilité CJC
- Petites variantes de forme
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Ougaritique
- Cunéiforme persépolitain (vieux perse)
- Araméen impérial
- Phénicien
- Lydien
- Kharochthî
- Sud-arabique antique
- Avestique
- Yézidi
- Brâhmî
- Kaïthî (ou kayathi)
- Multanais (ou multanî)
- Dévanagari étendu – A
- Cunéiforme – nombres et ponctuation
- Mrou
- Vah bassa
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- Arabe étendu – B
- Bengalî
- Goudjarâtî
- Tamoul
- Thaï
- Khmer (ou cambodgien)
- Symboles monétaires
- Formes numérales communes indiennes
- Arabe – formes de présentation – A (3e partie)
- Petites variantes de forme
- Formes de demi et pleine chasse
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Ponctuation générale
- Symboles de type lettre
- Flèches
- Opérateurs mathématiques
- Signes techniques divers
- Symboles mathématiques divers – A
- Flèches – supplément A
- Flèches – supplément B
- Symboles mathématiques divers – B
- Opérateurs mathématiques – supplément
- Petites variantes de forme
- Formes de demie et pleine chasse
- Arabe – symboles mathématiques alphabétiques
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- N’ko
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarâtî (ou gujrâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Éthiopien
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Limbou
- Nouveau taï-lue
- Khmers (ou cambodgien) – symboles
- Taï tham (ou lanna)
- Balinais
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Exposants et indices
- Formes numérales
- Alphanumériques délimités
- Casseau
- Ponctuation CJC
- Kanboun
- Lettres et mois CJC délimités
- Compatibilité CJC
- Vaï
- Bamoun
- Formes numériques communes indiennes
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Javanais
- Cham
- Meitei mayek
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Grec – nombres antiques
- Copte – nombres épactes
- Vieil italique
- Gotique
- Cunéiforme persépolitain (vieux perse)
- Osmanya
- Araméen impérial
- Phénicien
- Kharochthî
- Ancien sud-arabique
- Parthe des inscriptions
- Pehlevi des inscriptions
- Hanifi
- Arabe – symboles numéraux rûmîs (chiffres de Fès)
- Brahmî
- Sora sompeng
- Chakma
- Charada
- Tâkrî
- Cunéiforme – nombres et ponctuation
- Mrou
- Chiffres-bâtonnets chinois
- Symboles mathématiques alphanumériques
- Alphanumériques délimités – supplément
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Latin étendu – extensions phonétiques
- Latin étendu – extensions phonétiques – supplément
- Diacritiques – supplément
- Latin étendu – supplément
- Ponctuation générale
- Exposants et indices
- Symboles de type lettre
- Formes numérales
- Opérateurs mathématiques
- Alphanumériques cerclés
- Latin étendu – C
- Lettres modificatives de ton
- Latin étendu – D
- Latin étendu – E
- Formes de présentation alphabétiques
- Demi-signes combinatoires
- Formes de demi et pleine chasse
- Latin étendu – F
- Symboles antiques
- Supplément alphanumérique cerclé
- Latin étendu – G
Nouveaux blocs ajoutés :
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte
- Cyrillique
- Arménien
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Gudjarâtî
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Géorgien – assomtavrouli et mkhédrouli
- Hangûl (ou hangeul) – jamos
- Latin étendu – supplément
- Grec étendu
- Ponctuation générale
- Exposants et indices
- Symboles monétaires
- Signes combinatoires pour des symboles
- Symboles de type lettre
- Formes numérales
- Flèches
- Opérateurs mathématiques
- Signes techniques divers
- Pictogrammes de commande
- Reconnaissance optique de caractères (OCR)
- Symboles alphanumériques délimités
- Filets
- Pavés
- Formes géométriques
- Symboles divers
- Casseau
- Symboles et ponctuations unifiés CJC
- Hiragana
- Katakana
- Bopomofo
- Hangûl (ou hangeul) – jamos de compatibilité
- Kanboun
- Lettres et mois unifiés CJC délimités
- Compatibilité CJC
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Zone à usage privée : 1re partie, 2e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de présentation alphabétiques
- Formes de présentation arabes – A
- Demi-signes combinatoires
- Formes de compatibilité unifiés CJC
- Petites variantes de forme
- Formes de présentation arabes – B
- Formes de demi-chasse et de pleine chasse
- Caractères spéciaux
Notes et référencesModifier
- DerivedAge.txt, base de données sur le site Unicode.