Table des caractères Unicode/U0100
Table des caractères Unicode U+0100 à U+017F (256 à 383 en décimal).
Latin étendu – A (Unicode 1.0.0 à 1.1)
modifierCe sous-ensemble complète le support de la majorité des langues d’Europe occidentale ou centrale à écriture latine, avec des caractères absents des jeux latin basique et latin-1 étendu. On y trouve la plupart des caractères des autres jeux latins étendus ISO/CEI 8859, notamment les caractères manquant dans le jeu étendu latin-1 pour les langues européennes occidentales.
Table des caractères
modifier en fr | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0100 | Ā | ā | Ă | ă | Ą | ą | Ć | ć | Ĉ | ĉ | Ċ | ċ | Č | č | Ď | ď |
U+0110 | Đ | đ | Ē | ē | Ĕ | ĕ | Ė | ė | Ę | ę | Ě | ě | Ĝ | ĝ | Ğ | ğ |
U+0120 | Ġ | ġ | Ģ | ģ | Ĥ | ĥ | Ħ | ħ | Ĩ | ĩ | Ī | ī | Ĭ | ĭ | Į | į |
U+0130 | İ | ı | IJ | ij | Ĵ | ĵ | Ķ | ķ | ĸ | Ĺ | ĺ | Ļ | ļ | Ľ | ľ | Ŀ |
U+0140 | ŀ | Ł | ł | Ń | ń | Ņ | ņ | Ň | ň | ʼn | Ŋ | ŋ | Ō | ō | Ŏ | ŏ |
U+0150 | Ő | ő | Œ | œ | Ŕ | ŕ | Ŗ | ŗ | Ř | ř | Ś | ś | Ŝ | ŝ | Ş | ş |
U+0160 | Š | š | Ţ | ţ | Ť | ť | Ŧ | ŧ | Ũ | ũ | Ū | ū | Ŭ | ŭ | Ů | ů |
U+0170 | Ű | ű | Ų | ų | Ŵ | ŵ | Ŷ | ŷ | Ÿ | Ź | ź | Ż | ż | Ž | ž | ſ |
Historique
modifierVersion initiale Unicode 1.0.0
modifier0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0100 | Ā | ā | Ă | ă | Ą | ą | Ć | ć | Ĉ | ĉ | Ċ | ċ | Č | č | Ď | ď |
U+0110 | Đ | đ | Ē | ē | Ĕ | ĕ | Ė | ė | Ę | ę | Ě | ě | Ĝ | ĝ | Ğ | ğ |
U+0120 | Ġ | ġ | Ģ | ģ | Ĥ | ĥ | Ħ | ħ | Ĩ | ĩ | Ī | ī | Ĭ | ĭ | Į | į |
U+0130 | İ | ı | IJ | ij | Ĵ | ĵ | Ķ | ķ | ĸ | Ĺ | ĺ | Ļ | ļ | Ľ | ľ | Ŀ |
U+0140 | ŀ | Ł | ł | Ń | ń | Ņ | ņ | Ň | ň | ʼn | Ŋ | ŋ | Ō | ō | Ŏ | ŏ |
U+0150 | Ő | ő | Œ | œ | Ŕ | ŕ | Ŗ | ŗ | Ř | ř | Ś | ś | Ŝ | ŝ | Ş | ş |
U+0160 | Š | š | Ţ | ţ | Ť | ť | Ŧ | ŧ | Ũ | ũ | Ū | ū | Ŭ | ŭ | Ů | ů |
U+0170 | Ű | ű | Ų | ų | Ŵ | ŵ | Ŷ | ŷ | Ÿ | Ź | ź | Ż | ż | Ž | ž |
Compléments Unicode 1.1
modifier0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0170 | ſ |
Voir aussi
modifierLiens externes
modifier- (en) [PDF] Latin Extended-A, tableau sur le site Unicode.
- (fr) [PDF] Latin étendu A, tableau sur le site Unicode.
Articles connexes
modifier- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Latin étendu – extensions phonétiques
- Latin étendu – extensions phonétiques – supplément
- Diacritiques – supplément
- Latin étendu – supplément
- Ponctuation générale
- Exposants et indices
- Symboles de type lettre
- Formes numérales
- Opérateurs mathématiques
- Alphanumériques cerclés
- Latin étendu – C
- Lettres modificatives de ton
- Latin étendu – D
- Latin étendu – E
- Formes de présentation alphabétiques
- Demi-signes combinatoires
- Formes de demi et pleine chasse
- Latin étendu – F
- Symboles antiques
- Supplément alphanumérique cerclé
- Latin étendu – G
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte (codage Unicode 1.0.0 partiellement obsolète, car 13 caractères ont ensuite été supprimés ou redéfinis dans Unicode 1.1, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.0)
- Cyrillique (codage Unicode 1.0.0 partiellement obsolète, car 4 caractères ont ensuite été supprimés dans Unicode 1.1), même si ces caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
- Arménien
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï (codage Unicode 1.0.0 partiellement obsolète, car des caractères ont ensuite été standardisés différemment dans Unicode 1.1)
- Lao (ou laotien) (codage Unicode 1.0.0 partiellement obsolète, car des caractères ont ensuite été standardisés différemment dans Unicode 1.1)
- Tibétain (codage Unicode 1.0.0 obsolète, car tous ces caractères initialement définis de U-1000 à U-104F ont ensuite été supprimés dans Unicode 1.1 (remplacé en Unicode 3.0 par le bloc « Birman » ; les caractères tibétains ont ensuite été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0)
- Géorgien – assomtavrouli et mkhédrouli
- Ponctuation générale
- Exposants et indices
- Symboles monétaires
- Signes combinatoires pour des symboles
- Symboles de type lettre
- Formes numérales
- Flèches
- Opérateurs mathématiques
- Signes techniques divers (codage Unicode 1.0.0 partiellement obsolète, car 2 caractères ont ensuite été supprimés dans Unicode 1.0.1)
- Pictogrammes de commande
- Reconnaissance optique de caractères (OCR)
- Symboles alphanumériques délimités
- Filets
- Pavés
- Formes géométriques
- Symboles divers
- Casseau
- Symboles et ponctuations unifiés CJC
- Hiragana
- Katakana
- Bopomofo
- Hangûl (ou hangeul) – jamos de compatibilité
- Kanboun
- Lettres et mois unifiés CJC délimités
- Compatibilité CJC
- Hangûl (ou hangeul) – syllabes coréennes (codage Unicode 1.0.0 partiellement obsolète, car tous ces caractères ont été initialement publiés sans noms standardisé qui ont ensuite été définis dans Unicode 1.1)
- Zone à usage privée (codage Unicode 1.0.0 partiellement obsolète, car le bloc initialement défini de U+E800 à U-FDFF a ensuite été réajusté de U+E000 à U-F7FF dans un erratum publié en annexe dans Unicode 1.0.1)
- Formes de compatibilité unifiés CJC
- Petites variantes de forme
- Formes de présentation arabes – B
- Formes de demi-chasse et de pleine chasse
- Caractères spéciaux (codage Unicode 1.0.0 partiellement obsolète, car 1 caractère a été initialement codé dans Unicode 1.0.0 avec un nom standardisé qui a ensuite été modifié dans Unicode 1.0.1)
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de compatibilité unifiés CJC
Caractères ajoutés dans des blocs existants :
Caractères supprimés dans des blocs existants :
- Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
Notes et références
modifier- Reconstructed UnicodeData.txt (1.0.0), base de données sur le site Unicode.
- DerivedAge.txt, base de données sur le site Unicode.