Ouvrir le menu principal

Alphabet arabe

alphabet de la langue arabe

Arabic albayancalligraphy.svg Cette page contient des caractères arabes. Testez votre navigateur afin de vérifier qu'ils s'affichent correctement. En cas de problème, consultez la page d'aide à l'affichage des caractères Unicode.
Article général Pour un article plus général, voir Écriture de l'arabe.

Arabe
Caractéristiques
Type Alphabet consonantique ou Abjad
Langue(s) arabe, variétés d'arabe, persan, baloutche, ourdou, kurde, pachto, sindhi, ouighour et autres
Direction De droite à gauche
Historique
Époque Du Ve siècle jusqu'à nos jours
Système(s) parent(s) Protosinaïtique

 Phénicien
  Araméen
   Hébreu
    Guèze
     Syriaque
      Arabe

Codage
Unicode U+0600 à U+06FF
U+0750 à U+077F
U+FB50 à U+FDFF
U+FE70 à U+FEFF
ISO 15924 Arab

L'alphabet arabe est un abjad, c'est-à-dire d'un système d'écriture ne notant que les consonnes (ou peu s'en faut)[1]. Il comporte initialement 28 lettres et s'écrit horizontalement de droite à gauche. Les diverses langues qu'il sert à noter ont donné lieu à de nombreuses adaptations de l'alphabet arabe à leur système phonologique.

L’écriture arabe courante ne note pas les voyelles, qui peuvent cependant apparaître sous forme de diacritiques dans certains textes à caractère didactique (Coran, apprentissage de la lecture, dictionnaires). De ce fait, un mot écrit en arabe peut généralement admettre plusieurs lectures suivant la répartition (ou l'absence) de voyelles et de redoublement de consonne, et s'apparente souvent à une sténographie : il faut pouvoir lire correctement un texte pour le comprendre, et il faut comprendre un texte pour le lire correctement ; seule une bonne connaissance de la langue permet de déterminer le bon mot en fonction du contexte. Cette faculté de l'écriture arabe découle de la structure consonantique des langues sémitiques, où les consonnes sont généralement porteuses de la sémantique, les voyelles ne dépendant que de la nature lexicale et la fonction grammaticale. De ce fait, l'écriture arabe note plus particulièrement la sémantique d'ensemble, à la manière d'un idéogramme, laissant en grande partie au lecteur le soin de traduire la lecture en langage courant.

Avec l'expansion de l'islam, différentes langues ont adopté le système d'écriture de l'arabe, langue du Coran, et l'usage de l'alphabet arabe s'est progressivement répandu. C'est ainsi que cet alphabet sert également à écrire certaines langues indo-européennes comme le persan, le kashmiri, le sindhi, l'ourdou, le kurde. Il est aussi utilisé en Chine, plus particulièrement dans les provinces du Xinjiang, du Gansu et du Ningxia, ainsi que par différentes minorités chinoises qui ont embrassé l'islam (on parle dans ce dernier cas de xiao'erjing). Anciennement, l'arabe a encore servi à noter certaines langues d'Afrique (swahili, haoussa, wolof, somali), ainsi que le turc jusqu'en 1928.

Cet article ne traite pas de la prononciation de l'arabe, ni de sa transcription.

Carte de répartition de l'utilisation de l'alphabet arabe :
  • Pays où il est le seul alphabet officiel
  • Pays où il est un des alphabets officiels

Histoire

Article détaillé : Histoire de l'alphabet arabe.

On fait remonter cet alphabet à l'araméen dans sa variante nabatéenne ou syriaque, lui-même descendant du phénicien (alphabet qui, entre autres, donne naissance à l'alphabet hébreu, à l'alphabet grec et, partant, au cyrillique, aux lettres latines, etc.). L'écriture arabe primitive est une cursive nabatéenne.

Sur le plan linguistique, l'arabe se rapproche plus des langues notées par l'alphabet sudarabique, dont notamment la liste de consonnes est beaucoup plus complète[2]. Bien que l'arabe appartient à l'aire linguistique sud-arabique, les tribus nomades d'Arabie centrale ont adopté pour sa notation l'alphabet utilisé au nord de cette région, dans le croissant fertile, qui était culturellement et économiquement dominant à l'époque. De manière significative, la première écriture arabe attestée a été le kufi, écriture du centre culturel de Koufa située sur les rives de l'Euphrate.

Le tableau ci-contre permet de comparer les évolutions subies par le tracé des lettres depuis le prototype araméen jusqu'aux écritures nabatéenne et syriaque. L'arabe est placé entre les deux à des fins de lisibilité et non pour marquer une évolution chronologique ; l’hébreu moderne a été ajouté à fins de comparaison avec le nabatéen.

 

L'arabe étant plus dépendant des voyelles que son modèle nabatéen[2], la nécessité d'indiquer celles-ci s'est fait très rapidement sentir. À cette fin, l'arabe utilisa les trois lettres alif, ya et waw pour indiquer respectivement les voyelles longues â, î et û. Par la suite, le alif perdit complètement son rôle de consonne, et la hamza fut introduite comme signe diacritique pour indiquer l'emplacement de cette articulation. De ce fait, l'alphabet arabe n'est qu'imparfaitement un alphabet consonantique :

  • les lettres ya et waw ont conservé leur rôle de semi-consonne, mais peuvent également servir de signe de prolongation des voyelles homologues, ou de support à la hamza ;
  • la lettre alif n'est qu'un signe de prolongation ou de support de hamza, mais n'a pas de valeur propre ;
  • le ya peut également servir de signe de prolongation du a en fin de mot, où il prend la forme ى (alors dénommé ʾalif maqṣūra)
  • et inversement, la hamza n'a pas de place officielle dans cet alphabet bien qu'étant dans la langue une consonne à part entière.

La première attestation d'un texte en alphabet arabe remonte à 512[réf. souhaitée].

Le modèle araméen ayant moins de phonèmes que l'arabe, l'écriture des origines avait dû confondre par une même lettre plusieurs phonèmes de la langue arabe. Ce problème est toujours manifeste de nos jours, dans l'écriture kufi que l'on retrouve dans des inscriptions monumentales et certaines œuvres calligraphiques.

C'est au VIIe siècle qu'on a ajouté des points sur ou sous certaines lettres afin de les différencier. Lors de ces modifications, l'ordre des lettres a été modifié : l'alphabet arabe ne suit plus l'ordre levantin des autres alphabets sémitiques mais regroupe les lettres en fonction de leur forme graphique. Pour les deux lettres q et f, l'usage a été long à s'établir. Au début, durant les deux premiers siècles de l'hégire, le q portait un point au-dessus, et le f n'en avait point. Puis le f reçut un point au-dessous, comme ce fut longtemps le cas dans l'alphabet maghrébin. En fin de comptes, le point du f passa au-dessus, et le q en reçut deux, conformément à l'usage courant[2].

Spécificités

L'alphabet arabe comprend vingt-neuf lettres fondamentales (vingt-huit si l'on exclut la hamza, qui se comporte soit comme une lettre à part entière soit comme un diacritique). Il se lit et s'écrit de droite à gauche, comme beaucoup d'écritures sémitiques utilisant des abjads (syriaque, hébreu, etc).

Dans les nombres, l'arabe énonce l'unité avant la dizaine (comme en allemand), donc écrit d'abord les unités puis les dizaines (puis les centaines, etc.) de droite à gauche ; de ce fait, les nombres ainsi écrits ont leurs chiffres dans le même ordre que dans les langues latines, avec les unités à droite.

De nombreuses lettres sont similaires par leur squelette (rasm) et ne se distinguent que par des points utilisés comme diacritiques au-dessus ou au-dessous de la ligne d'écriture (ـبـ ـتـ ـثـ ـنـ ـيـ). Il existe 18 formes de base (rasm). Les adaptations de l'alphabet arabe à d'autres langues se font sur ces mêmes formes de base, le plus souvent par l'ajout de points.

Il n'y a pas de différence entre les lettres manuscrites et les lettres imprimées, et les notions de lettre majuscule et lettre minuscule n'existent pas : l'écriture est donc monocamérale.

En revanche, la plupart des lettres s'attachent entre elles, même en imprimerie, et leur graphie peut changer selon qu'elles sont en position initiale (liées à la lettre suivante mais pas la précédente), médiane (liées des deux côtés), finale (liée à la précédente mais pas la suivante) ou qu'elles sont isolées (sans liaison) : on parle de variantes contextuelles. La liaison peut être plus ou moins allongée sans changer la lecture des lettres : كتب (ktb), normalement compacté, peut également être rendu كـــتـــب en allongeant les liaisons, par exemple pour créer un effet calligraphique, ou pour des raisons de justification de mise en page.

Par ailleurs, six lettres (و ز ر ذ د ا) ne s'attachent jamais à la lettre suivante, de sorte qu'un mot peut être entrecoupé d'une ou plusieurs espaces. Ces séparations entre lettres ne s'attachant pas à l'intérieur des mots sont moins grandes que celles séparant les mots. Par exemple, Paris s'écrit باريس (bârîs), où ni le A long ni le R ne se lie à la lettre suivante (s'il fallait allonger la graphie par des liaisons, باريس peut s'écrire بــــاريــــس, mais les intervalles entre "a" et "r" ou entre ""r" et "i", qui sont des séparations, ne peuvent pas être allongés).

L'alphabet arabe étant un abjad, le lecteur doit connaître la structure de la langue pour restituer les voyelles. Dans le cas de l'arabe, les voyelles d'un mot se répartissent au sein de la racine consonantique, suivant les règles de grammaire.

Dans les éditions du Coran ou les ouvrages didactiques, cependant, on utilise une notation vocalique plus ou moins précise sous forme de diacritiques. Il existe, de plus, dans de tels textes dits « vocalisés », une série d'autres diacritiques de syllabation dont les plus courants sont l'indication de l'absence de voyelle (sukūn) et la gémination des consonnes (šadda).

Lettres de l'alphabet

Alphabet de base

La forme des lettres est variable suivant qu'elles sont isolées, ou en position initiale, médiane ou finale. Ces différentes formes sont données dans le tableau ci-dessous.

La notion de « initiale » ou « finale » ne se réfère cependant pas uniquement aux séparations entre mots de la langue. Dans un même mot, certaines lettres ne se lient jamais avec les suivantes, et sont donc normalement en forme « finale » ; et la suivante est alors en forme « initiale », y compris à l'intérieur d'un mot.

La plupart des lettres n'ont fondamentalement que deux formes, qui sont généralement « isolées + finales » et « initiales + médianes ». Les lettres qui impliquent quatre formes distinctes sont limitées, à savoir le ع (ʿayn) et le غ (ġayn), ainsi que le ه (hāʾ).

Isolée Nom Isolée

finale, médiane, initiale

DIN-31635 EI Phonème en arabe
ء hamza أ, إ, ؤ, ئ ʾ ʔ
ا Alif اـــــا ā / â ā / â
ب بـــــبـــــب b b b
ت تـــــتـــــة t t t
ث Thā ثـــــثـــــث th θ
ج Jīm جـــــجـــــج ǧ dj
ح Ḥā حـــــحـــــح ħ
خ Khā خـــــخـــــخ ḫ / ẖ kh x
د Dāl دـــــــد d d d
ذ Dhāl ذـــــــذ dh ð
ر رــــــر r r r
ز Zāy زـــــــز z z z
س Sīn ســـــســـــس s s s
ش Shīn شـــــشـــــش š sh ʃ
ص Sād صـــــصـــــص
ض Ḍād ضـــــضـــــض
ط Ṭā طـــــطـــــط
ظ Ẓā ظـــــظـــــظ ðˁ
ع Ayn عـــــعـــــع ʿ / ‘ ʿ / ‘ ʕ
غ Rhayn غـــــغـــــغ ġ gh ɣ
ف فـــــفـــــف f f f
ق Qāf قـــــقـــــق q q
ك Kāf كـــــكـــــك k k k
ل Lem لـــــلـــــل l l l
م Mīm مـــــمـــــم m m m
ن Nūn نـــــنـــــن n n n
ه هـــــهـــــه h h h
و Wāw وــــــو w w w ou
ي Yāʾ يـــــيـــــي y y j ou

Alif et Hamza

Dans cet alphabet arabe, trois lettres jouent un rôle particulier, le alif, le waw et le ya. Ces trois lettres peuvent servir :

  • De signe de prolongation pour leur voyelle homologue (â pour le alif, û pour le waw, et î pour le ya), jouant alors de rôle de matres lectionis.
  • De support pour l'écriture d'une hamza diacritique.

Ces rôles viennent en sus du rôle de semi-voyelle tenu par le waw et le ya.

Alors que dans le principe toutes les lettres de l'alphabet arabe sont des consonnes et chaque consonne est représentée par une lettre, ce n'est pas le cas pour le alif et la hamza :

  • Le alif n'est pas une consonne mais un signe orthographique, dérivé de la lettre représentant la hamza dans les alphabets d'origine phénicienne.
  • Inversement, la hamza, bien que consonne à part entière, n'a pas de lettre propre et s'écrit (le cas échéant) avec un diacritique.

Quand elle est une lettre radicale, pour représenter une racine dans un dictionnaire, la hamza est toujours représentée par un support alif, et se trouve au début de l'ordre lexicographique ; c'est ce que l'on appelle un alif-hamza. C'est pour cette raison que la hamza est présentée en début d'alphabet dans le tableau ci-dessus, bien que ne faisant techniquement pas partie de la liste des lettres. Cependant, sa lettre de support peut varier suivant le schème appliqué à cette racine, ce qui peut conduire à la confondre avec un waw ou un ya.

Lorsque la hamza est en début de mot, sa lettre de support est toujours un alif, indépendamment de la voyelle effectivement portée. C'est pourquoi l’alif, pour les personnes qui n'ont pas étudié les principes, semble avoir toutes sortes de prononciations, alors qu'en réalité il n'est pas même une lettre, mais un simple support, ou bien le signe d'une contraction en A, ou de la prolongation d'un A bref[3].

Racines et schèmes

Dans leur grande majorité, les mots du vocabulaire arabe dérivent d'une racine, une unité abstraite minimale composée exclusivement de consonnes, le plus souvent trilitère, c'est-à-dire composée de trois consonnes. Ces racines abstraites, de l'ordre de 5 000, sont modulées par des schèmes dont le nombre est de l’ordre de quelques centaines, pour donner les mots effectivement utilisés dans le discours. Les schèmes transforment le radical par des préfixes, des transformations infixes (ajout de consonnes, doublement de consonne, ou transformation de voyelles) et des suffixes.

Par exemple:

  • La racine KTB (« écrire ») croisée avec le schème "*Â*a*a" (« action réciproque ») donne KÂTaBa كاتَبَ, « s’échanger une correspondance »,
  • La même racine KTB (« écrire ») croisée avec un schème "Ma**Û* (participe passif, « ce qui est dans cet état ») donne MaKTÛB مَكتوب, « ce qui est écrit », ⇒ « le destin ».
  • Une autre racine F3L (« réaliser, agir ») croisée avec ce même schème "Ma**U* donne MaF3UL مَفعول, « ce qui est agit » = « patient, passif ».

La construction de familles de mots n'est pas inconnue en français, comme dans la série « lard, larder (action), lardoir (outil ou lieu), lardeur (agent), etc. » ; mais le procédé est systématique et relativement régulier dans les langues sémitiques.

Les mots (nom, verbe, adjectifs) ainsi obtenus sont ensuite déclinés suivant leur fonction grammaticale, suivant un mécanisme similaire de transformation préfixe et suffixe. D’une certaine manière, la racine arabe subit une double déclinaison : l’application d’un schème lexical, donnant l'entrée lexicale théorique, puis celle d’un schème grammatical, donnant la forme effectivement produite dans le discours.

Dans ces langues sémitiques, l'information sémantique essentielle est donc portée par les consonnes, qui contiennent la racine. Les voyelles ne dépendent que du schème, et ne porte qu'une information secondaire sur la fonction lexicale ou grammaticale du mot. Les voyelles ne sont que rarement notées, et si elles le sont, c'est sous la forme de diacritiques : toutes les lettres des tableaux précédents sont des consonnes, contrairement à ce qu'on pourrait croire. De ce fait, la recherche d'un mot (dans un dictionnaire ou un texte) se fait normalement abstraction faite des voyelles et autres diacritiques.

Ordre alphabétique et ordre lexicographique

L'ordre des lettres dans l'alphabet est celui donné ci-dessus. L'alphabet arabe ne suit plus l'ordre levantin des autres alphabets sémitiques, mais regroupe les lettres en fonction de leur forme graphique, et pour une même forme de base, suivant le nombre ou la position des points. L'ordre levantin traditionnel ne se reflète plus que dans la valeur numérique des lettres, donnée ci-après.

Dans les dictionnaires arabes, les mots sont généralement classés en fonction de leur racine. Pour retrouver un mot, il faut donc d'abord identifier sa racine, et donc séparer le mot entre sa racine et le shème qui lui donne forme. Tous les verbes arabes devant être ramenés à une racine, il sera nécessaire que l'on apprenne à bien distinguer les lettres radicales, des lettres serviles ou formatives. Pour faire cette distinction, il faudra procéder par élimination, en attendant que l'habitude fasse reconnaître du premier coup d'oeil les lettres radicales.

Par rapport à leur emploi, les lettres sont ou « radicales », ou « serviles ». Les lettres serviles, ainsi nommées parce qu’elles servent à former les inflexions grammaticales et les dérivés, sont comprises dans les deux mots techniques يَتَسَمُّوا بِفُلْكٍ (qu'ils s'engraissent dans un navire). Toutes les autres lettres s‘appellent radicales, c’est-à-dire qu‘elles ne servent qu'à former des mots radicaux[4].

  • Il y a six lettres réellement serviles : alif et hamza (ا أَ إ), (ت ـَة), mîn م, nûn ن, wâw و et ي.
  • Les grammairiens joignent à ces lettres, réellement formatives, d'autres lettres qui ne sont que des prépositions et conjonctions préfixes ou des pronoms aflixes, ce sont : ت, kâf ك, lem ل, ف et sîn س. Ces particules se joignent effectivement au mot, mais elles n'ont pas plus d'influence sur sa forme caractéristique, que n'en ont chez nous « l' » dans « l'opinion », « d' » dans « place d'arme », etc.[5]

D'autre part, les « lettres faibles » que sont le alif, le waw et le ya peuvent subir diverses transformations. Pour rechercher une racine dans un dictionnaire, il faut savoir que :

  • Quand elle est une lettre radicale, la hamza est toujours représentée par un support alif, et se trouve au début de l'ordre lexicographique. En revanche, dans un mot donné, elle peut prendre comme support l'une des trois lettres faibles, voire être écrite en ligne. Elle figure toujours dans l'écriture, mais toujours par une lettre servile.
  • Quand ils sont lettres radicales, le waw et le ya conservent leur ordre lexicographique en avant-dernière et dernière place. Mais dans l'écriture d'un mot donné, ils sont parfois transformés en un alif, voire peuvent disparaître complètement (racines assimilées, creuses, ou défectives).

Face à un mot inconnu, une lettre radicale fait certainement partie de la racine ; en revanche une lettre servile peut correspondre à une lettre ajoutée au radical par un shème, ou être une lettre radicale. Inversement, la racine peut être faible (racines assimilées, creuses, ou défectives), et une lettre faible peut devoir être rajoutée comme radicale entre deux consonnes déjà identifiées comme radicales.

Autres lettres

Nom Graphie Translittération Son
isolée finale
tāʾ marbūṭa ة ــة h et t / Ø / h / ẗ [t], [h], Ø
ʾalif maqṣūra ى ــى ā / ỳ [(a)ː]
lām ʾalif لا ــلا [l(a)ː]
ʾalif maddah آ آ    
Sources Unicode : Arabe 0600—06FF et formes B de présentation arabes

Tāʾ marbūṭa

Article détaillé : ة.

Le ة tāʾ marbūṭa (« tāʾ bouclé ») ; c'est, historiquement, un dérivé du ت tāʾ et non du ه hāʾ, d'où la présence des deux points suscrits. Il suffit de boucler un tāʾ pour obtenir un tāʾ marbūṭa. Il s'agit d'une consonne, à savoir un /t/ ; toutefois, elle ne se trouve qu'en fin de mot et elle est toujours précédée de la voyelle brève /a/ (qui n'est que rarement écrite). Le son /t/ n'est prononcé que si elle est précédée d'un alif (ا ) ou si les voyelles casuelles finales qui suivent le ta le sont aussi ; or, ces voyelles sont souvent omises dans la prononciation courante. C'est pour cette raison qu'on indique, improprement, que cette lettre vaut [a(t)].

Le tāʾ marbūṭa a une valeur grammaticale en arabe : c'est souvent la désinence du féminin (pour les adjectifs, les substantifs, ainsi que pour la forme féminine des noms propres qui existent au masculin -- par exemple: Samīr / Samīra). Cette lettre peut toutefois terminer des substantifs se référant à des entités clairement masculines, tels que calife (خليفة) ou commandant (dans ce cas, pour la forme plurielle : قائد ج قادة). Désinence finale de substantifs ou d'adjectifs, le tāʾ marbūṭa ne se retrouve donc jamais dans la conjugaison proprement dite des verbes arabes.

Un tāʾ marbūṭa se transforme en « tāʾ ṭāwila » (« long », donc « normal ») lorsque le nom est mis à la forme duelle ou lorsque le mot est suivi d'un morphème, tel que celui de la possession : طاولة - طاولتي (« ma table » ~ « table »)

Dans une prononciation soutenue, on fait entendre à la pause un [h] à la place du [t]. Le tāʾ marbūṭa est rarement transcrit quand il est muet ; seule la translittération en indique généralement la présence (voir plus bas à la section « Translittération »), mais les usages sont très fluctuants. Dans cette encyclopédie, le tāʾ marbūṭa sera noté par ʰ. Voir aussi plus bas à « Types de lecture » pour d'autres détails.

ʾAlif maqṣūra

Article détaillé : ى.

La lettre ى ʾalif maqṣūra ne s'utilise qu'en fin de mot ; c'est une lettre de prolongement pour le phonème /a/. Son nom indique le son obtenu, « ʾalif de prolongement », et non sa forme, puisque la lettre ressemble à un ي yāʾ. Son utilisation est décrite à la section « Voyelles longues et lettres de prolongement ».

Ligature lām ʾalif

Comme ligature linguistique, l’arabe ne connaît que la ligature lâm-alif. Lorsqu'un ل (lām) est suivi d'un ا (ʾalif), il faut remplacer l'ensemble des deux lettres par la ligature لا.

Formes contextuelles Nom
Finale Mediale Initiale Isolée
lām + alif

Alif maddah (voyelle longue, a)

Le Alif maddah se présente ainsi : آ . Il correspond à situation où il faut écrire un « â » long, donc normalement un fatha suivi de la lettre ʾalif de prolongation, accompagné d'une hamza dont le support devrait être un autre ʾalif. Cependant, l'on ne peut écrire deux fois de suite la lettre ʾalif . Dès lors, la parade a été l'ajout d'une sorte de tilde au-dessus de la lettre ʾalif, pour signaler qu'il a la valeur de double lettre (ʾalif).

Le Alif maddah signale donc à la fois la voyelle longue (a) et une hamza. On retrouve cette lettre spécifique notamment dans le mot "coran" : قُرْآن (qurʾān).

Diacritiques

Article détaillé : diacritiques de l'alphabet arabe.

Tel qu'écrit couramment, l'alphabet arabe n'utilise pour ainsi dire pas de diacritiques, outre le point souscrit ou suscrit obligatoire pour distinguer des lettres ambiguës. Pour faciliter la lecture, cependant, et ce dans un cadre didactique ou religieux, de nombreux signes auxiliaires viennent rendre le texte moins ambigu : l'arabe ne notant normalement pas les voyelles, par exemple, ni les géminations ou encore les assimilations, il n'est pas possible à un lecteur débutant de lire à voix haute un texte sans l'aide de ces signes, ou sans une bonne connaissance de la langue.

Voyelles brèves

Celles-ci ne sont pas indiquées autrement que par des diacritiques, et ce seulement pour lever des ambiguïtés (rarement) ou dans les ouvrages didactiques ou religieux.

L'absence de la notation des voyelles brèves rend parfois ambiguë la compréhension des mots, en particulier lorsque ceux-ci sont lus isolés de tout contexte. Notons, par exemple, qu'un mot de trois consonnes tel que كتب (ktb) peut théoriquement se lire, selon le contexte, de 17 manières différentes :

  • un verbe à la 3e personne du masculin singulier de l'accompli actif, simple كَتَبَ (kataba, il a écrit) ou factitif كَتَّبَ (kattaba, il a fait écrire)
  • un verbe à la 3e personne du masculin singulier de l'accompli passif, simple كُتِبَ (kutiba, il a été écrit) ou factitif كُتِّبَ (kuttiba, on l'a fait écrire)
  • un verbe factitif à la 2e personne du masculin singulier de l'impératif كَتِّبْ (kattib, fais écrire)
  • un nom masculin pluriel كُتُب (kutub, livres), pouvant prendre cinq désinences casuelles différentes (Nominatif/Accusatif/Génitif défini, Nominatif/Génitif indéfini)
  • un nom d'action singulier كَتْب (katb, le fait d'écrire), pouvant prendre les cinq mêmes désinences casuelles
  • un syntagme préposition + nom كَتَبّ (ka-tabb, comme un tranchement), défini ou indéfini

Tous ces mots sont discriminés par des voyelles brèves qui la plupart de temps ne sont pas écrites. Il en résulte qu'ils se trouveront tous sous l’orthographe unique كتب (ktb) dans la plupart des textes. C'est donc au lecteur de rajouter mentalement les voyelles nécessaires afin de déterminer le sens véritable du mot en question. Il sera pour cela grandement aidé par le contexte.

Voyelles longues et lettres de prolongement

L'alphabet arabe, bien qu'il soit un abjad, marque systématiquement l'emplacement de voyelles longues. Quatre lettres, dites « de prolongement », sont employées pour indiquer la présence d'une voyelle longue — qui, elle, n'est normalement pas écrite —, ا ʾalif, ى ʾalif maqṣūra (seulement en fin de mot), ي yāʾ, et و wāw. Ces deux dernières sont aussi les semi-consonnes y et w. Il faut remarquer que ces lettres peuvent également servir de support de hamza, donc reflètent une voyelle associée, et sont susceptibles de marquer une diérèse quand elles sont entourées de deux voyelles (voir écriture de la hamza).

Partant, ces signes indiquant les emplacements en question sont alors lus comme s'ils figuraient des voyelles. De sorte, ces lettres, qui sont toutes des consonnes (historiquement pour ا ʾalif), peuvent, d'une certaine manière, remplir le rôle de voyelles longues. On dit alors qu'elles sont des matres lectionis (en latin « mère de la lecture »). D'autres écritures sémitiques, du reste, comme l'alphabet hébreu, retiennent ce procédé. Ceci qui mène certains spécialistes des écritures (comme Thomas Bauer ; cf. bibliographie ci-dessous) à considérer que ces abjads ne sont pas purement consonantiques et qu'ils méritent bien l'appellation d'alphabets, dotés de voyelles.

Dans un texte non vocalisé, ce qui est de loin le cas le plus fréquent, l'on obtient les ambivalences suivantes :

  • ا ʾalif = ā long, ou support de la consonne ʾ (coup de glotte) suivie de a ou d'autres phonèmes;
  • ى ʾalif maqṣūra = ā en fin de mot ;
  • ي yāʾ = ī, ou y, ou support de la consonne ʾ (coup de glotte) ;
  • و wāw = ū, ou w, ou support de la consonne ʾ (coup de glotte) .

En fait, qualifier la semi-consonne de « voyelle » dans ce cas est arbitraire : la structure syllabique de la langue veut au contraire qu'elle soit considérée comme une consonne. La prosodie arabe connaît en effet deux types de syllabes :

  • Les syllabes « courtes », ouvertes (de type consonne + voyelle), que l'arabe écrit par une seule lettre, et dont la voyelle est toujours courte ;
  • Les syllabes « longues », en principe fermée (de type consonne + voyelle + consonne), que l'arabe écrit (généralement) par deux lettres, mais dont un cas particulier est la syllabe longue fermée par la semi-consonne homologue (voyelle longue).

Par rapport à cette structure, il est incohérent de dire que les semi-consonnes y et w représentent dans ce dernier cas des voyelles, ou qu'une séquence comme بَيْ doit se lire comme une diphtongue baï plutôt que comme une voyelle fermée bay. En réalité il n'y a pas de solution de continuité entre le i et le y, ou entre le u et le w. L'arabe décompose logiquement le phonème long en une voyelle suivie de la semi-consonne homologue, par exemple, uw pour le son ū ; comme seule la semi-consonne est écrite, celle-ci semble noter aussi ū.

Dans cette logique, qui veut qu'une syllabe à voyelle longue soit fermée par la consonne homologue, il n'y a pas de semi-consonne qui soit homologue au a. La fermeture de la syllabe est alors matérialisée par un ’alif, qui représente dans ce cas la trace d'une hamza marquant l'arrêt de la vocalisation — de même que pour l'arabe, une syllabe commençant par une voyelle est « en réalité » ouverte par une hamza, supportée par un alif qui par lui-même est muet, ou que la fin de certains mots se terminant par un waw est marquée par un alif muet.

Valeurs numériques des lettres

Article détaillé : Abjad.
Article détaillé : Numération arabe.

L'alphabet arabe ne suit plus l'ordre levantin des autres alphabets sémitiques mais regroupe les lettres en fonction de leur forme graphique. L'intérêt de cet ordonnancement tient à la valeur numérique attribuée à chaque lettre en fonction de sa place dans l'alphabet.

Sur les objets liés aux pratiques mystiques ou scientifiques (astrolabes, globes célestes), ou encore dans les colophons des manuscrits, les chiffres sont parfois donnés sous forme de lettres : on parle de numérotation en abjad.

Valeur Lettre Nom Trans-
litération
1 ا alif ā
2 ب bāʼ b
3 ج jīm j
4 د dāl d
5 ه hāʼ h
6 و wāw w / ū
7 ز zayn/zāy z
8 ح ḥāʼ
9 ط ṭāʼ
       
Valeur Lettre Nom Trans-
litération
10 ي yāʼ y / ī
20 ك kāf k
30 ل lām l
40 م mīm m
50 ن nūn n
60 س sīn s
70 ع ʻayn ʻ
80 ف fāʼ f
90 ص ṣād
       
Valeur Lettre Nom Trans-
litération
100 ق qāf q
200 ر rāʼ r
300 ش shīn sh
400 ت tāʼ t
500 ث thāʼ th
600 خ khāʼ kh
700 ذ dhāl dh
800 ض ḍād
900 ظ ẓāʼ
1000 غ ghayn gh

Lettres non traditionnelles

Article détaillé : Adaptations de l'alphabet arabe.

Dans l'alphabet arabe dit « occidental », la lettre fāʾ était écrite ڢ (au lieu de ف de l'alphabet oriental), tandis que qāf était représentée par ڧ (plutôt que ق). De nos jours, les éditions maghrébines suivent les usages orientaux. Il faut noter pourtant qu'il existe toujours des publications du Coran en style andalou et maghrébin (occidental).

L’alphabet arabe utilise aussi des lettres différentes pour représenter certains sons dans des mots d’emprunts :

Calligraphie

Styles d'écritures

Article détaillé : Styles calligraphiques arabes.

Il existe différents styles calligraphiques. On divise généralement les calligraphies arabes en deux groupes facilement distinguables :

  • les écritures coufiques (ou kufiques), qui se caractérisent par leur caractère anguleux ;
  • les écritures cursives (naskhi), beaucoup plus arrondies.

Ligatures esthétiques

 
Mohammed, écrit avec ou sans ligature esthétique.
Article détaillé : Ligatures arabes.

Il existe d'autres ligatures de ce type, de deux ou trois lettres, voire plus, qui ne sont cependant plus utilisées, sauf dans des compositions soignées et quelques cas figés. On peut encore les rencontrer dans des textes anciens.

On les trouve dans le bloc Unicode dans les Formes A de présentation arabes à partir de U+FBEA, mais ces caractères ne sont pas toujours supportés. Certaines sont représentées dans l'article consacré aux ligatures.

Ponctuation

L'arabe s'écrivant de droite à gauche, les éditions modernes utilisent des signes de ponctuation respectant cette écriture, à savoir :

  • la virgule renversée « ، » (qui permet aussi de ne pas être confondue avec « د », par exemple) ;
  • le point-virgule renversé « ؛ » ;
  • le point d'interrogation inversé « ؟ » ;
  • le point final est noté « . »

Spécifités orthographiques

Écriture de la hamza

Historiquement, la lettre ʾalif notait une occlusive glottale, ou « coup de glotte », transcrite par [ʔ], ce que confirment les alphabets issus de la même origine phénicienne. Or, elle a servi, de la même manière que dans d'autres abjads, avec yāʾ et wāw, de mater lectionis, c'est-à-dire de caractère de remplacement pour noter une voyelle longue. De fait, au cours du temps sa valeur phonétique s'est effacée et, depuis, ʾalif sert principalement à remplacer des phonèmes, noter l'allongement de la voyelle /a/ ou servir de support graphique à certains signes.

L'alphabet arabe se sert maintenant de la lettre hamza pour transcrire le coup de glotte, phonème qui, en arabe, peut se manifester n'importe où dans un mot, même à l'initiale ou en finale. Cette lettre, cependant, ne fonctionne pas comme les autres : elle peut être écrite seule ou avoir besoin d'un support, auquel cas elle devient un diacritique :

  • sans support : ء ;
  • avec support : إ ,أ (sur et sous un ʾalif), ؤ (sur un wāw), ئ (sur un yāʾ sans points ou yāʾ hamza).
Article détaillé : Écriture de la hamza.

Alif muet

Dans quelques mots, et surtout au cours de la flexion verbale, on peut écrire un ʾalif qui ne se prononce pas et ne sert pas de support à un diacritique. On le trouve principalement dans le mot مِائَة (miʾa signifiant « cent »), qui serait écrit plus régulièrement مِئَة).

Dans la conjugaison, on ajoute également un ʾalif muet après un wāw و en fin de mot ; ainsi :

  • كَتَبُوا katabū, « ils ont écrit » ;
  • رَمَوْا ramaw, « ils ont lancé ».

Assimilations

L'alphabet arabe ne note pas les cas d'assimilations des consonnes en contact :

  • dévoisement : malgré ce que la graphie indique, مُبْتَدَأ mubtadaʾ est prononcé /muptadaʾ/. Il est notable que l'écriture ne se modifie pas dans ce cas pour suivre la prononciation, au contraire de ce qu'elle fait dans d'autres cas (élision de la hamza instable, par exemple) ;
  • assimilation complète de l'article أَل ʾal : le /l/ de l'article est entièrement assimilé aux 14 consonnes dentales, liquides et spirantes (à l'exception de la spirante jîm) qui suivent (traditionnellement nommées consonnes « solaires » parce que deux d'entre elles (sîn et šîn) entrent dans le mot « soleil » (šams, شَمْس), par opposition aux 15 autres consonnes dites « lunaires » parce que le mot « lune » (qamar, قَمَر) commence par l'une d'entre elles, appelée qâf[6]. L'écriture, cependant, ne note pas clairement cette assimilation°: /ʔal/+/d/ > /ʔadd/, noté د + أَل (ʾal + d-) > أَلدّ (translittération : ʾaldd- ; noter la šadda) et non *أَدّ (translittération : ʾadd). La lettre lām, en effet, continue d'être écrite bien qu'elle ne soit plus prononcée (elle ne reçoit donc pas de sukūn) ; la graphie est d'autant plus redondante que la gémination obtenue peut être – rarement – indiquée par la šadda. La transcription doit cependant donner la prononciation, dans le cas précédent : ʾad-d (on place un trait d'union entre l'article et le nom pour indiquer que dans la graphie arabe, l'article est directement collé au nom ; c'est aussi le cas pour d'autres mots outils).
Graphie Translittération Transcription
1 ز ,ر ,ذ ,د ,ث ,ت + أَل
ʾal + t-, ṯ-, d-, ḏ-, r-, z- ʾal + t-, ṯ-, d-, ḏ-, r-, z-
أَلزّ ,أَلرّ ,أَلذّ ,أَلدّ ,أَلثّ ,أَلتّ
ʾaltt-, ʾalṯṯ-, ʾaldd-, ʾalḏḏ-, ʾalrr-, ʾalzz- ʾat-t-, ʾaṯ-ṯ-, ʾad-d-, ʾaḏ-ḏ-, ʾar-r-, ʾaz-z-
 
2 ض ,ص ,ش ,س + أَل | ʾal + s-, š-, ṣ-, ḍ- ʾal + s-, š-, ṣ-, ḍ-
أَلضّ ,أَلصّ ,أَلشّ ,أَلسّ ʾalss-, ʾalšš-, ʾalṣṣ-, ʾalḍḍ- ʾas-s-, ʾaš-š-, ʾaṣ-ṣ-, ʾaḍ-ḍ-
 
3 ن ,ل ,ظ ,ط + أَل | ʾal + ṭ-, ẓ-, l-, n- ʾal + ṭ-, ẓ-, l-, n-
أَلنّ ,أَللّ ,أَلظّ ,أَلطّ ʾalṭṭ-, ʾalẓẓ-, ʾalll-, ʾalnn- ʾaṭ-ṭ-, ʾaẓ-ẓ-, ʾal-l-, ʾan-n-

Autres problèmes d'orthographe

  • Rencontres de sukūn, sukun et hamza instable.
  • Paragoge dans les mots étrangers.

Translittération

Article détaillé : Romanisation de l'arabe.
 
Machine à écrire en caractères arabes.
 
Caractères arabes manuscrits.

Il existe de nombreuses normes de translittération de l'alphabet arabe vers l'alphabet latin, parmi lesquelles :

  • la translittération DIN-31635 ;
  • la « transcription Arabica », du nom d'une revue française d'études arabes ;
  • la translittération pratiquée par la revue Afriques ;
  • la norme de translittération adoptée par l'Encyclopædia of Islam (EI) ;
  • la norme internationale ISO 233-2 (1993).

Translittération Arabica

Il existe plusieurs systèmes de translittération de l'arabe, les plus employés étant celui de la revue Arabica et celui de l'Encyclopédie de l'islam. Les remarques qui suivent portent sur la transcription Arabica qui est la plus cohérente des deux (une lettre arabe = une lettre latine). On l'a vu, certaines lettres ont plusieurs fonctions, d'autres sont muettes ; la transcription est donc souvent ambiguë :

  • la hamza indépendante, ainsi que ʾalif, yāʾ et wāw quand ils portent la hamza diacritée, ont tous la valeur [ʔ], transcrite ‹ ʾ › ;
  • ʾalif et ʾalif maqṣūra servent tous deux à allonger le /a/ : la transcription ne permet pas de savoir laquelle des deux lettres est utilisée ;
  • le tāʾ marbūṭa n'est prononcé /t/ qu'en état d'annexion ou lorsqu'on prononce la désinence casuelle; il ne sera transcrit que dans ces deux cas ;
  • le tanwīn est noté en exposant accompagné de sa voyelle casuelle (raʾaytu kalban) ;
  • au sukūn et à la šadda ne correspondent aucun signe particulier. On note رأيْتُ ainsi raʾaytu et كسّر ainsi kassartu (par simple redoublement de la consonne géminée) ;
  • le /l/ de l'article assimilé devant consonne « solaire » est noté /l/ quand on transcrit de l'arabe littéral: al-sirr. En effet, l'assimilation est dans ce cas totalement prédictible. En revanche, lorsqu'on transcrit un texte en dialecte arabe, on doit faire apparaître l'assimilation quand elle se produit: l-kalb; n-nâr. En effet, les règles d'assimilation de l'article sont variables d'un dialecte à l'autre.

Toutes ces raisons font qu'il est parfois pratique d'utiliser une translittération précise qui suive l'original arabe, caractère par caractère. La norme ISO 233 permet cela (dans les exemples suivants, on placera les translittérations entre accolades) :

  • chaque consonne est écrite avec un symbole consonantique, même le ʾalif (translittéré ‹ ʾ ›, demi-anneau à droite), le wāw, et autres lettres d’allongement ;
  • les voyelles ne sont indiquées que si le texte de départ est vocalisé ;
  • les différents types de hamza sont notés par :
    • ‹ ' › avec un support : حَقَائِبْ ḥaqāʾib ‹ ḥaqaʾy'ib° ›,
    • ‹ ˌ › sans support : ضَوْء ḍawʾ ‹ ḍaw°ˌ ›,
  • ʾalif maqṣura est noté ‹ ỳ › : مَتَى matā ‹ mataỳ › ;
  • tāʾ marbūṭa est translittéré ‹ ẗ › (dans d'autres normes, un ‹ ʰ ›) : سَبْعَة sabʿa ‹ sab°ʿaẗ › ;
  • les tanwīn sont rendues par un accent aigu : رَجُلًا raǧulan ‹ raǧuláʾ › ;
  • le sukūn est noté par un ‹ ° › : زَوْج zawǧ ‹ zaw°ǧ ›, la šadda par un macron : شَدَّة šadda ‹ šad̄aẗ › ;
  • l'assimilation de l'article est écrite lettre par lettre : أَلشَّمْس ʾaš-šams ‹ ʾ'alš̄am°s ›, etc.

Autre modèle de translittération utilisé

Au-delà des normes scientifiques d'autres modèles de translittération accessibles à tous sont utilisés par les auteurs ou les maisons d'édition musulmanes. Parmi ces modèles :

  • La translittération de chaque lettre arabe par une et une seule lettre latine et non pas deux comme c’est souvent le cas pour la translittération de la lettre «« ث » ou « خ » ou les lettres similaires (voir tableau ci-dessous ).
Lettre arabe ث ذ خ ش ظ غ
Translittération employant deux lettres th dh kh sh ou ch dh gh
Nouvelle translittération t d
  • La translittération du son « ou » représenté en arabe par la voyelle « ḍammah » est représenté par une seule lettre latine le « u ».
  • La translittération des lettres arabes emphatiques, auxquelles il faut rajouter la lettre « ح » par un point sous les lettres latines qui les représentent à l’exception du « غ » pour qui le point a été placé au-dessus de la lettre « r » qui la représente
Lettre arabe ح خ ص ض ط ظ غ
Translittération
  • La translittération des lettres interdentales « ث », le « ذ » par un trait sous les lettres latines qui les représentent :
Lettre arabe ث ذ
Translittération

Tableau récapitulatif de toutes les lettres arabes translittérées suivant ce modèle :

Lettre translittération Lettre translittération
ء ض
ب b ط
ت t ظ
ث t ع c
ج j غ
ح ف f
خ ق q
د d ك k
ذ d ل l
ر r م m
ز z ن n
س s ه h
ش و w
ص ي y

La translittération des voyelles courtes et longues :

Voyelles
courtes longues
a ã
i ĩ
u ũ

Informatique et alphabet arabe

Encodage

Il peut être codé par plusieurs jeux de caractères, parmi lesquels ISO-8859-6 et Unicode, grâce au bloc « Arabe », des emplacements U+0600 à U+06FF. Ces deux jeux, cependant, n'indiquent pas pour chaque caractère la forme contextuelle qu'il doit prendre. C'est au moteur de rendu de sélectionner le bon œil. Il existe cependant, dans le cas où l'on voudrait coder une forme particulière d'un caractère, les blocs « Formes de présentation arabe A » (U+FB50 à U+FDFF) et « Formes de présentation arabe B » (U+FE70 à U+FEFF), qui contiennent la majorité des caractères convalescents entièrement en variante contextuelle ainsi que les caractères étendus propres à d'autres langues. Il est aussi possible d'utiliser les liants sans et avec chasse. Enfin, le codage de l'arabe est logique, c'est-à-dire qu'on entre les caractères à la suite sans se soucier du sens de l'écriture. C'est encore une fois au moteur de rendu qu'il revient d'afficher les caractères dans le bon sens. À cet égard, si les mots arabes de cette page sont affichés à l'envers, c'est que votre moteur de rendu Unicode n'est pas assez récent. Pour plus de détails concernant les questions de codage de l'arabe, consultez la traduction française du manuel d'Unicode, disponible sur le site Hapax.

Claviers arabes

Inspirés des claviers de machines à écrire, les claviers arabes d'ordinateurs peuvent se présenter ainsi :  

Notes et références

  1. Certaines écritures, dont le xiao'erjing, ont introduit des voyelles.
  2. a b et c Histoire de l'écriture, James Février, Payot 1984, p. 269.
  3. Bresnier, Principes élémentaires de la langue arabe, 1867.
  4. Schier, grammaire arabe, §9.
  5. Bresnier, Cours d'arabe, p. 225.
  6. Régis Blachère, Maurice Gaudefroy-Demombynes, Grammaire de l'arabe classique, cinquième édition, ,, Paris, Maisonneuve et Larose, 1998, 3e éd. [1975], 508 p. (ISBN 978-2-706-81128-9), p. 28.

Voir aussi

Bibliographie

  • Mohammed Sadid, L'alphabet arabe et la technologie, 1993, 414 p.
  • Michel Neyreneuf et Ghalib Al-Hakkak, Grammaire active de l'arabe, Le Livre de Poche, collection « Les langues modernes », 1996 ;
  • Régis Blachère, Maurice Gaudefroy-Demombynes, Grammaire de l'arabe classique, cinquième édition, Paris, Maisonneuve et Larose, 2004 ;
  • The World's Writing Systems, ouvrage collectif sous la direction de Peter T. Daniels et William Bright, article « Arabic Writing » de Thomas Bauer, Oxford University Press, 1996 ;
  • Dictionnaire Mounged de poche (français arabe ─ فرنسيّ عربيّ), dixième édition, éditions Dar el-Machreq, Beyrouth.
  • Mathieu Guidère, Grammaire alphabétique de l'arabe, Paris, Editions Ellipses, collection « Grammaticalement correct », 2004 (nouvelle édition revue et corrigée).

Articles connexes

Blocs de caractères Unicode pour l’écriture arabe

Liens externes

Sur les autres projets Wikimedia :