Utilisateur:Adwiladan/Processus de coalescence

Un processus de coalescence est un processus aléatoire modélisant la fusion progressive de différents blocs d'une partition d'un ensemble. Le processus inverse est appelé processus de fragmentation, et correspond à une succession de divisions des différents blocs de la partition. Le premier exemple de processus de coalescence est dû à J. F. C. Kingman[1]. Par la suite, des généralisations ont été introduites par J. Pitman[2] et S. Sagitov[3].

Ces processus trouvent des applications en génétique des populations, où ils sont utilisés pour modéliser la généalogie d'un échantillon d'individus (ou plus précisément d'un échantillon de gènes), ce qui permet d'obtenir des informations sur l'histoire évolutive d'une population à partir de sa composition génétique. Ce domaine de la génétique des populations est usuellement désigné sous le terme théorie de la coalescence.

Généralités modifier

Définition modifier

Un processus de coalescence   est un processus de Markov qui prend ses valeurs dans l'ensemble des partitions des entiers[4]. De plus, un processus de coalescence doit être décroissant pour l'inclusion :   doit pouvoir s'obtenir à partir de   en fusionnant un ou plusieurs de ses blocs. Un exemple de réalisation d'un processus de coalescence sur   est donc

 
Arbre de coalescence correspondant à l'exemple donné ci-contre.

 

Un processus de coalescence peut également être à temps continu. Un tel processus   doit alors être tel que pour tout   et  ,   s'obtient à partir de   en fusionnant un ou plusieurs de ses blocs.

Interprétation généalogique modifier

Un tel processus s'interprète naturellement en terme de l'arbre généalogique d'un groupe d'individus : chaque bloc de la partition   regroupe les individus qui possèdent un ancêtre commun   générations dans le passé.

Le coalescent de Kingman modifier

L'exemple le plus étudié de processus de coalescence est le coalescent de Kingman[1] (du nom du mathématicien qui l'a introduit).

Le coalescent de Kingman sur les n premiers entiers modifier

Un processus de coalescence   est un coalescent de Kingman sur les n premiers entiers si

  •   est la partition des entiers de 1 à n en singletons :  ,
  • si le nombre de blocs dans   est  , la fusion suivante a lieu après un temps aléatoire de loi exponentielle de paramètre  , cette fusion a lieu entre deux blocs choisis uniformément au hasard parmi ceux de  .

De manière équivalente, chaque paire de blocs fusionne après un temps aléatoire de loi exponentielle de paramètre 1, indépendamment de toutes les autres paires de blocs.

 
Coalescent de Kingman sur les 50 premiers entiers.

Le coalescent de Kingman sur   modifier

Il est possible de généraliser cette définition à un processus à valeurs dans l'ensemble des partitions de  , de la manière suivante.

Un processus de coalescence   est un coalescence de Kingman sur   si

  •   est la partition des entiers   en singletons :  ,
  • chaque paire de blocs fusionne après un temps aléatoire de loi exponentielle de paramètre 1, indépendamment de toutes les autres paires de blocs.

Trace du coalescent de Kingman modifier

Si   est un coalescent de Kingman, on peut définir sa trace   sur les   premiers entiers comme la restriction de la partition   à l'ensemble  . En d'autres termes, deux entiers   et   entre 1 et   sont dans le même bloc dans   si et seulement s'ils sont dans le même bloc dans  .

La trace sur   d'un coalescent de Kingman sur   est un coalescent de Kingman sur les   premiers entiers.

Âge de l'ancêtre commun le plus récent modifier

Si   désigne le premier instant (aléatoire) pour lequel il ne reste plus qu'un seul bloc dans la partition  , alors  .

Vitesse de descente de l'infini modifier

Bien qu'il y ait initialement un nombre infini de blocs, les premières fusions sont très rapides, puisque l'intervalle entre deux fusions dépend du nombre de blocs présents. Si   désigne le nombre de blocs dans  , alors presque sûrement, pour tout  ,  . On dit que le coalescent de Kingman descend de l'infini. De plus, on a également le résultat suivant[5], qui donne la vitesse à laquelle se fait la descente de l'infini.

Théorème — Presque sûrement,

 

Utilisation en génétique des populations modifier

Les processus de coalescence, et le coalescent de Kingman en particulier, sont très utilisés en génétique des populations, dans le cadre de ce qu'on appelle la théorie de la coalescence. Cela tient au fait que le coalescent décrit dans un sens très précis la généalogie d'un échantillon d'individus dans plusieurs modèles mathématiques introduits en génétique des populations[6].

En observant la séquence d'un gène chez un échantillon d'individus, il est possible d'estimer la forme de l'arbre généalogique le plus probable pour le gène en question. En effet l'ADN accumule des mutations génération après génération, et plus deux gènes partagent de mutations, plus il est probable qu'ils aient un ancêtre commun récent.

Généralisations modifier

Lambda coalescents modifier

 

Recombinaison modifier

Références modifier

  1. a et b J. F. C. Kingman, « The coalescent », Stochastic Processes and their Applications, vol. 13,‎ , p. 235–248 (DOI 10.1016/0304-4149(82)90011-4, lire en ligne, consulté le )
  2. Pitman, « Coalescents with Multiple Collisions », The Annals of Probability, vol. 27,‎ (lire en ligne, consulté le )
  3. Serik Sagitov, « The general coalescent with asynchronous mergers of ancestral lines », Journal of Applied Probability, vol. 36,‎ , p. 1116–1125 (ISSN 0021-9002 et 1475-6072, DOI 10.1239/jap/1032374759, lire en ligne, consulté le )
  4. (en) Jim Pitman, Combinatorial Stochastic Processes: Ecole d'Eté de Probabilités de Saint-Flour XXXII - 2002, Springer Science & Business Media, (ISBN 9783540309901, lire en ligne)
  5. Julien Berestycki, Nathanaël Berestycki et Vlada Limic, « THE Λ-COALESCENT SPEED OF COMING DOWN FROM INFINITY », The Annals of Probability, vol. 38,‎ , p. 207–233 (lire en ligne, consulté le )
  6. (en) Alison Etheridge, Some Mathematical Models from Population Genetics: École D'Été de Probabilités de Saint-Flour XXXIX-2009, Springer Science & Business Media, (ISBN 9783642166310, lire en ligne)

Pitman, Kingman, Nordborg, Sagitov, Etheridge