Utilisateur:Adwiladan/Processus de coalescence

Cette page est un brouillon appartenant à Adwiladan

Conseils de rédaction

→ N'hésitez pas à publier sur le brouillon un texte inachevé et à le modifier autant que vous le souhaitez.
→ Pour enregistrer vos modifications au brouillon, il est nécessaire de cliquer sur le bouton bleu : « Publier les modifications ». Il n'y a pas d'enregistrement automatique.

Si votre but est de publier un nouvel article, votre brouillon doit respecter les points suivants :

Respectez le droit d'auteur en créant un texte spécialement pour Wikipédia en français (pas de copier-coller venu d'ailleurs).
Indiquez les éléments démontrant la notoriété du sujet (aide).
Liez chaque fait présenté à une source de qualité (quelles sources – comment les insérer).
Utilisez un ton neutre, qui ne soit ni orienté ni publicitaire (aide).
Veillez également à structurer votre article, de manière à ce qu'il soit conforme aux autres pages de l'encyclopédie (structurer – mettre en page).

→ Si ces points sont respectés, pour transformer votre brouillon en article, utilisez le bouton « publier le brouillon » en haut à droite. Votre brouillon sera alors transféré dans l'espace encyclopédique.

Un processus de coalescence est un processus aléatoire modélisant la fusion progressive de différents blocs d'une partition d'un ensemble. Le processus inverse est appelé processus de fragmentation, et correspond à une succession de divisions des différents blocs de la partition. Le premier exemple de processus de coalescence est dû à J. F. C. KingmanJohn Kingman^[1]. Par la suite, des généralisations ont été introduites par J. Pitman^[2] et S. Sagitov^[3].

Ces processus trouvent des applications en génétique des populations, où ils sont utilisés pour modéliser la généalogie d'un échantillon d'individus (ou plus précisément d'un échantillon de gènes), ce qui permet d'obtenir des informations sur l'histoire évolutive d'une population à partir de sa composition génétique. Ce domaine de la génétique des populations est usuellement désigné sous le terme théorie de la coalescence.

Généralités modifier

Définition modifier

Un processus de coalescence $(\Pi _{n})_{n\in \mathbb {N} }$ est un processus de Markov qui prend ses valeurs dans l'ensemble des partitions des entiers^[4]. De plus, un processus de coalescence doit être décroissant pour l'inclusion : $\Pi _{n+1}$ doit pouvoir s'obtenir à partir de $\Pi _{n}$ en fusionnant un ou plusieurs de ses blocs. Un exemple de réalisation d'un processus de coalescence sur $\lbrace 1,2,3,4,5\rbrace$ est donc

Arbre de coalescence correspondant à l'exemple donné ci-contre.

${\begin{aligned}\Pi _{0}&=\left\lbrace \lbrace 1\rbrace ,\lbrace 2\rbrace ,\lbrace 3\rbrace ,\lbrace 4\rbrace ,\lbrace 5\rbrace \right\rbrace \\\Pi _{1}&=\left\lbrace \lbrace 1,2\rbrace ,\lbrace 3\rbrace ,\lbrace 4,5\rbrace \right\rbrace \\\Pi _{2}&=\left\lbrace \lbrace 1,2,3\rbrace ,\lbrace 4,5\rbrace \right\rbrace \\\Pi _{3}&=\left\lbrace \lbrace 1,2,3,4,5\rbrace \right\rbrace \\\Pi _{4}&=\left\lbrace \lbrace 1,2,3,4,5\rbrace \right\rbrace \\\Pi _{5}&=\ldots .\end{aligned}}$

Un processus de coalescence peut également être à temps continu. Un tel processus $(\Pi _{t})_{t\geq 0}$ doit alors être tel que pour tout $s>0$ et $t\geq 0$ , $\Pi _{t+s}$ s'obtient à partir de $\Pi _{t}$ en fusionnant un ou plusieurs de ses blocs.

Interprétation généalogique modifier

Un tel processus s'interprète naturellement en terme de l'arbre généalogique d'un groupe d'individus : chaque bloc de la partition $\Pi _{n}$ regroupe les individus qui possèdent un ancêtre commun $n$ générations dans le passé.

Le coalescent de Kingman modifier

L'exemple le plus étudié de processus de coalescence est le coalescent de Kingman^[1] (du nom du mathématicien qui l'a introduit).

Le coalescent de Kingman sur les n premiers entiers modifier

Un processus de coalescence $\left(\Pi _{t}\right)_{t\geq 0}$ est un coalescent de Kingman sur les n premiers entiers si

$\Pi _{0}$ est la partition des entiers de 1 à n en singletons : $\left\lbrace \lbrace 1\rbrace ,\lbrace 2\rbrace ,\ldots ,n\right\rbrace$ ,
si le nombre de blocs dans $\Pi _{t}$ est $k$ , la fusion suivante a lieu après un temps aléatoire de loi exponentielle de paramètre ${\binom {k}{2}}$ , cette fusion a lieu entre deux blocs choisis uniformément au hasard parmi ceux de $\Pi _{t}$ .

De manière équivalente, chaque paire de blocs fusionne après un temps aléatoire de loi exponentielle de paramètre 1, indépendamment de toutes les autres paires de blocs.

Coalescent de Kingman sur les 50 premiers entiers.

Le coalescent de Kingman sur $\mathbb {N}$ modifier

Il est possible de généraliser cette définition à un processus à valeurs dans l'ensemble des partitions de $\mathbb {N}$ , de la manière suivante.

Un processus de coalescence $\left(\Pi _{t}\right)_{t\geq 0}$ est un coalescence de Kingman sur $\mathbb {N}$ si

$\Pi _{0}$ est la partition des entiers $\mathbb {N}$ en singletons : $\left\lbrace \lbrace 1\rbrace ,\lbrace 2\rbrace ,\lbrace 3\rbrace ,\ldots \right\rbrace$ ,
chaque paire de blocs fusionne après un temps aléatoire de loi exponentielle de paramètre 1, indépendamment de toutes les autres paires de blocs.

Trace du coalescent de Kingman modifier

Si $\left(\Pi _{t}\right)_{t\geq 0}$ est un coalescent de Kingman, on peut définir sa trace $\left(\Pi _{t}^{n}\right)_{t\geq 0}$ sur les $n$ premiers entiers comme la restriction de la partition $\Pi _{t}$ à l'ensemble $\lbrace 1,\ldots ,n\rbrace$ . En d'autres termes, deux entiers $i$ et $j$ entre 1 et $n$ sont dans le même bloc dans $\Pi _{t}^{n}$ si et seulement s'ils sont dans le même bloc dans $\Pi _{t}$ .

La trace sur $\lbrace 1,2,\ldots ,n\rbrace$ d'un coalescent de Kingman sur $\mathbb {N}$ est un coalescent de Kingman sur les $n$ premiers entiers.

Âge de l'ancêtre commun le plus récent modifier

Si $T$ désigne le premier instant (aléatoire) pour lequel il ne reste plus qu'un seul bloc dans la partition $\Pi _{t}^{n}$ , alors $\mathbb {E} [T]=2(1-1/n)$ .

Vitesse de descente de l'infini modifier

Bien qu'il y ait initialement un nombre infini de blocs, les premières fusions sont très rapides, puisque l'intervalle entre deux fusions dépend du nombre de blocs présents. Si $N_{t}$ désigne le nombre de blocs dans $\Pi _{t}$ , alors presque sûrement, pour tout $t>0$ , $N_{t}<\infty$ . On dit que le coalescent de Kingman descend de l'infini. De plus, on a également le résultat suivant^[5], qui donne la vitesse à laquelle se fait la descente de l'infini.

Théorème — Presque sûrement,

\lim _{t\downarrow 0}tN_{t}=2.

Utilisation en génétique des populations modifier

Les processus de coalescence, et le coalescent de Kingman en particulier, sont très utilisés en génétique des populations, dans le cadre de ce qu'on appelle la théorie de la coalescence. Cela tient au fait que le coalescent décrit dans un sens très précis la généalogie d'un échantillon d'individus dans plusieurs modèles mathématiques introduits en génétique des populations^[6].

En observant la séquence d'un gène chez un échantillon d'individus, il est possible d'estimer la forme de l'arbre généalogique le plus probable pour le gène en question. En effet l'ADN accumule des mutations génération après génération, et plus deux gènes partagent de mutations, plus il est probable qu'ils aient un ancêtre commun récent.

Généralisations modifier

Lambda coalescents modifier

$\lambda _{k,b}=\int _{0}^{1}u^{k-2}(1-u)^{b-k}\Lambda (du).$

Recombinaison modifier

Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

Références modifier

↑ ^{a et b} J. F. C. Kingman, « The coalescent », Stochastic Processes and their Applications, vol. 13,‎ 1^er septembre 1982, p. 235–248 (DOI 10.1016/0304-4149(82)90011-4, lire en ligne, consulté le 13 mars 2016)
↑ Pitman, « Coalescents with Multiple Collisions », The Annals of Probability, vol. 27,‎ 1^er janvier 1999 (lire en ligne, consulté le 13 mars 2016)
↑ Serik Sagitov, « The general coalescent with asynchronous mergers of ancestral lines », Journal of Applied Probability, vol. 36,‎ 1^er décembre 1999, p. 1116–1125 (ISSN 0021-9002 et 1475-6072, DOI 10.1239/jap/1032374759, lire en ligne, consulté le 13 mars 2016)
↑ (en) Jim Pitman, Combinatorial Stochastic Processes: Ecole d'Eté de Probabilités de Saint-Flour XXXII - 2002, Springer Science & Business Media, 11 mai 2006 (ISBN 9783540309901, lire en ligne)
↑ Julien Berestycki, Nathanaël Berestycki et Vlada Limic, « THE Λ-COALESCENT SPEED OF COMING DOWN FROM INFINITY », The Annals of Probability, vol. 38,‎ 1^er janvier 2010, p. 207–233 (lire en ligne, consulté le 3 avril 2016)
↑ (en) Alison Etheridge, Some Mathematical Models from Population Genetics: École D'Été de Probabilités de Saint-Flour XXXIX-2009, Springer Science & Business Media, 7 janvier 2011 (ISBN 9783642166310, lire en ligne)

Pitman, Kingman, Nordborg, Sagitov, Etheridge

[:1-1] {a et b} J. F. C. Kingman, « The coalescent », Stochastic Processes and their Applications, vol. 13,‎ 1^er septembre 1982, p. 235–248 (DOI 10.1016/0304-4149(82)90011-4, lire en ligne, consulté le 13 mars 2016)

[2] Pitman, « Coalescents with Multiple Collisions », The Annals of Probability, vol. 27,‎ 1^er janvier 1999 (lire en ligne, consulté le 13 mars 2016)

[3] Serik Sagitov, « The general coalescent with asynchronous mergers of ancestral lines », Journal of Applied Probability, vol. 36,‎ 1^er décembre 1999, p. 1116–1125 (ISSN 0021-9002 et 1475-6072, DOI 10.1239/jap/1032374759, lire en ligne, consulté le 13 mars 2016)

[4] (en) Jim Pitman, Combinatorial Stochastic Processes: Ecole d'Eté de Probabilités de Saint-Flour XXXII - 2002, Springer Science & Business Media, 11 mai 2006 (ISBN 9783540309901, lire en ligne)

[5] Julien Berestycki, Nathanaël Berestycki et Vlada Limic, « THE Λ-COALESCENT SPEED OF COMING DOWN FROM INFINITY », The Annals of Probability, vol. 38,‎ 1^er janvier 2010, p. 207–233 (lire en ligne, consulté le 3 avril 2016)

[:2-6] (en) Alison Etheridge, Some Mathematical Models from Population Genetics: École D'Été de Probabilités de Saint-Flour XXXIX-2009, Springer Science & Business Media, 7 janvier 2011 (ISBN 9783642166310, lire en ligne)

[1]

[2]

[3]

[4]

[5]

[6]