Processus de branchement

En théorie des probabilités, un processus de branchement est un processus stochastique formé par une collection de variables aléatoires. Les variables aléatoires d'un processus stochastique sont indexées par les nombres entiers naturels. Les processus de branchement ont été développés en premier lieu pour décrire une population dans laquelle chaque individu de la génération  produit un nombre aléatoire d'individus dans la génération [1]. Par exemple, une population de bactéries dans laquelle chaque individu, indépendamment des autres, produit un nombre aléatoire de descendants à chaque pas de temps. Les processus de branchement peuvent aussi être utilisés pour modéliser d'autres systèmes avec des dynamiques similaires, par exemple la propagation de noms de familles[2] dans une généalogie ou de neutrons dans un réacteur nucléaire.

Formulation mathématique modifier

La formulation la plus commune d'un processus de branchement est le processus de Galton-Watson. On définit récursivement la variable aléatoire Zn à valeurs dans   pour désigner la taille de la population à la génération n, en commençant par  . Supposons qu'on ait défini Zn pour  . On définit alors   un vecteur de variables aléatoires i.i.d à valeurs dans  , dont chacune désigne le nombre de descendants de l'individu i de la population à la génération n. On pose alors

 

On peut également représenter le processus de branchement sous la forme d'une marche aléatoire. Posons  . Considérons   un vecteur de variables aléatoires iid. On définit alors récursivement:

 

et on arrête la marche si elle touche 0. Cette marche aléatoire s'appelle la marche de Lukasiewicz[3]. Ici i ne représente plus le temps mais quelque chose de plus abstrait. Pour comprendre cette représentation, imaginez que l'on parcoure la population à travers les générations en visitant un individu à la fois, et que Si représente le nombre d'individus découverts non visités (notre but étant de visiter tous les individus). Chaque fois que l'on visite un individu, on peut retirer cet individu de Si (d'où le -1), mais on découvre par la même occasion tous les enfants de cet individu (notés Xi), que l'on ajoute donc au total des individus découverts non visités. On peut alors choisir l'un des individus découverts non visités à visiter ensuite. Si l'on atteint 0, c'est que tous les individus de la population ont été visités. On peut également voir cela comme si les individus ne se reproduisaient qu'un à la fois (en mourant sur le coup).

Processus de branchement en temps continu modifier

Pour les processus de branchement en temps discrets, le "temps de branchement" est fixé à 1 pour tous les individus (tous les événements de branchement ont lieu à des temps entiers). Pour les processus de branchement à temps continu, chaque individu attend un temps aléatoire à densité sur   (c'est-à-dire continu). Une fois ce temps écoulé, l'individu se divise en un nombre aléatoire de descendants. Les temps d'attente de différents individus sont indépendants, et sont indépendants de leur nombre de descendants une fois qu'ils se reproduisent. Dans le cas où le temps d'attente suit une même loi exponentielle pour toute la population, le processus est Markovien.

Exemple: Processus de Crump-Mode-Jager modifier

Un processus de branchement de Crump-Mode-Jagers est un processus de branchement particulier. Ce processus est défini comme suit: en partant d'un individu né au temps 0. Cet individu a un nombre aléatoire de descendants N, nés à des temps aléatoires   selon un processus de Poisson   sur  , dont les descendants suivent la même loi de manière indépendante (translatée à leur date de naissance)[4],[5]. Ce processus a des implications importantes pour l'étude en biologie des dynamiques de populations[6].

Probabilité d'extinction à terme modifier

Une question centrale dans la théorie des processus de branchements est la probabilité d'extinction à terme, probabilité qu'il ne reste plus personne après un nombre fini de générations. Le modèle le plus simple est le processus de Galton-Watson, où la population débute avec un seul individu à la génération (discrète) zéro, et où chaque individu se reproduit indépendamment des autres selon une même loi de moyenne μ. Dans ce cas l'espérance de la taille de la population à la génération  n est μn. Si μ < 1, alors l'espérance de la taille de la population tend vers 0 à une vitesse exponentielle, ce qui implique une probabilité d'extinction à terme de 1. Si μ > 1, alors la probabilité d'extinction à terme est inférieure strictement à 1 (mais généralement différente de 0). Si μ = 1, alors l'extinction à terme a lieu avec probabilité 1, sauf dans le cas extrême où chaque individu a exactement un descendant.

En écologie théorique (en), le paramètre μ d'un processus de branchement s'appelle le taux de reproduction de base.

Processus de branchement taille-dépendants modifier

Les processus de branchements taille-dépendants sont pertinents, typiquement, lorsque des phénomènes de régulation interviennent à l'échelle de la population tout entière. Par exemple, en écologie intervient couramment une capacité porteuse qui limite la taille maximale de la population par la quantité de ressources disponibles[7].

Krishna Athreya a identifié trois types de processus de branchements taille-dépendants couramment utilisés. Il s'agit de mesures de branchement sous-critique, stable, et super-critique[8].

Simulation de processus de branchements modifier

Les simulations de processus de branchement sont beaucoup utilisés en biologie évolutive[9],[10]. Les arbres phylogénétiques, par exemple, peuvent être simulés par des processus de branchement, ce qui permet de reconstituer l'histoire passée de populations à partir de données de séquençage génétique[11].

Processus de branchement multitype modifier

Dans un processus de branchement multitype, les individus ont chacun un type parmi n (potentiellement infini). À chaque pas de temps (dans un cadre discret), un individu de type i produit un nombre aléatoire d'individus de chaque type dont la loi dépend de i. Un événement de branchement pour un individu est donc donné par un vecteur aléatoire de   avec une certaine loi.

Par exemple, prenons une population de Cellules Souches Cancéreuses (CSCs) et non-cancéreuses (CSNCs). À chaque pas de temps, chaque CSC produit deux CSCs avec probabilité   (division symétrique), produit une CSC et une CSNC avec probabilité  (division asymétrique), produit une CSC avec probabilité   (stagnation), et meurt (ne produit rien) avec probabilité   ; parallèlement, chaque CSNC produit deux CSNCs avec probabilité   (division symétrique), produit une CSNC avec probabilité  (stagnation), et meurt avec probabilité  [12].

Loi des grands nombres pour les processus multitype modifier

La loi forte des grands nombres pour les processus de branchement multitypes stipule que, sous certaines conditions, conditionnellement à la croissance exponentielle de la population, la proportion des différents types converge presque sûrement à un vecteur constant.

Pour les processus de branchement à temps continu, les proportions des différents types au sein de la population vérifient un système d'équations différentielles ordinaires, qui a un unique attracteur vers lequel converge le système.

La monographie d'Athreya et Ney [13] résume les conditions sous lesquelles cette loi des grands nombres est valide. Ces conditions ont été affinées depuis[14],[15].

Voir aussi modifier

Notes et références modifier

  1. K. B. Athreya, Encyclopedia of Environmetrics, (ISBN 978-0471899976, DOI 10.1002/9780470057339.vab032), « Branching Process »
  2. (en) Joachim Hermisson, « Noble names, branching processes and fixation probabilities », sur 9dok.net (consulté le )
  3. (en) « Random walks and graphs », (consulté le )
  4. (en) Cecilia Holmgren et Svante Janson, « FRINGE TREES, CRUMP–MODE–JAGERS BRANCHING PROCESSES AND m-ARY SEARCH TREES » (consulté le )
  5. (en) Peter Jagers, Branching Processes with Biological Applications, London, John Wiley and Sons, (lire en ligne)
  6. (en) Amaury Lambert, « Probabilistic Models for the (sub)Tree(s) of Life » (consulté le )
  7. F. Thomas Bruss and M. Duerinckx (2015) "Resource dependent branching processes and the envelope of societies", Annals of Applied Probability. 25: 324–372.
  8. Krishna Athreya and Peter Jagers. Branching Processes. Springer. 1973.
  9. (en) O. Hagen, K. Hartmann, M. Steel et T. Stadler, « Age-Dependent Speciation Can Explain the Shape of Empirical Phylogenies », Systematic Biology, vol. 64, no 3,‎ , p. 432–440 (ISSN 1063-5157, PMID 25575504, PMCID 4395845, DOI 10.1093/sysbio/syv001)
  10. Oskar Hagen, Tobias Andermann, Tiago B. Quental, Alexandre Antonelli et Daniele Silvestro, « Estimating Age-Dependent Extinction: Contrasting Evidence from Fossils and Phylogenies », Systematic Biology, vol. 67, no 3,‎ , p. 458–474 (PMID 29069434, PMCID 5920349, DOI 10.1093/sysbio/syx082  )
  11. (en) Oskar Hagen et Tanja Stadler, « TreeSimGM: Simulating phylogenetic trees under general Bellman–Harris models with lineage-specific shifts of speciation and extinction in R », Methods in Ecology and Evolution, vol. 9, no 3,‎ , p. 754–760 (ISSN 2041-210X, PMID 29938014, PMCID 5993341, DOI 10.1111/2041-210X.12917)
  12. Xiufang Chen, Yue Wang, Tianquan Feng, Ming Yi, Xingan Zhang et Da Zhou, « The overshoot and phenotypic equilibrium in characterizing cancer dynamics of reversible phenotypic plasticity », Journal of Theoretical Biology, vol. 390,‎ , p. 40–49 (PMID 26626088, DOI 10.1016/j.jtbi.2015.11.008, arXiv 1503.04558, S2CID 15335040, lire en ligne)
  13. Krishna B. Athreya et Peter E. Ney, Branching Processes, Berlin, Springer-Verlag, , 199–206 p. (ISBN 978-3-642-65371-1)
  14. Svante Janson, « Functional limit theorems for multitype branching processes and generalized Pólya urns », Stochastic Processes and Their Applications, vol. 110, no 2,‎ , p. 177–245 (DOI 10.1016/j.spa.2003.12.002)
  15. Da-Quan Jiang, Yue Wang et Da Zhou, « Phenotypic equilibrium as probabilistic convergence in multi-phenotype cell population dynamics », PLOS ONE, vol. 12, no 2,‎ , e0170916 (PMID 28182672, PMCID 5300154, DOI 10.1371/journal.pone.0170916  , Bibcode 2017PLoSO..1270916J)