Processus ponctuel

type de processus stochastique

En probabilité et statistique, un processus ponctuel est un type particulier de processus stochastique pour lequel une réalisation est un ensemble de points isolés du temps et/ou de l'espace. Par exemple, la position des arbres dans une forêt peut être modélisée comme la réalisation d'un processus ponctuel.

Les processus ponctuels sont des objets très étudiés en probabilité et en statistique pour représenter et analyser des données spatialisées qui interviennent dans une multitude de domaines telle que l'écologie, l'astronomie, l'épidémiologie, la géographie, la sismologie, les télécommunications, la science des matériaux et beaucoup d'autres.

Le cas particulier des processus ponctuels sur la droite réelle est très étudié, la connaissance de la distance entre deux points consécutifs caractérisant le processus. Ce type de processus ponctuel est très utilisé pour modéliser des événements aléatoires dans le temps, tels que l'arrivée d'un client (théorie des files d'attente), l'impulsion d'un neurone...

Théorie des processus ponctuels modifier

En mathématiques, un processus ponctuel est un élément aléatoire dont les valeurs sont des motifs de points, c'est-à-dire des « collections » de points sur un ensemble  .

Il est possible de généraliser en définissant un motif de points comme étant une mesure de comptage localement finie.

Définition modifier

Soit   un espace métrique localement compact équipé de sa tribu borélienne  . On note   l'ensemble des motifs de points de  , c'est-à-dire l'ensemble des sous-ensembles localement finis de  . Un élément de   sera appelé "configuration" et sera noté  .

On munit   de la tribu  [1],[2],[3] engendrée par les applications de comptage   :  , où B est un compact de   et où   désigne le cardinal de l'ensemble fini considéré.

Un processus ponctuel est alors une application mesurable   d'un espace de probabilité vers l'espace mesuré  .

L'exemple le plus commun d'espace   est l'espace euclidien   ou un de ses sous-espaces. Mais les processus ponctuels ne sont pas limités à ces exemples.

Un cas particulier des processus ponctuels est celui des processus ponctuels définis sur la droite réelle   (ou la demi-droite réelle  ). Dans les applications concrètes, cela représente souvent l'occurrence d'événements dans le temps. Pour donner quelques exemples, un processus ponctuel dans le temps peut modéliser les temps d'arrivée de visiteurs dans un musée (avec le processus de Poisson par exemple), la durée avant déclenchement d'une maladie chez une personne (processus de Cox) ou encore les temps auxquels on observe des influx nerveux dans les neurones (processus de Hawkes).

Mesure intensité modifier

La mesure intensité du processus   est une mesure sur   qui mesure le nombre moyen de points du processus qui tombe dans un borélien de  , et s'écrit pour  ,  .

Intensité d'un processus ponctuel modifier

Dans le cas où on étudie des processus ponctuels sur   (ou  ), on peut proposer une autre façon intuitive de mesurer l'intensité d'un processus ponctuel : cette mesure est appelée l'intensité du processus ponctuel   et est définie comme[4] :

 

D'après le théorème de Khinchin[4], cette limite existe si le processus ponctuel est stationnaire (mais elle peut être infinie). Intuitivement, l'intensité représente la probabilité qu'il y ait au moins une occurrence dans l'intervalle   quand   tend vers zéro.

Fonctionnelle de Laplace modifier

La fonctionnelle de Laplace[3] d'un processus ponctuel  , noté  , est une fonctionnelle de l'ensemble de toutes les fonctions   positives de   dans   et est définie comme suit:

 

Cette fonctionnelle joue un rôle similaire à la fonction caractéristique d'une variable aléatoire. En effet la fonctionnelle de Laplace caractérise la loi d'un processus ponctuel, c'est-à-dire que deux processus ponctuels qui ont des fonctionnelles de Laplace égales ont la même loi.

Théorème de Rényi : Caractérisation par les probabilités de vide modifier

Compte tenu de la structure de la tribu sur  , la loi d'un processus ponctuel   est entièrement déterminée par les probabilités    parcourt l'ensemble des entiers naturels   et   l'ensemble des boréliens bornés de  . Mais le théorème de Rényi nous donne une caractérisation beaucoup plus simple.

Théorème de Rényi —  Si l'espace   est séparable complet, alors la loi d'un processus ponctuel est entièrement déterminée par les probabilités de vide (void probabilities en anglais), c'est-à-dire par la famille  , où   parcours l'ensemble des boréliens bornés.

Processus ponctuel de Poisson modifier

Le processus ponctuel de Poisson est le plus simple et le plus universel des processus ponctuels. C'est une généralisation spatiale du processus de Poisson utilisé en théorie des files d'attente.

Définition d'un processus ponctuel de Poisson —  Soit   une mesure non atomique sur  . Un processus ponctuel   est un processus ponctuel de Poisson de mesure d'intensité   si, pour toutes familles   de boréliens bornés disjoints et pour tous entiers naturels  ,

 

Propriétés des processus ponctuels de Poisson modifier

Cette section regroupe les propriétés fondamentales des processus ponctuels de Poisson. Ces résultats sont souvent la conséquence du théorème de Rényi.

Proposition (Superposition de deux processus ponctuels de Poisson)[1],[3] —  Soient   et   deux processus ponctuels de Poisson de mesures d'intensité   et  . Alors la superposition   des deux processus est un processus ponctuel de Poisson de mesure d'intensité  .

Proposition (Amincissement (thinning) d'un processus ponctuel de Poisson)[1],[3] —  Soient   un processus ponctuel de Poisson de mesure d'intensité   et   une fonction mesurable. Nous construisons le processus   en décidant pour chaque point   du processus  , et de manière indépendante, de la garder avec probabilité   et de l'effacer avec probabilité  .

Alors le processus   est un processus ponctuel de Poisson de mesure d'intensité  .

Proposition (Loi du processus conditionné par le nombre de points)[1],[3] —  Soit   un processus ponctuel de Poisson d'intensité   et soit   un borélien borné de  . Alors conditionnellement à l'événement  , les   points du processus sont des réalisations indépendantes et identiquement distribuées de loi  .

Simulation d'un processus ponctuel de Poisson modifier

 
 , fenêtre  
 
 , fenêtre  

La dernière proposition fournit une méthode simple et très efficace pour simuler des processus ponctuels de Poisson.

Pour simuler un processus ponctuel de Poisson d'intensité   dans un compact  [1],[3] :

  • Déterminer le nombre de points. Pour ce faire on simule une loi de Poisson   de moyenne  .
  • Déterminer la position des   points. Pour cela, on simule   variables aléatoires i.i.d. de loi   restreinte sur  .

L'objet simulé est une réalisation du processus ponctuel de Poisson sur la fenêtre   de mesure d'intensité  .

Formule de Slivnyak-Mecke modifier

La formule de Slivnyak-Mecke[5],[6], aussi connue sous le nom de formule de Campbell, est une formule très utilisée en géométrie stochastique et en physique statistique.

Théorème —  Soit   une fonction mesurable et   un processus ponctuel de Poisson d'intensité  . Alors nous avons

 

Le terme de droite est dans de nombreux cas calculable et permet de calculer en moyenne, grâce à la formule de Slivnyak-Mecke, la somme des contributions de chaque point du processus.

Processus de Hawkes modifier

Le processus ponctuel de Hawkes (ou processus auto-excité) est un processus ponctuel pour lequel les réalisations futures dépendent des réalisations passées. Cette caractéristique le différencie des processus ponctuels de Poisson pour lesquels l'indépendance entre deux événements est une propriété fondamentale.

Le processus de Hawkes a été formalisé pour la première fois par Alan G. Hawkes en 1971[7], sous le nom de processus auto-excité. Ce processus a d'abord été utilisé en sismologie[8] pour modéliser la survenue de répliques suites à un séisme. Depuis, de nombreuses variantes du processus ont été développées et utilisées dans divers domaines, par exemple en sociologie pour étudier la diffusion des mèmes sur les réseaux sociaux[9], en épidémiologie pour modéliser la diffusion d'une maladie[10] ou encore en neurosciences pour modéliser les influx nerveux dans les neurones[11].

Processus de Hawkes univarié modifier

Dans l'article fondateur de Alan G. Hawkes[7], le processus auto-excité est défini à partir de son intensité au temps  , notée  . L'intensité d'un processus ponctuel est une mesure du taux instantané d'occurrence d'événements. Dans le cas du processus de Hawkes, l'intensité   s'écrit :

 

Dans cette formule, l'intensité est formée de deux composantes : le scalaire   qui représente le taux d'occurrence spontané (qui n'est pas dû aux événements antérieurs) et l'intégrale entre   et  , qui désigne la dépendance aux temps antérieurs. Ainsi, l'intensité au temps   dépend du nombre d'événements qui sont survenus au temps   (antérieur à  )  .

L'influence de   sur   est décrite par la fonction  , appelée noyau. Le noyau décrit la façon dont l'excitation évolue en fonction du délai   entre un événement passé (survenu au temps  ) et le temps  . Cette fonction doit tendre vers zéro quand l'intervalle de temps est grand (l'excitation s'atténue) et elle doit prendre des valeurs positives uniquement. Cependant, des extensions du processus de Hawkes ont été proposées dans lesquelles   peut prendre des valeurs négatives, et ainsi modéliser une auto-inhibition. Une paramétrisation simple de   est l'exponentielle décroissante, par exemple de la forme   (avec   un paramètre de la fonction, scalaire).

Processus de Hawkes multivarié modifier

Les processus de Hawkes ont également été généralisés au cas multivarié[3] : c'est-à-dire que plusieurs éléments (dimensions) s'excitent mutuellement. Par exemple, il peut s'agir de plusieurs neurones qui vont se transmettre des influx nerveux les uns aux autres. Dans le cas multivarié, l'équation du processus de Hawkes devient :

 

L'indice   ( ) signifie qu'on s'intéresse à la dimension   (neurone   par exemple). Comme dans le cas univarié,   représente le taux d'occurrence spontané (qui peut être différent pour chaque dimension  ). L'intégrale entre   et   décrit l'influence de l'histoire du processus : pour la dimension  , on va sommer les influences des   dimensions, et le noyau   décrit l'influence du neurone   ( ) sur le neurone  . On intègre la fonction   sur  , qui est le nombre d'événements survenus au temps   dans la dimension  . Dans le cas où  ,   décrit l'auto-excitation de la dimension   sur elle-même.

Dans le cas où on observe un processus de Hawkes, mais qu'on ne connaît pas les  , la question d'intérêt est souvent de déterminer quelles fonctions   sont non-nulles. En effet, si   est différente de zéro, cela signifie que la dimension   excite la dimension  . Par exemple, dans le cas où on observe des neurones, une fonction   non nulle peut signifier que le neurone   est connecté au neurone  .

Autres développements modifier

De nombreuses généralisations du processus de Hawkes ont été proposées : pour prendre en compte l'auto-inhibition, dans le cas spatio-temporel, avec des noyaux non-paramétriques ou encore avec une intensité log-linéaire. De nombreux algorithmes d'inférence ont aussi été proposés afin de déterminer les paramètres (inconnus) d'un processus de Hawkes à partir d'une de ses réalisations.

Notes et références modifier

  1. a b c d et e Chiu, Sung Nok., Kendall, W. S. et Mecke, Joseph., Stochastic geometry and its applications., , 544 p. (ISBN 978-0-470-66481-0, OCLC 843455184, lire en ligne)
  2. Matthes, Klaus, et Mecke, Joseph,, Infinitely divisible point processes, Wiley, (ISBN 978-0-471-99460-2)
  3. a b c d e f et g Daley et Vere-Jones 2007
  4. a et b (en) « Simple Results for Stationary Point Processes on the Line », dans An Introduction to the Theory of Point Processes: Volume I: Elementary Theory and Methods, Springer, coll. « Probability and its Applications », (ISBN 978-0-387-21564-8, DOI 10.1007/0-387-21564-6_3, lire en ligne), p. 41–65
  5. (en) Schneider, Rolf., Stochastic and integral geometry, Berlin, Springer, (ISBN 978-3-540-78859-1, OCLC 271648052, lire en ligne)
  6. (en) Kallenberg, Olav., Random measures, Berlin/London/Orlando/San Diego etc., Akademie-Verlag, , 187 p. (ISBN 0-12-394960-2, OCLC 16646248, lire en ligne)
  7. a et b ALAN G. HAWKES, « Spectra of some self-exciting and mutually exciting point processes », Biometrika, vol. 58, no 1,‎ , p. 83–90 (ISSN 0006-3444, DOI 10.1093/biomet/58.1.83, lire en ligne, consulté le )
  8. (en) Yosihiko Ogata, « Space-Time Point-Process Models for Earthquake Occurrences », Annals of the Institute of Statistical Mathematics, vol. 50, no 2,‎ , p. 379–402 (ISSN 1572-9052, DOI 10.1023/A:1003403601725, lire en ligne, consulté le )
  9. Chuan Luo, Xiaolong Zheng et Daniel Zeng, « Inferring social influence and meme interaction with Hawkes processes », 2015 IEEE International Conference on Intelligence and Security Informatics (ISI),‎ , p. 135–137 (DOI 10.1109/ISI.2015.7165953, lire en ligne, consulté le )
  10. (en) Wen-Hao Chiang, Xueying Liu et George Mohler, « Hawkes process modeling of COVID-19 with mobility leading indicators and spatial covariates », International Journal of Forecasting,‎ (ISSN 0169-2070, DOI 10.1016/j.ijforecast.2021.07.001, lire en ligne, consulté le )
  11. (en) Régis C. Lambert, Christine Tuleau-Malot, Thomas Bessaih et Vincent Rivoirard, « Reconstructing the functional connectivity of multiple spike trains using Hawkes models », Journal of Neuroscience Methods, vol. 297,‎ , p. 9–21 (DOI 10.1016/j.jneumeth.2017.12.026, lire en ligne, consulté le )

Bibliographie modifier

  • (en) Daryl J Daley et David Vere-Jones, An introduction to the theory of point processes : general theory and structure, vol. II, Springer Science and Business Media, (1re éd. 1988)

Articles connexes modifier