Processus gaussien

En théorie des probabilités et en statistiques, un processus gaussien est un processus stochastique (une collection de variables aléatoires avec un index temporel ou spatial) de telle sorte que chaque collection finie de ces variables aléatoires suit une loi normale multidimensionnelle ; c'est-à-dire que chaque combinaison linéaire est normalement distribuée. La distribution d'un processus gaussien est la loi jointe de toutes ces variables aléatoires. Ses réalisations sont donc des fonctions avec un domaine continu.

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources (avril 2021).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?

Définition modifier

Un processus stochastique $X$ sur un ensemble fini de sites $S$ est dit gaussien si, pour toute partie finie $A \subset S$ et toute suite réelle $(a)$ sur $A$ , $\sum s \in A a s X (s)$ est une variable gaussienne. Autrement dit, $X=(X_{t})_{t}$ avec $t\in \{1,...,n\}$ , $(X_{1},...,X_{n})$ est un vecteur gaussien.

De ce fait, la loi d'un processus gaussien est entièrement déterminée par sa fonction moyenne $m(t)\ =\ \mathbb {E} [X_{t}]$ et son opérateur de covariance $K(s,t)\ =\ Cov(X_{s},X_{t})$ ^[1].

Posant $m A$ et $Σ A$ la moyenne et la covariance de $X$ sur $A$ , si $Σ A$ est inversible, alors $X A = (X s, s \in A)$ admet pour densité (ou vraisemblance) par rapport à la mesure de Lebesgue sur $ℝ card(A)$ : $f_{A}\left(x_{A}\right)=\left(2\operatorname {\pi } \right)^{-{\frac {\operatorname {card} \left(A\right)}{2}}}\left(\operatorname {det} \Sigma _{A}\right)^{-{\frac {1}{2}}}\operatorname {exp} \left(-{\frac {1}{2}}\left(x_{A}-m_{A}\right)^{\operatorname {T} }{\Sigma _{A}}^{-1}\left(x_{A}-m_{A}\right)\right)$

Processus gaussien en régression modifier

Les méthodes par processus gaussien peuvent être utilisées dans les problèmes de régression.

Le résultat principal intervient lorsque l'on cherche à estimer une fonction $f:\chi \to \mathbb {R}$ dont on a observe $n$ réalisations $(x_{i},f_{i})_{i\in \{1,...,n\}}$ , on note $X={\begin{pmatrix}x_{1}\\...\\x_{n}\end{pmatrix}}$ . On peut modéliser la fonction $f$ par un processus gaussien $Y$ de moyenne $m$ et de fonction de covariance $K$ qui vérifie $Y(x_{i})=f_{i}$ . Pour $n^{*}$ nouveau point de l'espace de départ $\chi$ on note $X^{*}={\begin{pmatrix}x_{1}^{*}\\...\\(x_{n^{*}})^{*}\end{pmatrix}}$ et on a:

${\begin{pmatrix}Y(X)\\Y(X^{*})\end{pmatrix}}\sim {\mathcal {N}}{\biggl (}{\begin{pmatrix}m(X)\\m(X^{*})\end{pmatrix}},{\begin{pmatrix}K(X,X)&K(X,X^{*})\\K(X^{*},X)&K(X^{*},X^{*})\end{pmatrix}}{\Biggr )}$ ^[2].

Voir aussi modifier

Processus de Gauss

Références modifier

↑ Jean-christophe.breton, « Processus Gaussiens »
↑ (en) Carl Edward Rasmussen et Christopher K. I. Williams, Gaussian processes for machine learning, MIT Press, coll. « Adaptive computation and machine learning », 2008 (ISBN 978-0-262-18253-9), chap. 2 (« Regression »), p. 7

Portail des probabilités et de la statistique

[1] Jean-christophe.breton, « Processus Gaussiens »

[2] (en) Carl Edward Rasmussen et Christopher K. I. Williams, Gaussian processes for machine learning, MIT Press, coll. « Adaptive computation and machine learning », 2008 (ISBN 978-0-262-18253-9), chap. 2 (« Regression »), p. 7

[1]

[2]