Approximation forte

L'approximation forte est une notion en probabilité théorique qui est apparue durant la seconde moitié du XXe siècle, notamment après le théorème de Strassen de 1964. Les résultats d'approximation forte permettent de créer des espaces de probabilité convenables sur lesquels les sommes partielles ou le processus empirique, vont être proches des objets (comme le mouvement brownien ou le pont brownien) vers lesquels ils convergent.

PrincipeModifier

Le théorème de représentation de Skorokhod énonce qu'une suite de variables aléatoires   converge en loi vers une variable aléatoire   s'il existe un espace aléatoire sur lequel sont définies des copies   et   respectivement de   et   tels que la suite   converge presque sûrement vers  .

L'approximation forte consiste donc à construire ces espaces de probabilités sur lesquels les objets que l'on étudie, comme les sommes partielles   ou le processus empirique   (où   est la mesure empirique et   la loi des variables   supposées i.i.d.). vont être proches de leurs limites, comme le mouvement brownien ou le pont brownien. En outre de donner un moyen pratique d'établir une convergence en loi, l'approximation forte donne une vitesse de convergence vers l'objet limite.

Approximation forte des sommes partiellesModifier

Soient   des variables i.i.d. et   la somme partielle de ces variables aléatoires. En 1961, le théorème de Skorokhod établit qu'on peut écrire en loi une somme partielle comme un mouvement brownien évalué en des temps d'arrêts.

À la suite de ce résultat, le théorème de Strassen apparaît en 1964 et introduit pour la première fois la notion d'approximation forte. Il établit que sous la seule condition que les variables admettent un moment d'ordre deux, on peut approcher presque-sûrement sur un espace de probabilité convenable la somme partielle   par un mouvement brownien   avec une borne en  . Bien qu'il soit optimal et puissant, ce résultat n'est pas suffisant pour démontrer des théorèmes comme le théorème de Donsker.

En 1975-1976[1],[2], les mathématiciens Komlós, Tusnády et Major établissent que si la fonction génératrice des variables aléatoires est définie sur un voisinage de 0 alors on peut approcher presque-sûrement   par un mouvement brownien avec une borne en  . Ce résultat est connu comme le théorème d'approximation KMT. C'est un résultat optimal aussi bien par rapport à la borne d'approximation que par l'hypothèse d'existence de la fonction génératrice au voisinage de 0.

Approximation forte du processus empiriqueModifier

Approximation du processus empiriqueModifier

Le premier résultat concernant l'approximation forte du processus empirique est dû à Brillinger en 1969[3]. Celui-ci établit que si   est une suite de variables i.i.d. de loi uniforme sur   alors il existe une suite de copies   et une suite de ponts browniens   tel que presque-sûrement

 

Dans leurs articles[1],[2], Komlós, Tusnády et Major ont établi que si   est une suite de variables i.i.d. de loi uniforme sur   alors il existe une suite de ponts browniens   tel que presque-sûrement

 

  sont des constantes universelles positives. Ce qui entraîne d'après le lemme de Borel-Cantelli : presque-sûrement,

 

L'approximation du processus empirique fourni par KMT est encore cette fois optimale.

Approximation du processus empirique par un processus de KieferModifier

Jack Kiefer fut le premier mathématicien à considérer le processus empirique   comme un processus à deux paramètres et que celui-ci devait par conséquent être approché par un processus gaussien bidimensionnel. Il prouve notamment que si   est une suite de variables i.i.d. de loi uniforme sur  , il existe un processus de Kiefer   vérifiant presque-sûrement, [4]

 

Par la suite, le théorème KMT fournit une meilleure approximation du processus empirique par le processus de Kiefer : si   est une suite de variables i.i.d. de loi uniforme sur   alors il existe un processus de Kiefer   tel que[5]

 

  sont des constantes universelles positives. Ce qui entraîne d'après le lemme de Borel-Cantelli : presque-sûrement,

 

Approximation du processus empirique indexé par une classe de fonctionsModifier

Berthet et Mason ont généralisé en 2006[6] l'approximation forte du processus empirique indexé par une classe de fonctions   soumises à des conditions d'entropie. On travaillera avec des variables   i.i.d. de loi   définies sur un espace de probabilité   à valeurs dans un espace  , avec une classe de fonctions   incluses dans l'ensemble des fonctions mesurables de   à valeurs réelles. On pose les hypothèses suivantes :

Hypothèse   :   ;

Hypothèse   :   est ponctuellement mesurable, i.e. il existe un sous-ensemble dénombrable   tel que tout élément de   puisse s'écrire comme limite d'une suite d'éléments de  .

Hypothèse VC :   et une enveloppe de fonction   de   tel que

 

  • le supremum est pris parmi toutes les mesures de probabilité   de   pour lesquelles   ;
  •   est le nombre de recouvrement de   par des boules de rayon   pour une distance  .
  •   est la semi-métrique   avec   une mesure de probabilité sur  .

Hypothèse BR :    est l'entropie avec crochets de   de rayon   avec la distance  , c'est-à-dire du log du nombre de recouvrement avec crochets avec les mêmes paramètres.

Si   vérifie les conditions  , VC ou BR alors  , il existe  , une suite   de réels strictement positifs et de limite nulle, des variables   i.i.d. de loi   et une suite indépendante   de processus de  -pont brownien définis sur un même espace de probabilité vérifiant

 

et

 

La deuxième relation provient de la première en effectuant un raisonnement par blocs et en appliquant le lemme de Borel-Cantelli.

Remarques :

  • L'hypothèse   est une condition sur l'existence d'une enveloppe de la classe de fonction, i.e. d'une fonction mesurable   telle que   ;
  • La seconde condition   permet de s'assurer de la bonne définition du processus limite ;
  • L'hypothèse VC n'est pas la définition d'une classe VC mais une propriété vérifiée par les classes VC à savoir que ce sont des classes polynomiales, c'est-à-dire que le recouvrement d'une classe VC est polynomiale en son rayon  .

RéférencesModifier

  1. a et b (en) J. Komlos, P. Major et G. Tusnady, « An approximation of partial sums of independent RV’-s, and the sample DF. I », Z. Wahrscheinlichkeitstheorie verw, no Gebiete 32,‎ , p. 211-226 (lire en ligne)
  2. a et b (en) J. Komlos, P. Major et G. Tusnady, « An approximation of partial sums of independent RV'-s and the sample DF. II », Z. Wahrscheinlichkeitstheorie verw, no Gebiete 34,‎ , p. 33-58 (lire en ligne)
  3. (en) D. L. Brillinger, « An asymptotic representation of the sample distribution function », Bulletin of the American Mathematical Society, vol. 75,‎ , p. 545-547 (lire en ligne)
  4. (en) Jack Kiefer, « Skorohod Embedding of Multivariate RV's and the sample DF », Z. Wahrscheinlichkeitstheorie verw. Gebiete, vol. 24,‎ , p. 1-35
  5. (en) M. Csörgo et P. Révész, Strong approximations in probability and statistics
  6. (en) Philippe Berthet et David Mason, « Revisiting two strong approximation results of Dudley and Philipp », IMS Lecture Notes–Monograph Series High Dimensional Probability, vol. 51,‎ , p. 155-172 (lire en ligne)