Soient des variables aléatoires
(
X
i
)
i
∈
N
∗
{\displaystyle (X_{i})_{i\in \mathbb {N} ^{*}}}
i.i.d. définies sur un espace de probabilité
(
Ω
,
T
,
P
)
{\displaystyle (\Omega ,{\mathcal {T}},\mathbb {P} )}
à valeurs dans un espace mesurable
(
X
,
A
)
{\displaystyle ({\mathcal {X}},{\mathcal {A}})}
et
F
{\displaystyle {\mathcal {F}}}
une classe de fonctions mesurables de
(
X
,
A
)
{\displaystyle ({\mathcal {X}},{\mathcal {A}})}
à valeurs réelles. On dit que
F
{\displaystyle {\mathcal {F}}}
est une classe de Donsker si elle vérifie la propriété
α
n
⟶
L
n
→
+
∞
G
dans
ℓ
∞
(
F
)
{\displaystyle \alpha _{n}{\underset {n\to +\infty }{\overset {\mathcal {L}}{\longrightarrow }}}\mathbb {G} \qquad {\text{ dans }}\ell ^{\infty }({\mathcal {F}})}
avec
α
n
{\displaystyle \alpha _{n}}
le processus empirique indexé par la classe de fonctions
F
{\displaystyle {\mathcal {F}}}
et
G
{\displaystyle \mathbb {G} }
le pont brownien indexé par
F
{\displaystyle {\mathcal {F}}}
, i.e. le processus gaussien centré dont la fonction de covariance est donnée par
∀
f
,
g
∈
F
,
Cov
(
G
(
f
)
,
G
(
g
)
)
=
E
[
f
(
X
)
g
(
X
)
]
−
E
[
f
(
X
)
]
E
[
g
(
X
)
]
.
{\displaystyle \forall f,g\in {\mathcal {F}},\quad {\text{Cov}}(\mathbb {G} (f),\mathbb {G} (g))=\mathbb {E} [f(X)g(X)]-\mathbb {E} [f(X)]\mathbb {E} [g(X)].}
Puisqu'une classe de Donsker
F
{\displaystyle {\mathcal {F}}}
dépend de la mesure
P
=
P
X
{\displaystyle P=\mathbb {P} ^{X}}
la loi des
X
i
{\displaystyle X_{i}}
, on peut dire en cas d'éventuelle confusion sur la loi que
F
{\displaystyle {\mathcal {F}}}
est une classe de
P
{\displaystyle P}
-Donsker.
En particulier, le théorème de Donsker revient à dire que la classe des fonctions indicatrices
F
=
{
x
↦
1
{
x
≤
t
}
:
t
∈
R
}
{\displaystyle {\mathcal {F}}=\{x\mapsto \mathbf {1} _{\{x\leq t\}}:t\in \mathbb {R} \}}
est une classe de Donsker. Ce théorème dit donc que le processus empirique converge en loi vers un pont brownien.
Les conditions suffisantes évoquées dans cette partie[ 1] impliquent implicitement la continuité du processus limite d'après le théorème de Dudley [ 2] .
Condition avec l'entropie avec crochet
modifier
Soit
F
{\displaystyle {\mathcal {F}}}
une classe de fonctions mesurables vérifiant
∫
0
+
∞
H
[
]
(
F
,
ε
,
L
2
(
P
)
)
d
ε
<
+
∞
,
{\displaystyle \int _{0}^{+\infty }{\sqrt {H_{[\ ]}({\mathcal {F}},\varepsilon ,L_{2}(P))}}\mathrm {d} \varepsilon <+\infty ,}
où
H
[
]
(
F
,
ε
,
d
)
{\displaystyle H_{[\ ]}({\mathcal {F}},\varepsilon ,d)}
est le logarithme de
N
(
F
,
ε
,
d
)
{\displaystyle N({\mathcal {F}},\varepsilon ,d)}
, le nombre de recouvrements avec crochets de
F
{\displaystyle {\mathcal {F}}}
de rayon
ε
{\displaystyle \varepsilon }
et avec la distance
d
{\displaystyle d}
. Alors
F
{\displaystyle {\mathcal {F}}}
est une classe de Donsker
On note
H
(
F
,
ε
,
d
)
{\displaystyle H({\mathcal {F}},\varepsilon ,d)}
le logarithme de
N
(
F
,
ε
,
d
)
{\displaystyle N({\mathcal {F}},\varepsilon ,d)}
du nombre de recouvrement de
F
{\displaystyle {\mathcal {F}}}
de rayon
ε
{\displaystyle \varepsilon }
et avec la distance
d
{\displaystyle d}
. Supposons que
F
{\displaystyle {\mathcal {F}}}
est une classe de fonctions satisfaisant les conditions
∫
0
+
∞
sup
Q
H
(
F
,
ε
|
|
F
|
|
Q
,
2
,
L
2
(
P
)
)
d
ε
{\displaystyle \int _{0}^{+\infty }\sup _{Q}{\sqrt {H({\mathcal {F}},\varepsilon ||F||_{Q,2},L_{2}(P))}}\mathrm {d} \varepsilon }
, où
F
{\displaystyle F}
est une enveloppe de
F
{\displaystyle {\mathcal {F}}}
et le supremum est pris sur l'ensemble des mesures de probabilité discrètes de
(
X
,
A
)
{\displaystyle ({\mathcal {X}},{\mathcal {A}})}
telles que
|
|
F
|
|
Q
,
2
2
=
∫
F
2
d
Q
>
0
{\displaystyle ||F||_{Q,2}^{2}=\int F^{2}\mathrm {d} Q>0}
;
Les classes
F
ε
:=
{
f
−
g
:
f
,
g
∈
F
,
|
|
f
−
g
|
|
P
,
2
<
ε
}
{\displaystyle {\mathcal {F}}_{\varepsilon }:=\{f-g:f,g\in {\mathcal {F}},||f-g||_{P,2}<\varepsilon \}}
et
F
∞
2
{\displaystyle {\mathcal {F}}_{\infty }^{2}}
sont
P
{\displaystyle P}
-mesurables pour tout
ε
>
0
{\displaystyle \varepsilon >0}
;
P
F
2
<
+
∞
{\displaystyle PF^{2}<+\infty }
avec
F
{\displaystyle F}
une enveloppe de
F
{\displaystyle {\mathcal {F}}}
.
Alors
F
{\displaystyle {\mathcal {F}}}
est
P
{\displaystyle P}
-Donsker.
La première condition est généralement appelée « condition d'entropie uniforme ».
Condition avec les deux entropies
modifier
Soit
F
{\displaystyle {\mathcal {F}}}
une classe de fonctions mesurables vérifiant
∫
0
+
∞
log
N
[
]
(
F
,
ε
,
L
2
,
∞
(
P
)
)
d
ε
+
∫
0
+
∞
log
N
(
F
,
ε
,
L
2
(
P
)
)
d
ε
<
+
∞
.
{\displaystyle \int _{0}^{+\infty }{\sqrt {\log N_{[\ ]}({\mathcal {F}},\varepsilon ,L_{2,\infty }(P))}}\mathrm {d} \varepsilon +\int _{0}^{+\infty }{\sqrt {\log N({\mathcal {F}},\varepsilon ,L_{2}(P))}}\mathrm {d} \varepsilon <+\infty .}
De plus, on suppose que
F
{\displaystyle {\mathcal {F}}}
possède une enveloppe
F
{\displaystyle F}
admettant un moment de second ordre faible (i.e.
P
(
F
>
x
)
=
o
(
x
−
2
)
,
x
→
∞
{\displaystyle P(F>x)=o(x^{-2}),x\to \infty }
). Alors
F
{\displaystyle {\mathcal {F}}}
est une classe de
P
{\displaystyle P}
-Donsker.
↑ (en) Aad W. Van Der Vaart et Jon. A. Wellner, Weak convergence and empirical processes with applications to statistics , Springer, p. 127
↑ (en) Michel Ledoux et Michel Talagrand, Probability in Banach spaces , Springer, p. 321