Lemme de Neyman-Pearson

lemme en statistiques
Lemme de Neyman-Pearson
Type
Inventeurs
Nommé en référence à
Formule
Voir et modifier les données sur Wikidata

En statistique, selon le lemme de Neyman-Pearson, lorsque l'on veut effectuer un test d'hypothèse entre deux hypothèses H0 : θ = θ0 et H1 : θ = θ1, pour un échantillon , alors le test du rapport de vraisemblance, qui rejette H0 en faveur de H1 lorsque , où est tel que

, est le test le plus puissant de niveau .

Ce lemme est nommé d'après Jerzy Neyman et Egon Sharpe Pearson dans un article publié en 1933[1].

En pratique, la plupart du temps, le rapport de vraisemblance lui-même n'est pas explicitement utilisé dans le test. En effet, le test du rapport de vraisemblance ci-dessus est souvent équivalent à un test de la forme pour une statistique plus simple, et le test est effectué sous cette forme-ci.

Démonstration modifier

Théorème : La région de rejet   optimale est définie par l'ensemble des points   tels que

 

où la constante   est telle que  . À noter qu'on a les relations suivantes :

 
 


  est l'échantillon.

Démonstration :

Montrons tout d'abord que lorsque   est une densité bornée, il existe toujours une constante   telle que

 .
En effet, lorsque  , cette probabilité vaut 1. D'autre part, cette probabilité décroit monotonément et continument vers zéro, lorsque  . Par conséquent, il doit exister une valeur finie de  , appelée  , qui satisfait l'égalité,  .
Désignons alors par  , le sous-ensemble de   suivant,
 ,
et soit   une autre partie de  , telle que  .

Montrons que  :

 

 

 

La première intégrale vaut   par construction, la deuxième est majorée par  , on obtient:

  ce qui conclut.

Notes et références modifier

  1. (en) J. Neyman et E. S. Pearson, « IX. On the problem of the most efficient tests of statistical hypotheses », Phil. Trans. R. Soc. Lond. A, vol. 231, nos 694-706,‎ , p. 289–337 (ISSN 0264-3952, DOI 10.1098/rsta.1933.0009, lire en ligne)

Liens externes modifier

Voir aussi modifier