Test de Student

test statistique
(Redirigé depuis Test t)
Test de Student
Régions de rejet au niveau 10% d'un test de Student à 7 degrés de liberté.
Type
Test statistique, test paramétrique (d)Voir et modifier les données sur Wikidata
Inventeur
William Gosset (« Student »)

En statistique, un test de Student[1], ou test t[2], désigne n'importe quel test statistique paramétrique où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.

Histoire modifier

 
Façade de la brasserie historique Guinness de St. James.
 
William Sealy Gosset, qui inventa le test t, sous le pseudonyme Student.

Le test de Student et la loi de probabilités qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset[3]. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de bière stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[4].

Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.

Exemples d'utilisation modifier

Le test t a plusieurs utilisations dont voici les plus fréquentes :

  • Comparaison de moyenne d'une loi normale à une valeur si la variance est inconnue.
  • Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues. Dans le cas où leurs variances sont différentes et inconnues, on utilise une adaptation appelée le test t de Welch.
  • Test sur les coefficients dans le cadre d'une régression linéaire.
  • Test sur des échantillons appariés[pas clair]

Principe : test de Student sur un échantillon de loi normale modifier

On souhaite comparer la moyenne μ d'une population de loi normale et d’écart type σ non connu à une valeur déterminée μ0. L'hypothèse nulle est H0 : μ = μ0, autrement dit on suppose a priori que la moyenne vaut μ0. On se place maintenant sous l'hypothèse nulle. On considère un échantillon de taille n de cette population  , autrement dit, selon l'hypothèse nulle, chaque   est une variable aléatoire qui soit une loi normale de moyenne μ0 et d'écart type σ. De plus, les   sont indépendantes. On estime alors la moyenne par la moyenne empirique :

  .

Selon l’hypothèse nulle, la distribution d’échantillonnage de la moyenne   se distribue elle aussi normalement avec un écart type σ/n. Comme la variance σ2 est inconnue, on l'estime par son estimateur sans biais (on note la division par   au lieu de   afin d'avoir un estimateur sans biais) :

 .

D'après le théorème de Cochran, sous l'hypothèse nulle,  suit une loi du chi deux à n – 1 degrés de liberté.

On pose la statistique de test suivante :

 

Par définition, la statistique   suit une loi de Student à n – 1 degrés de liberté. On choisit un risque α, généralement 0,05 ou 0,01[réf. nécessaire] et l'on calcule la réalisation de la statistique de test :

  .

On rappelle que l'on veut tester H0 : μ = μ0. Ainsi, si |z| est supérieur au quantile d'ordre 1 – α/2 de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.

  • Cas où l'on veut tester H0 : μμ0 : si z est supérieur au quantile d'ordre 1 – α de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.
  • Cas où l'on veut tester H0 : μμ0 : si z est inférieur au quantile d'ordre α de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.

Remarque : si l'on note tk, α le quantile d'ordre α de la loi de Student à k degrés de liberté alors on a l'égalité tk, α = – tk, 1 – α.

Implémentation modifier

Langage/Logiciel Fonction Notes
R t.test [1]
SAS PROC TTEST [2]
Python scipy.stats.ttest_ind [3]
Matlab ttest [4]
Mathematica TTEST [5]
Stata ttest [6]
Julia OneSampleTTest

EqualVarianceTTest

[7]
Maple OneSampleTTest, TwoSampleTTest, TwoSamplePairedTTest [5]

Notes et références modifier

  1. Bernard Ycart, « Tests statistiques », Cahier de Mathématiques Appliquées, no 6,‎ (lire en ligne [PDF])
  2. Gaël Millot, Comprendre et réaliser les tests statistiques à l'aide de R : manuel de biostatistique, dl 2018 (ISBN 978-2-8073-0291-4 et 2-8073-0291-2, OCLC 1023590131, lire en ligne)
  3. (en) "Student" William Sealy Gosset, « The probable error of a mean », Biometrika, vol. 6, no 1,‎ , p. 1–25 (DOI 10.1093/biomet/6.1.1)
  4. Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans (en) S. L. Zabell, « On Student's 1908 paper "The probable error of the mean" », Journal of the American Statistical Association, vol. 103,‎ , p. 1-7 (DOI 10.1198/016214508000000030)
  5. « Student's t-Test - Maple Help », sur www.maplesoft.com (consulté le )

Voir aussi modifier

  • Loi de Student, la loi de probabilité de la statistique dans le test t
  • Test t de Welch, une adaptation pour comparer deux moyennes de deux lois normales dont les variances sont inconnues et inégales
  • Test de Wald