The lady tasting tea

Dans la conception des expériences en statistique, la dame dégustant du thé (the lady tasting tea) est une expérience aléatoire conçue par Ronald Fisher et rapportée dans son livre The Design of Experiments (1935)[1]. L'expérience est l'exposition originale de la notion de Fisher d'une hypothèse nulle, qui "n'est jamais prouvée ou établie, mais est peut-être réfutée, au cours de l'expérimentation"[2],[3].

L'expérience consiste à savoir si un dégustateur peut distinguer au goût une tasse de thé dans laquelle le thé ou le lait a été versé en premier.
Ronald Fisher en 1913.

La dame en question (Muriel Bristol) a affirmé être en mesure de dire si le thé ou le lait avait été ajouté en premier dans une tasse. Fisher a proposé de lui donner huit tasses, quatre de chaque sorte, dans un ordre aléatoire. On peut alors se demander quelle était la probabilité qu'elle obtienne le nombre précis de tasses qu'elle a identifié correctement, juste par chance.

La description de Fisher fait moins de 10 pages et se distingue par sa simplicité et son exhaustivité en ce qui concerne la terminologie, les calculs et la conception de l'expérience[4]. L'exemple s'inspire librement d'un événement de la vie de Fisher. Le test utilisé était le test exact de Fisher .

L'expérience modifier

L'expérience fournit à un sujet 8 tasses de thé classées au hasard – 4 préparées en versant d'abord le thé, puis en ajoutant du lait, 4 préparées en versant d'abord le lait, puis en ajoutant le thé. Le sujet doit sélectionner 4 tasses préparées selon une méthode. Il est permis de juger des coupes par comparaison directe. La méthode employée dans l'expérience est entièrement divulguée au sujet.

L' hypothèse nulle est que le sujet n'a pas la capacité de distinguer les thés. Dans l'approche de Fisher, il n'y avait pas d' hypothèse alternative[2], contrairement à l'approche Neyman – Pearson.

La statistique du test est un simple décompte du nombre de succès dans la sélection des 4 tasses (le nombre de tasses du type donné sélectionné avec succès). La distribution du nombre possible de succès, en supposant que l'hypothèse nulle est vraie, peut être calculée en utilisant le nombre de combinaisons. En utilisant la formule de combinaison, avec   total de tasses et   tasses choisies, le nombre de combinaisons donnant lieu à un succès est de :

 
Distribution de dégustation de thé en supposant l'hypothèse nulle.
Nombre de succès Combinaisons de sélection Nombre de combinaisons
0 oooo 1 × 1 = 1
1 ooox, ooxo, oxoo, xooo 4 × 4 = 16
2 ooxx, oxox, oxxo, xoxo, xxoo, xoox 6 × 6 = 36
3 oxxx, xoxx, xxox, xxxo 4 × 4 = 16
4 xxxx 1 × 1 = 1
Total 70

Les fréquences des nombres possibles de succès, données dans la dernière colonne de ce tableau, sont calculées comme suit :

  • pour 0 succès, il n'y a clairement qu'un seul ensemble de quatre choix (à savoir, choisir les quatre tasses incorrectes) donnant ce résultat.
  • pour un succès et trois échecs, il y a quatre tasses correctes dont une est sélectionnée, qui par la formule de combinaison peut se produire dans   différentes manières (comme indiqué dans la colonne 2, où x indique une tasse correcte qui est choisie et o une tasse correcte qui n'est pas choisie) ; indépendamment de cela, il y a quatre tasses incorrectes dont trois sont sélectionnées, ce qui peut se produire dans   manières (comme indiqué dans la deuxième colonne, cette fois avec x interprété comme une tasse incorrecte qui n'est pas choisie, et o indiquant une tasse incorrecte qui est choisie). Ainsi, une sélection de n'importe quelle tasse correcte et de trois tasses incorrectes peut se produire de l'une des 4 × 4 = 16 manières. Les fréquences des autres nombres possibles de succès sont calculées en conséquence. Ainsi, le nombre de succès est réparti selon la distribution hypergéométrique. La distribution des combinaisons pour effectuer k sélections parmi les 2k sélections disponibles correspond à la k-ème ligne du triangle de Pascal, de sorte que chaque entier de la ligne soit au carré. Dans ce cas,   car 4 tasses de thé sont sélectionnées parmi les 8 tasses de thé disponibles.

La région critique pour le rejet de hypothèse nulle de non-capacité à distinguer était le cas unique de 4 succès sur 4 possibles, sur la base du critère de probabilité conventionnel < 5%. C'est la région critique car sous le nul de non-capacité à distinguer, 4 succès ont 1 chance sur 70 (≈ 1,4 % < 5 %) de se produire, alors qu'au moins 3 succès sur 4 ont une probabilité de (16 + 1) / 70 (≈ 24,3 % > 5 %).

Ainsi, Fisher était prêt à rejeter l'hypothèse nulle si et seulement si la dame a correctement distingué les 8 tasses, reconnaissant effectivement la capacité de la dame à un niveau de signification de 1,4 % (mais sans quantifier sa capacité). Fisher a discuté plus tard des avantages de réaliser plusieurs essais et de tests répétés.

David Salsburg rapporte qu'un collègue de Fisher, H. Fairfield Smith, a révélé que dans l'expérience réelle, la dame avait réussi à identifier correctement les huit tasses[5],[6]. La chance que quelqu'un devine juste toutes les tasses, en supposant que cette personne pose pour hypothèse que quatre tasses ont reçu le thé en premier et que les quatre autres ont reçu le lait en premier, ne serait que de 1 sur 70 (les combinaisons de 8 prises 4 à la fois).

Le livre de The Lady Tasting Tea modifier

David Salsburg a publié un livre de vulgarisation scientifique intitulé The Lady Tasting Tea[5], qui décrit l'expérience et les idées de Fisher sur la randomisation. Deb Basu a écrit que "le cas célèbre de la dame dégustant du thé" était "l'un des deux piliers ... de l'analyse aléatoire des données expérimentales"[7].

Voir également modifier

Références modifier

  1. Fisher 1971, II. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment.
  2. a et b Fisher 1971, Chapter II. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment, Section 8. The Null Hypothesis.
  3. OED quote: 1935 R. A. Fisher, The Design of Experiments ii. 19, "We may speak of this hypothesis as the 'null hypothesis' [...] the null hypothesis is never proved or established, but is possibly disproved, in the course of experimentation."
  4. Sir Ronald A. Fisher, The World of Mathematics, volume 3, Courier Dover Publications, (1re éd. The Design of Experiments (1935)) (ISBN 978-0-486-41151-4), « Mathematics of a Lady Tasting Tea ».
  5. a et b Salsburg (2002).
  6. Joan Fisher Box, R.A. Fisher, The Life of a Scientist, New York, Wiley, (ISBN 0-471-09300-9), p. 134.
  7. Basu (1980a, p. 575; 1980b).