Paradoxe des deux enveloppes

raisonnement probabiliste aboutissant à un résultat absurde, formulé en 1982
(Redirigé depuis Paradoxe des deux chèques)

En théorie de la décision, le paradoxe des deux enveloppes est un raisonnement probabiliste aboutissant à un résultat absurde. Inspiré d'un problème posé en 1930 par le mathématicien belge M. Kraïtchik[1], ce paradoxe a été formulé par Martin Gardner[2] en 1982. Il en existe plusieurs réfutations, certaines[3] ne faisant d'ailleurs pas appel au calcul des probabilités.

Paradoxe des deux enveloppes.

Énoncé

modifier

Il existe plusieurs variantes du paradoxe. Le plus souvent, il est proposé la situation de décision suivante[4],[5] : deux enveloppes contiennent chacune un chèque. On sait que l'un des chèques porte un montant double de l'autre, mais on n'a aucune information sur la façon dont les montants ont été déterminés. Un animateur propose à un candidat de choisir une des enveloppes, le montant du chèque contenu dans l'enveloppe choisie lui sera acquis.

Le paradoxe proprement dit réside dans l'argument qui va suivre : avant que le candidat n'ouvre l'enveloppe choisie, l'animateur lui conseille de changer son choix avec le raisonnement suivant.

Soit   la valeur du chèque dans l'enveloppe choisie. Il y a deux cas possibles :

  • une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus important (donc de valeur  ) ;
  • une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus petit (donc de valeur  ).

L'espérance du montant obtenu en changeant d'enveloppe serait alors   qui est supérieur à  .

Le candidat aurait donc intérêt à changer d'enveloppe, ce qui est absurde puisque les deux enveloppes jouent le même rôle, et que le candidat, n'ayant pas encore ouvert la première, n'a aucun moyen de les distinguer.

Résolutions du paradoxe

modifier

Calcul d’espérances mathématiques

modifier

L'espérance mathématique permet de définir sur un grand nombre d'épreuves le gain moyen d'une loi de probabilité.

Espérance mathématique associée à chaque enveloppe

modifier

Afin de déterminer le gain moyen obtenu par le choix d’une enveloppe, on associe à la première enveloppe (resp. la seconde) la variable aléatoire   (resp.  ).

La loi de probabilité de la variable aléatoire   est l’ensemble des 2 solutions possibles proposées par le jeu (noté sous la forme {valeur ; probabilité d’apparition}) :   et  ,  et   sont les deux montants possibles proposés par le jeu.

Pour la variable aléatoire  , l’ensemble est constitué de façon similaire :   et  [6].

L’espérance du contenu de l’enveloppe 1 est par définition :  .

Pour l’enveloppe 2, on a de façon similaire :  .

On constate que  , ce qui est logique car les deux enveloppes ont un rôle identique.

Espérance mathématique associée à chaque changement

modifier

Si l'on change d’enveloppe, par exemple de l’enveloppe 1 à l’enveloppe 2, on obtient l’espérance   d’obtenir le gain de l’enveloppe 2 moins celui obtenu avec l’enveloppe 1 :  

Ceci est dû à la propriété de linéarité des calculs d’espérance.

On conclut  .

De façon similaire  .

Sur un grand nombre d’épreuves, on ne peut pas espérer de gain en permutant les choix des enveloppes.

Espérance mathématique associée à chaque changement (variante)

modifier

Si l’on considère les 2 changements possibles[5] :

  • passer d’un montant   à un montant   ;
  • passer d’un montant   à un montant  .

On obtient resp. deux gains possibles :

  • le premier est positif de valeur   avec une probabilité d’apparition de 50% ;
  • le second est négatif de valeur   avec une probabilité d’apparition de 50%.

Ceci définit une seconde loi de probabilité avec deux issues possibles (noté {valeur ; probabilité}) :   et  .

Cette seconde loi de probabilité a pour espérance :  .

Ce calcul aboutit lui aussi à un gain moyen nul, il s'agit simplement d'une alternative au calcul détaille de   ou de  .

Espérance mathématique calculée par le présentateur

modifier

Il est intéressant de voir en quoi le raisonnement de l’animateur aurait un défaut. Celui-ci propose la formule suivante :

   est le montant de l’enveloppe choisie. On note que l’on ne connait pas   qui vaut soit  , soit  .

Par définition de l’espérance mathématique d’une loi de probabilité, on obtient de cette formule les deux solutions (noté {valeur ; probabilité d’apparition}) :   et  .

Pour chacune de ces deux solutions, il faut envisager les deux cas possibles   et   :

  • dans le premier cas, on obtient   et   ;
  • dans le second :   et  .

On constate que les solutions possibles  ) et  ) sont contraires aux hypothèses et invalident le raisonnement du présentateur.

En examinant de plus près la formule du présentateur, les deux solutions   et   définissent une autre loi de probabilité. Ainsi   correspond à un autre protocole :

  • ouvrir l’enveloppe choisie,
  • lire son contenu  ,
  • puis remplacer (avec des probabilités égales) le contenu de la seconde par   ou  .

Le présentateur a commis une confusion entre deux lois de probabilité distinctes.

Pour résumer, le présentateur raisonne sur l'Univers   correspondant au protocole juste ci-dessus, alors que l'Univers du paradoxe des deux enveloppes est  .

Remarques
modifier

Supposons que  . Que se passerait-il si l’on permutait plusieurs fois ? Il faudrait détailler les calculs de  ,  , etc. On pourrait conjecturer une impossibilité, par exemple obtenir les deux relations incompatibles   et  .

Variables aléatoires

modifier

Il est cependant possible, en fonction de la modélisation exacte du raisonnement de l'animateur, de considérer que l'erreur réside dans l'interprétation des espérances et non dans leur calcul : David Madore fait ainsi remarquer[3] que si l'on considère qu'il y a deux variables aléatoires,  , valant   ou  , et correspondant (avec probabilités  ) au contenu de la première enveloppe, et  , valant   ou  , et correspondant au contenu de la seconde enveloppe, alors l'espérance de   est bien égale à celle de   et vaut  . Cependant l'espérance du rapport   vaut   ; l'erreur de raisonnement consiste alors à interpréter ce dernier résultat comme signifiant que   est plus intéressant que   (et donc qu'il faut changer d'enveloppe), alors que la seule conclusion à en tirer est le résultat surprenant, mais nullement paradoxal, que :  .

Modifications de l'énoncé

modifier

Si le candidat est autorisé à consulter le contenu de la première enveloppe, une approche probabiliste à ce problème de décision redevient possible : Keith Devlin (suivant une analyse de Amos Storkey) fait ainsi remarquer que si l'animateur a choisi le contenu des enveloppes selon une règle (probabiliste ou non) connue du joueur, il devient possible de prendre une décision rationnelle d'échange en fonction du contenu de la première enveloppe (par exemple, si la règle propose un choix aléatoire uniforme de valeurs d'enveloppes, de choisir d'échanger si le contenu découvert est inférieur à la moyenne des choix offerts par la règle), et David Madore montre même qu'on peut (si peu vraisemblable que cela paraisse) obtenir une probabilité strictement supérieure à 1/2 de choisir la bonne enveloppe quelle que soit la règle utilisée par l'animateur, et ce sans connaitre celle-ci[3]. Avec une information supplémentaire, l'échange peut procurer un gain.

Attention à ne pas confondre avec le paradoxe de Bertrand ou paradoxe de Monty Hall.

Un autre protocole de choix des enveloppes

modifier

John Broome, repris par d'autres auteurs, propose le protocole suivant[7] : l'animateur place dans les enveloppes les montants   et   avec une probabilité   pour   positif ou nul[8]. Il remarque d'abord que lorsque l'enveloppe choisie contient   on a intérêt à échanger puisque l'autre enveloppe contient   puis il montre que lorsque   avec   il y a un gain de   espéré dans l'échange. Il en conclut que dans tous les cas le candidat a intérêt à changer même s'il n'ouvre pas l'enveloppe. Ce qui est paradoxal puisque, si le candidat n'ouvre pas les enveloppes, on a déjà montré qu'il n'y a aucun gain à espérer dans l'échange. Déduire un avantage lorsqu'on n'ouvre pas l'enveloppe de l'avantage espéré en prenant connaissance du contenu de l'enveloppe semble donc abusif ; l'explication vient de ce qu'avec cette distribution, l'espérance (que l'on change ou non d'enveloppe) est infinie[7].

Références

modifier
  1. M. Kraïtchik, La mathématique des jeux ou Récréations mathématiques, Paris, Vuibert, , 566 p.
  2. M. Gardner, La magie des paradoxes [« Aha! Gotcha: Paradoxes to Puzzle and Delight »], éd. Belin, (réimpr. 1985 pour l'édition française), p. 106.
  3. a b et c Explication du paradoxe par David Madore
  4. (en) CASPER J. ALBERS, BARTELD P. KOOI and WILLEM SCHAAFSMA, « Trying to resolve the two-envelope problem » [PDF]
  5. a et b Jean-Paul Delahaye, Paradoxes. Rubrique de divertissements mathématiques pour ceux qui aiment se prendre la tête. Paradoxe des deux enveloppes. (lire en ligne)
  6. Stricto sensu, il est abusif de considérer ces probabilités comme toutes deux de 50% : l'organisateur du jeu ne disposant pas d'un budget infini, la distribution de probabilité de la somme maximale doit être supposée avoir une valeur moyenne estimable, par exemple 100 000 . Cette estimation faite, la distribution de probabilité la moins prévenue, c'est-à-dire celle d'entropie maximale est une exponentielle décroissante. En ce cas, l'autre enveloppe a davantage de chances de spécifier un montant plus petit que plus grand. Voir Inférence bayésienne
  7. a et b [1]
  8. Cette distribution est bien une loi, puisque l'on a (voir série géométrique)  ; on peut cependant remarquer que la variable aléatoire ainsi définie n'a pas d'espérance, puisque  

Liens externes

modifier