Paradoxe des deux enveloppes

En théorie de la décision, le paradoxe des deux enveloppes est un raisonnement probabiliste aboutissant à un résultat absurde. Inspiré d'un problème posé en 1930 par le mathématicien belge M. Kraïtchik^[1], ce paradoxe a été formulé par Martin Gardner^[2] en 1982. Il en existe plusieurs réfutations, certaines^[3] ne faisant d'ailleurs pas appel au calcul des probabilités.

Énoncé

Il existe plusieurs variantes du paradoxe. Le plus souvent, il est proposé la situation de décision suivante^[4]^,^[5] : deux enveloppes contiennent chacune un chèque. On sait que l'un des chèques porte un montant double de l'autre, mais on n'a aucune information sur la façon dont les montants ont été déterminés. Un animateur propose à un candidat de choisir une des enveloppes, le montant du chèque contenu dans l'enveloppe choisie lui sera acquis.

Le paradoxe proprement dit réside dans l'argument qui va suivre : avant que le candidat n'ouvre l'enveloppe choisie, l'animateur lui conseille de changer son choix avec le raisonnement suivant.

Soit $V$ la valeur du chèque dans l'enveloppe choisie. Il y a deux cas possibles :

une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus important (donc de valeur $2V$ ) ;
une chance sur deux que l'autre enveloppe contienne un chèque deux fois plus petit (donc de valeur $V/2$ ).

L'espérance du montant obtenu en changeant d'enveloppe serait alors $E_{pr}=50\%\times 2V+50\%\times V/2=V+V/4=5/4\times V$ qui est supérieur à $V$ .

Le candidat aurait donc intérêt à changer d'enveloppe, ce qui est absurde puisque les deux enveloppes jouent le même rôle, et que le candidat, n'ayant pas encore ouvert la première, n'a aucun moyen de les distinguer.

Résolutions du paradoxe

Calcul d’espérances mathématiques

L'espérance mathématique permet de définir sur un grand nombre d'épreuves le gain moyen d'une loi de probabilité.

Espérance mathématique associée à chaque enveloppe

Afin de déterminer le gain moyen obtenu par le choix d’une enveloppe, on associe à la première enveloppe (resp. la seconde) la variable aléatoire $X_{1}$ (resp. $X_{2}$ ).

La loi de probabilité de la variable aléatoire $X_{1}$ est l’ensemble des 2 solutions possibles proposées par le jeu (noté sous la forme {valeur ; probabilité d’apparition}) : $\{M\,;50\%\}$ et $\{2M\,;50\%\}$ , où $M$ et $2M$ sont les deux montants possibles proposés par le jeu.

Pour la variable aléatoire $X_{2}$ , l’ensemble est constitué de façon similaire : $\{2M\,;50\%\}$ et $\{M\,;50\%\}$ ^[6].

L’espérance du contenu de l’enveloppe 1 est par définition : $E_{1}=E(X_{1})=50\%.M+50\%.2M=3/2.M$ .

Pour l’enveloppe 2, on a de façon similaire : $E_{2}=E(X_{2})=50\%.2M+50\%.M=3/2.M$ .

On constate que $E_{1}=E_{2}=3/2.M$ , ce qui est logique car les deux enveloppes ont un rôle identique.

Espérance mathématique associée à chaque changement

Si l'on change d’enveloppe, par exemple de l’enveloppe 1 à l’enveloppe 2, on obtient l’espérance $E_{12}$ d’obtenir le gain de l’enveloppe 2 moins celui obtenu avec l’enveloppe 1 : $E_{12}=E(X_{2}-X_{1})=E(X_{2})-E(X_{1})$

Ceci est dû à la propriété de linéarité des calculs d’espérance.

On conclut $E_{12}=0$ .

De façon similaire $E_{21}=E_{12}=0$ .

Sur un grand nombre d’épreuves, on ne peut pas espérer de gain en permutant les choix des enveloppes.

Espérance mathématique associée à chaque changement (variante)

Si l’on considère les 2 changements possibles^[5] :

passer d’un montant $M$ à un montant $2M$ ;
passer d’un montant $2M$ à un montant $M$ .

On obtient resp. deux gains possibles :

le premier est positif de valeur $+M$ avec une probabilité d’apparition de 50% ;
le second est négatif de valeur $-M$ avec une probabilité d’apparition de 50%.

Ceci définit une seconde loi de probabilité avec deux issues possibles (noté {valeur ; probabilité}) : $\{+M\,;50\%\}$ et $\{-M\,;50\%\}$ .

Cette seconde loi de probabilité a pour espérance : $E_{ch}=1/2.M-1/2.M=0$ .

Ce calcul aboutit lui aussi à un gain moyen nul, il s'agit simplement d'une alternative au calcul détaille de $E_{12}$ ou de $E_{21}$ .

Espérance mathématique calculée par le présentateur

Il est intéressant de voir en quoi le raisonnement de l’animateur aurait un défaut. Celui-ci propose la formule suivante :

$E_{pr}=50\%.2M_{c}+50\%.M_{c}/2$ où $M_{c}$ est le montant de l’enveloppe choisie. On note que l’on ne connait pas $M_{c}$ qui vaut soit $M$ , soit $2M$ .

Par définition de l’espérance mathématique d’une loi de probabilité, on obtient de cette formule les deux solutions (noté {valeur ; probabilité d’apparition}) : $\{2M_{c}\,;50\%\}$ et $\{M_{c}/2\,;50\%\}$ .

Pour chacune de ces deux solutions, il faut envisager les deux cas possibles $M_{c}=M$ et $M_{c}=2M$ :

dans le premier cas, on obtient $(2M\,;50\%)$ et $(M/2\,;50\%)$ ;
dans le second : $(4M\,;50\%)$ et $(M\,;50\%)$ .

On constate que les solutions possibles $(M/2\,;50\%$ ) et $(4M\,;50\%$ ) sont contraires aux hypothèses et invalident le raisonnement du présentateur.

En examinant de plus près la formule du présentateur, les deux solutions $\{2M_{c}\,;50\%\}$ et $\{M_{c}/2\,;50\%\}$ définissent une autre loi de probabilité. Ainsi $E_{pr}$ correspond à un autre protocole :

ouvrir l’enveloppe choisie,
lire son contenu $M_{c}$ ,
puis remplacer (avec des probabilités égales) le contenu de la seconde par $2M_{c}$ ou $M_{c}/2$ .

Le présentateur a commis une confusion entre deux lois de probabilité distinctes.

Pour résumer, le présentateur raisonne sur l'Univers $\{2M_{c}\,;M_{c}/2\}$ correspondant au protocole juste ci-dessus, alors que l'Univers du paradoxe des deux enveloppes est $\{M\,;2M\}$ .

Remarques

Supposons que $E_{12}>0$ . Que se passerait-il si l’on permutait plusieurs fois ? Il faudrait détailler les calculs de $E_{121}$ , $E_{1212}$ , etc. On pourrait conjecturer une impossibilité, par exemple obtenir les deux relations incompatibles $E_{121}>E_{12}>0$ et $E_{121}=E_{1}=0$ .

Variables aléatoires

Il est cependant possible, en fonction de la modélisation exacte du raisonnement de l'animateur, de considérer que l'erreur réside dans l'interprétation des espérances et non dans leur calcul : David Madore fait ainsi remarquer^[3] que si l'on considère qu'il y a deux variables aléatoires, $X_{1}$ , valant $M$ ou $2M$ , et correspondant (avec probabilités $(1/2\,;1/2)$ ) au contenu de la première enveloppe, et $X_{2}$ , valant $2M$ ou $M$ , et correspondant au contenu de la seconde enveloppe, alors l'espérance de $X_{1}$ est bien égale à celle de $X_{2}$ et vaut $3M/2$ . Cependant l'espérance du rapport $X_{2}/X_{1}$ vaut $(2M/M+M/2M)/2=5/4$ ; l'erreur de raisonnement consiste alors à interpréter ce dernier résultat comme signifiant que $X_{2}$ est plus intéressant que $X_{1}$ (et donc qu'il faut changer d'enveloppe), alors que la seule conclusion à en tirer est le résultat surprenant, mais nullement paradoxal, que : $E(X_{2}/X_{1})=E(X_{1}/X_{2})>1$ .

Modifications de l'énoncé

Si le candidat est autorisé à consulter le contenu de la première enveloppe, une approche probabiliste à ce problème de décision redevient possible : Keith Devlin (suivant une analyse de Amos Storkey) fait ainsi remarquer que si l'animateur a choisi le contenu des enveloppes selon une règle (probabiliste ou non) connue du joueur, il devient possible de prendre une décision rationnelle d'échange en fonction du contenu de la première enveloppe (par exemple, si la règle propose un choix aléatoire uniforme de valeurs d'enveloppes, de choisir d'échanger si le contenu découvert est inférieur à la moyenne des choix offerts par la règle), et David Madore montre même qu'on peut (si peu vraisemblable que cela paraisse) obtenir une probabilité strictement supérieure à 1/2 de choisir la bonne enveloppe quelle que soit la règle utilisée par l'animateur, et ce sans connaitre celle-ci^[3]. Avec une information supplémentaire, l'échange peut procurer un gain.

Attention à ne pas confondre avec le paradoxe de Bertrand ou paradoxe de Monty Hall.

Un autre protocole de choix des enveloppes

John Broome, repris par d'autres auteurs, propose le protocole suivant^[7] : l'animateur place dans les enveloppes les montants $2^{n}$ et $2^{n+1}$ avec une probabilité ${\frac {2^{n}}{3^{n+1}}}$ pour $n$ positif ou nul^[8]. Il remarque d'abord que lorsque l'enveloppe choisie contient $M_{c}=1$ on a intérêt à échanger puisque l'autre enveloppe contient $2$ puis il montre que lorsque $M_{c}=2^{n}$ avec $n>0$ il y a un gain de ${\frac {1}{10}}\times M_{c}$ espéré dans l'échange. Il en conclut que dans tous les cas le candidat a intérêt à changer même s'il n'ouvre pas l'enveloppe. Ce qui est paradoxal puisque, si le candidat n'ouvre pas les enveloppes, on a déjà montré qu'il n'y a aucun gain à espérer dans l'échange. Déduire un avantage lorsqu'on n'ouvre pas l'enveloppe de l'avantage espéré en prenant connaissance du contenu de l'enveloppe semble donc abusif ; l'explication vient de ce qu'avec cette distribution, l'espérance (que l'on change ou non d'enveloppe) est infinie^[7].

Références

↑ M. Kraïtchik, La mathématique des jeux ou Récréations mathématiques, Paris, Vuibert, 1930, 566 p.
↑ M. Gardner, La magie des paradoxes [« Aha! Gotcha: Paradoxes to Puzzle and Delight »], éd. Belin, 1982 (réimpr. 1985 pour l'édition française), p. 106.
↑ ^{a b et c} Explication du paradoxe par David Madore
↑ (en) CASPER J. ALBERS, BARTELD P. KOOI and WILLEM SCHAAFSMA, « Trying to resolve the two-envelope problem » [PDF]
↑ ^{a et b} Jean-Paul Delahaye, Paradoxes. Rubrique de divertissements mathématiques pour ceux qui aiment se prendre la tête. Paradoxe des deux enveloppes. (lire en ligne)
↑ Stricto sensu, il est abusif de considérer ces probabilités comme toutes deux de 50% : l'organisateur du jeu ne disposant pas d'un budget infini, la distribution de probabilité de la somme maximale doit être supposée avoir une valeur moyenne estimable, par exemple 100 000 €. Cette estimation faite, la distribution de probabilité la moins prévenue, c'est-à-dire celle d'entropie maximale est une exponentielle décroissante. En ce cas, l'autre enveloppe a davantage de chances de spécifier un montant plus petit que plus grand. Voir Inférence bayésienne
↑ ^{a et b} [1]
↑ Cette distribution est bien une loi, puisque l'on a (voir série géométrique) $\scriptstyle \sum _{n=0}^{\infty }2^{n}/3^{n+1}=1$ ; on peut cependant remarquer que la variable aléatoire ainsi définie n'a pas d'espérance, puisque $\scriptstyle \sum _{n=0}^{\infty }(1/2)(2^{n}+2^{n+1})(2^{n}/3^{n+1)}=+\infty$

Liens externes

David Madore, Un peu de probabilités
[PDF] Olivier Rioul, Probabilité sans peine?, mai 2012
Jean-Paul Delahaye, « Section paradoxes.6.1 »^{(Archive.org • Wikiwix • Archive.is • Google • Que faire ?)}, sur accromath.uqam.ca, 2011
(en) Barry Nalebuff, L'autre enveloppe est toujours plus verte (Yale University, Journal of Economic Perspectives, 1989).
(en) Eric Schwitzgebel and Josh Dever, The Two Envelope Paradox? Chapitre The Solution: "comparing apples and oranges"
(en) Federico O'Reilly, Is there a two-envelope paradox? Chapitre 2 "The mistake is adding apples and oranges"
(en) David J. Chalmers, The Two-Envelope Paradox: A Complete Analysis?
(en) Keith Devlin, The Two Envelopes Paradox, août 2004
(en) [PDF] Albers, Trying to resolve the two-envelope problem, chapitre 2 de sa thèse Distributional Inference: The Limits of Reason, décembre 2002
(en) [PDF] John Broome, The two-envelope paradox, janvier 1995
(en) Franz Dietrich and Christian List, The Two-Envelope Paradox: An Axiomatic Approach, mai 2004
(en) David McCarthy, The two envelope paradox and infinite expectations, The two envelope paradox and infinite expectations, janvier 1997

Portail des probabilités et de la statistique

[1] M. Kraïtchik, La mathématique des jeux ou Récréations mathématiques, Paris, Vuibert, 1930, 566 p.

[2] M. Gardner, La magie des paradoxes [« Aha! Gotcha: Paradoxes to Puzzle and Delight »], éd. Belin, 1982 (réimpr. 1985 pour l'édition française), p. 106.

[madore-3] {a b et c} Explication du paradoxe par David Madore

[4] (en) CASPER J. ALBERS, BARTELD P. KOOI and WILLEM SCHAAFSMA, « Trying to resolve the two-envelope problem » [PDF]

[JPD1-5] {a et b} Jean-Paul Delahaye, Paradoxes. Rubrique de divertissements mathématiques pour ceux qui aiment se prendre la tête. Paradoxe des deux enveloppes. (lire en ligne)

[6] Stricto sensu, il est abusif de considérer ces probabilités comme toutes deux de 50% : l'organisateur du jeu ne disposant pas d'un budget infini, la distribution de probabilité de la somme maximale doit être supposée avoir une valeur moyenne estimable, par exemple 100 000 €. Cette estimation faite, la distribution de probabilité la moins prévenue, c'est-à-dire celle d'entropie maximale est une exponentielle décroissante. En ce cas, l'autre enveloppe a davantage de chances de spécifier un montant plus petit que plus grand. Voir Inférence bayésienne

[:0-7] {a et b} [1]

[8] Cette distribution est bien une loi, puisque l'on a (voir série géométrique) $\scriptstyle \sum _{n=0}^{\infty }2^{n}/3^{n+1}=1$ ; on peut cependant remarquer que la variable aléatoire ainsi définie n'a pas d'espérance, puisque $\scriptstyle \sum _{n=0}^{\infty }(1/2)(2^{n}+2^{n+1})(2^{n}/3^{n+1)}=+\infty$

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]