Take-the-best heuristic

En psychologie, l'heuristique dite du meilleur choix[1] est une heuristique (une stratégie simple de prise de décision) qui permet de choisir entre deux possibilités en se fondant sur le premier indice qui les discrimine, où les indices sont ordonnés par leur validité, du plus élevé au plus faible. Dans la formulation originale, les indices étaient supposés avoir des valeurs binaires (oui ou non) ou une valeur inconnue. La logique de l'heuristique est qu'elle fonde son choix uniquement sur le meilleur indice (raison) et ignore le reste.

Les psychologues Gerd Gigerenzer et Daniel Goldstein ont découvert qu’elle est étonnamment efficace pour faire des inférences ou déductions précises dans des environnements réels, par exemple en déduisant laquelle de deux villes est la plus grande. L'heuristique a depuis été modifiée et appliquée à des domaines tels que la médecine, de l'intelligence artificielle et de la prévision politique[2],[3]. Il a également été démontré que l'heuristique peut modéliser avec précision la manière dont les experts, tels que les douaniers des aéroports[4] et les cambrioleurs professionnels, prennent leurs décisions[5]. L’heuristique peut également prédire les détails du processus cognitif, tels que les nombres d’indices utilisés et les temps de réponse, souvent mieux que les modèles complexes qui intègrent tous les indices disponibles[6],[7].

Prise de décision à raison unique modifier

Les théories de la prise de décision supposent généralement que toutes les raisons pertinentes (caractéristiques ou indices) sont recherchées et intégrées dans une décision finale. Pourtant, en cas d’incertitude (par opposition au risque), les indices pertinents ne sont généralement pas tous connus, pas plus que leur pondération précise et les corrélations entre les indices. Dans ces situations, se fier uniquement au meilleur indice disponible peut être une possibilité raisonnable qui permet de prendre des décisions rapides, économes et précises. C’est la logique d’une classe d’heuristiques connue sous le nom de « décision à une raison » qui comprend la méthode « take-the-best »[8]. Pour des indices ayant des valeurs binaires (0,1), où 1 indique la valeur de l’indice qui est associée à une valeur de critères plus élevée, la tâche consiste à déduire quelle valeur de critère des deux possibilités est la plus élevée. Par exemple, sur deux équipes de NBA on cherchera à savoir quelle équipe sortira gagnante en se basant sur des indices tel le vainqueur du dernier match ou quelle équipe joue à domicile. L’heuristique du meilleur choix implique trois étapes pour faire une telle hypothèse[9] :

  • Règle de recherche : rechercher les indices dans l'ordre de leur validité.
  • Règle d'arrêt : arrêter la recherche lorsque l’on trouve le premier indice où les valeurs des deux possibilités différent.
  • Règle de décision : prédire que la possibilité ayant la valeur de repère la plus élevée a la valeur la plus élevée sur la variable de résultat.

La validité v d’un indice est donnée par v= C/(C+W), où C est le nombre d’inférences correctes lorsqu’un indice est discriminant, et W est le nombre d’inférences erronées, toutes estimées à partir d’échantillons.

Le meilleur choix pour une tâche de comparaison modifier

Considérez la tâche consistant à déduire quel objet, A ou B, a une valeur plus élevée sur un critère numérique. Par exemple, imaginez quelqu’un qui doit juger si la ville allemande de Cologne a une population plus importante que la ville de Stuttgart. Ce jugement ou cette déduction doit se fonder sur les informations fournies par les indices binaires, comme « La ville est-elle la capitale de l’Allemagne ? ». D’un point de vue formel, la tâche est une catégorisation : une paire (A,B) doit être classée tel que X A > X B ou X B > X A (où X désigne le critère), sur la base d’informations fournies par les indices.

Les indices sont binaires, ce qui signifie qu’ils prennent deux valeurs et peuvent être modélisés, par exemple, comme ayant les valeurs 0 et 1 (pour « oui » et « non »). Ils sont classés en fonction de leur validité, définie comme la proportion de comparaisons correctes parmi les paires A et , pour lesquelles ils ont des valeurs différentes c’est-à-dire pour lesquelles ils discriminent entre A et B. La méthode du meilleur choix analyse chaque indice l’un après l’autre, selon un classement par validité et s’arrête la première fois qu’un indice discrimine entre les items et conclut que l’item avec la plus grande valeur a aussi une plus grande valeur sur le critère. La matrice de tous les objets de la classe de référence, dont A et B ont été triés, et les valeurs des indices qui décrivent ces objets constitue ce que l’on appelle un environnement. Les théoriciens du meilleur choix, Gigerenzer et Goldstein (voir Gerd Gigerenzer et Daniel Goldstein, DG (1996)[10] ) ont considéré dans leur théorie l’exemple de paires de villes allemandes, mais seulement celles de plus de 100.000 habitants. La tâche de comparaison pour une paire donnée (A, B) de villes allemandes dans la classe de référence, consistant à établir laquelle a une plus grande population, sur la base de 9 indices. Les indices étaient évalués de manière binaire, tel que l’on pouvait retenir par exemple le fait que la ville soit la capitale ou non, ou qu’elle ait une équipe de football en ligue nationale ou non. Les valeurs indices pouvaient être modélisées par des 1 (pour « oui ») et des 0 (pour « non »), de sorte que chaque ville pouvait être identifiée par son « profil d’indice », c’est-à-dire un vecteur de 1 et de 0, ordonné selon le classement des indices.

La question était la suivant : Comment déduire lequel des deux objets, par exemple la ville A avec le profil d’indices (100101010) et la ville B avec le profil d’indices (100010101), obtient le meilleur score sur le critère établi, c’est-à-dire la taille de la population ? La méthode du meilleur choix heuristique compare simplement les profils lexicographiquement, tout comme on compare des nombres écrits en base deux : Le premier indice est 1 pour les deux, ce qui signifie que le premier indice ne fait pas de discrimination entre A et B. Le deuxième indice a pour valeur 0 dans les deux cas, cet indice ne fait pas discrimination non plus. Il en va de même pour le troisième indice, tandis que pour le quatrième la valeur est de 1 pour A et de 0 pour B, ce qui implique que A est jugé comme ayant une valeur plus élevée sur le critère. En d’autres termes, X A > X B si et seulement si (100101010) > (100010101).

Mathématiquement, cela signifie que les indices trouvés pour la comparaison permettent un quasi-isomorphisme d'ordre entre les objets comparés sur le critère, dans ce cas les villes avec leurs populations, et leurs vecteurs binaires correspondants. Ici, "quasi" signifie que l'isomorphisme n'est, en général, pas parfait, car l'ensemble des indices n'est pas parfait.

Ce qui est surprenant, c'est que cette simple heuristique a une grande performance par rapport aux autres stratégies. Une mesure évidente pour établir la performance d'un mécanisme d'inférence est déterminée par le pourcentage de jugements corrects. En outre, ce qui importe le plus, ce n'est pas seulement la performance de l'heuristique lors de l'ajustement de données connues, mais aussi lors de la généralisation d'un ensemble d'apprentissage connu à de nouveaux éléments.

Czerlinski, Goldstein and Gigerenzer ont comparé plusieurs stratégies avec la méthode de la meilleure décision : Un modèle simple de Tallying, ou de poids unitaire (également appelé « règle de Dawes » dans cette littérature), un modèle linéaire pondéré sur les indices pondérés par leurs validités (également appelé « règle de Franklin »), la régression linéaire et le minimalisme. Leurs résultats montrent la robustesse de la méthode du meilleur choix en matière de généralisation.

 
Performances heuristiques sur l'ensemble de données de la ville allemande, générées avec ggplot2 sur la base des données dans[3]. Voir les étapes pour reproduire sur CRAN .
 
Performances heuristiques sur 20 ensembles de données à partir d'une illustration à l'intérieur de la référence n ° [11]

Par exemple, considérons la tâche consistant à choisir la plus grande ville parmi deux villes lorsque :

  • Les modèles sont ajustés à un ensemble de données de 83 villes allemandes ;
  • Les modèles sélectionnent la plus grande d'une paire de villes pour toutes les 83*82/2 paires de villes.

Le pourcentage de bonnes réponses était d’environ 74% pour la régression. Plus précisément, les scores étaient de 74,3% 74,2% et 74,1%, de sorte que la régression a gagné une petite marge.

Cependant, l’article a également pris en compte la généralisation (également connue sous le nom de prédiction hors échantillon).

  • les modèles sont adaptés à un ensemble de données constitué d’une moitié de 83 villes allemandes sélectionnées au hasard.
  • Les modèles sélectionnent la plus grande ville d'une paire d'une ville tirés de « l’autre » moitié des villes.

Dans ce cas, lorsque 10 000 divisions aléatoires différentes ont été utilisées, la régression a obtenu en moyenne 71,9%, de résultats corrects, la méthode de l’heuristique 72,2% et l’unité avec linéaire 71,4%. La méthode du meilleur choix heuristique était plus précise que la régression dans ce cas[3].

Références modifier

  1. Gigerenzer, G. & Goldstein, D. G. (1996). "Reasoning the fast and frugal way: Models of bounded rationality". Psychological Review, 103, 650-669.
  2. Graefe et Armstrong, J. Scott, « Predicting elections from the most important issue: A test of the take‐the‐best heuristic », Journal of Behavioral Decision Making, vol. 25, no 1,‎ , p. 41–48 (DOI 10.1002/bdm.710, lire en ligne)
  3. a b et c Czerlinski, J., Goldstein, D. G., & Gigerenzer, G. (1999). "How good are simple heuristics?" In Gigerenzer, G., Todd, P. M. & the ABC Group, Simple Heuristics That Make Us Smart. New York: Oxford University Press.
  4. Pachur, T. & Marinello, G. (2013). Expert intuitions: How to model the decision strategies of airport customs officers? Acta Psychologica, 144, 97–103.
  5. Garcia-Retamero, R., & Dhami, M. K. (2009). Take-the-best in expert-novice decision strategies for residential burglary. Psychonomic Bulletin & Review, 16, 163–169
  6. Bergert F. B., & Nosofsky, R. M. (2007). A response-time approach to comparing generalized rational and take-the-best models of decision making. Journal of Experimental Psychology: Learning, Memory and Cognition, 331, 107–129
  7. Bröder, A. (2012). The quest for take-the-best. In P. M. Todd, G. Gigerenzer, & the ABC Research Group, Ecological rationality: Intelligence in the world (p. 216–240). New York: Oxford University Press
  8. Gigerenzer, G., & Gaissmaier, W. (2011). Heuristic decision making. Annual Review of Psychology, 62. 451–482
  9. Gigerenzer, G., & Goldstein, D. G. (1996). Reasoning the fast and frugal way: Models of bounded rationality. Psychological Review, 103, 650–669.
  10. Gigerenzer & Goldstein, 1996 - APA Psynet - Reasoning the fast and frugal way: Models of bounded rationality
  11. MH. Martignon & Hoffrage (2002) - Fast, frugal, and fit: Simple heuristics for paired comparison

Articles connexes modifier