Au sein des jeux sérieux, JeuxDeMots fait partie des GWAP (en) (Game With A Purpose) ou "jeux avec un but". Le concept est au cœur des sciences citoyennes et repose sur l'idée de mettre à contribution le public pour l'amener à produire des données utiles à la recherche via une interface de jeu en ligne. JeuxDeMots, lancé en 2007 est le programme mis au point par une équipe de recherche en TAL du LIRMM pour construire un réseau lexico-sémantique du français[1]. Outre le jeu principal, le projet JeuxDeMots comporte une douzaine d'autres jeux tous orientés vers la production ou la validation de données lexicales et sémantiques[2].

Un jeu en ligne pour construire un réseau lexical modifier

Qu'est-ce qu'un réseau lexical ? modifier

 
Portion de réseau sémantique

Un réseau lexical est une structure qui recense les relations lexicales et sémantiques qui existent entre les mots d'une même langue. Le réseau du projet JeuxDeMots[2] a une structure de graphe, dont les nœuds correspondent à des termes et les arcs à des types de relations entre ces termes. Ainsi, les associations d'idées que l'on peut faire avec un terme donné constituent le plus élémentaire des types de relations du réseau. (par exemple, le terme chat est un nœud relié aux nœuds miauler, félin, griffe, litière, ronronner, minou, souris, croquettes, animal de compagnie, etc. par des arcs correspondant à la relation idées associées). Le réseau Lexical JeuxDeMots définit ainsi une centaine de types de relations, qui sont soit lexicales (synonymie, dérivé morphologique, dérivés étymologiques, etc.) soit sémantiques (thèmes/domaines, patients/agents typiques pour les verbes, hyperonymes, holonymes, causes/conséquences, sentiments associés, etc.). Au sein du réseau, les relations sont orientées et pondérées (une relation donnée est orientée d'un terme vers un autre avec un poids proportionnel à la fréquence avec laquelle elle associe ces deux termes)[3].

Le principe du jeu modifier

JeuxDeMots est un jeu conçu en 2007[4] pour acquérir des données lexicales : ce sont les joueurs qui les fournissent en répondant à une consigne donnée relativement à un terme cible. Ce système de collecte de données repose sur le principe selon lequel les données recueillies sont supposées valides dès lors qu'elles sont données par deux joueurs en réponse à la même consigne et sur le même terme, sans qu'ils n'aient la possibilité de communiquer. Les termes qui s'avèrent être communs quand on confronte les réponses des deux joueurs deviennent des relations au sein du réseau lexical en construction. Par exemple :

Consigne : Donnez des génériques du terme chat

réponses du joueur Joueur A : animal, félin, mammifère, vertébré

réponses du joueur B : carnivore, animal, félidé, animal de compagnie, mammifère

Les réponses communes aux deux joueurs sont : mammifère, animal. Dans le réseau vont donc être créées les deux relations suivantes :

chat----a pour générique > mammifère et chat----a pour générique > animal

Les parties se jouent en temps limité et de façon asynchrone. Les joueurs gagnent d'autant plus de points qu'ils ont de réponses communes, mais, pour favoriser l'enrichissement du réseau et la diversité des relations qui le constituent, les joueurs sont incités à faire preuve d'originalité : les associations de termes les plus évidentes, celles qui viennent à l'esprit en premier, sont pénalisées (perte de points) dès lors qu'elles ont été proposées par un certain nombre de couples de joueurs, tandis qu'une prime est accordée aux associations de termes moins souvent proposées, donc moins solidement établies au sein du réseau, et a fortiori à la création de relations inédites.

L'accumulation de relations ainsi validées par les propositions communes des joueurs construit progressivement le réseau lexical au sein duquel les liens entre termes sont typés par la nature de la consigne qui les a générés et pondérés par le nombre de couples de joueurs qui les ont suggérés. JeuxDeMots est donc une stratégie d'acquisition de ressources lexicales exploitant le fait établi que les données fournies par un très grand nombre de non-experts qui ne se concertent pas sont de meilleure qualité que celle émanant des travaux d'un petit groupe d'experts[5]. La composante ludique de ce mode d'acquisition doit dont être suffisamment attractive, non seulement pour susciter une forte participation, mais pour fidéliser les contributeurs et les motiver à maintenir, voire à accroître leur participation. En effet, un joueur expérimenté va répondre de façon plus organisée, plus originale et plus pertinente et améliorer ainsi la qualité de sa contribution au réseau lexical. De même, en acquérant de l'expérience, et une compréhension du jeu plus fine, il va chercher la confrontation avec des termes / consignes plus difficiles de manière à améliorer significativement son classement[2],[6].

Quelques chiffres modifier

Amorcé en 2007 avec environ 150 000 termes sans aucune relation entre eux, le réseau JeuxDeMots compte aujourd'hui 835 050 termes unis par presque 43 millions de relations. Environ 1,5 million de parties de JeuxDeMots ont été jouées depuis le début, et plus de 200 millions sur l'ensemble des jeux constituant le projet.[7] JeuxDeMots et les autres jeux du projet sont des jeux gratuits et les données lexicales constituant le réseau sont librement accessibles et téléchargeables sous la licence Domaine Public.

Intérêt et applications des réseaux lexicaux modifier

En tant que base de connaissances, un réseau lexical est le support de toutes sortes d'applications relevant du TAL, comme l'analyse sémantique de textes, la recherche d'informations, l'analyse de discours ou d'opinions, ou encore la traduction automatique. Plus généralement, c'est un ensemble de données organisées exploitable en Intelligence Artificielle pour réaliser des inférences, et sa structure de réseau favorise la réalisation d'algorithmes de propagation, qui en circulant de nœud en nœud permettent d'élaborer des explications sous forme de chemins dans le réseau. La richesse et la diversité des données lexicales permettent également de modéliser des analogies/comparaisons pour la détection et la résolution de métaphores.

Lien externe modifier

Site officiel

Notes et références modifier

  1. Gouget G., Rullier P. (2011)- Revue de presse et jeux de mots libres. Emission de radio - Divergence Numérique (sur Divergence FM) - à propos de JeuxDeMots et des données libres, jeudi 31 mars 2011, 61 min. http://www.lirmm.fr/~lafourcade/ML-biblio/DIVERGENCE/dn103_110331_divergencenumerique_jeuxdemots.mp3
  2. a b et c Mathieu Lafourcade, Nathalie Le Brun, Alain Joubert, Jeux et intelligence collective - résolution de problèmes et acquisition de données sur le Web, ISTE éditions, , 156 p. (ISBN 978-1-78405-052-8), p. 107-136 (Chapitre 5)
  3. Mathieu Lafourcade et Alain Joubert, « JeuxDeMots : un prototype ludique pour l’émergence de relations entre termes », ADT'08 : Actes des Journées internationales d'Analyse statistiques des Données Textuelles. France,‎ , p. 657-666 (lire en ligne)
  4. (en) Mathieu Lafourcade, « Making people play for Lexical Acquisition with the JeuxDeMots prototype », SNLP'07: 7th International Symposium on Natural Language Processing, Pattaya, Chonburi, Thailand,,‎ , p. 7-15 (lire en ligne)
  5. Collectif, Ressources Lexicales: Contenu, construction, utilisation, évaluation, John Benfamins, , 364 p. (lire en ligne), p. 187-216
  6. (en) J. Chamberlain et al., Using Games to Create Language Resources: Successes and Limitations of the Approach. Theory and Applications of Natural Language Processing., Gurevych, Iryna; Kim, Jungi (Eds.), Springer, , 42 p. (ISBN 978-3-642-35084-9, lire en ligne)
  7. « JeuxDeMots », sur www.jeuxdemots.org (consulté le )

[[Catégorie:Intelligence artificielle]] [[Catégorie:Sciences citoyennes]] [[Catégorie:Ontologie (informatique)]]