Utilisateur:Hexasoft/Pour un système de tags

Ceci est un petit texte descriptif de ce que pourrait être un système de tags pour les articles wikipédia.

Notez que je ne suis pas le seul contributeur de ce texte, certaines idées ou remarques provenant d'autres utilisateurs.

Problématique modifier

Le système des catégories est certe puissant, mais il ne permet pas de faire des recherches croisées par rapport à plusieurs catégories (sans passer par des outils externes).
Il est de plus peu précis, en ce sens que pour représenter des informations très détaillées il faudrait multiplier les sous-sous(-sous)-catégories, ce qui pose des problèmes de gestion et d'affichage (liste des catégories en bas des articles).
Et si on ne sait pas exactement ce qu'on cherche et dans quelle sous(-sous)-catégorie on a peu de chance de trouver ce qu'on veut. Comme en plus quand on parcours une catégorie on n'a que les noms des articles on n'est guère plus informé (par exemple il serait utile de savoir quelles autres catégories sont présentes sur les articles qu'on voit).

En gros on a le choix entre :

  • des catégories hyper-précises mais qui imposent de savoir ce qu'on cherche aussi précisément
  • des catégories générales mais qui contiennent tellement d'articles qu'en l'absence d'outils rapide/efficace/intégré à WP on n'a que peu de chance de trouver quelque chose
  • des systèmes hybrides qui mélangent des catégories de divers niveaux (le meilleur des deux mondes ou le pire des deux mondes ?)


Un système plus souple, permettant un cumul de caractéristiques, permettrait de résoudre ces problèmes, si il était possible de relier ce système au (à un) moteur de recherches.

Il est à noter que d'autres utilisateurs se posent des questions et proposent des solutions possibles afin de faire évoluer wikipédia (voir les liens dans ce texte).

Fonctionnement possible des tags modifier

Les tags seraient des balises, dans un format à définir, permettant de spécifier une information associée à l'article. Pour définir plusieurs informations on utiliserait plusieurs tags.

Brion Vibber, un des développeurs principaux de Mediawiki indique ici : « Categories in MediaWiki are tags. That's the same thing. » (« Les catégories dans Mediawiki sont des tags. C'est la même chose. »)
Ceci implique que la convertion se fera probablement sans nouvelles balises. (même si ça me paraît impossible : de nouvelles balises seront créées).

Ces tags représenteraient diverses caractéristiques sur le contenu de l'article, permettant de faire une classification fine du contenu (finalement proche d'une description sémantique des thèmes abordés dans l'article).


Ces tags pourraient être fournis directement dans l'article ou par des catégories, ce qui aurait l'avantage de permettre l'héritage de tags communs depuis les catégories.
Cela permettrait également une transition en douceur du système actuel (catégories) vers cet autre système, ou encore une cohabitation de ces deux systèmes. Dans ce dernier cas, les catégories serviraient plutot aux grands "groupes" de thèmes, alors que les tags seraient plutôt liés aux informations additionnelles, non ou difficilement catégorisables.

Exemples de tags modifier

Dans les catégories de personnes, on peut envisager (entre autre) les tags suivants :

  • type:personne (est une personne)
  • genre:masculin/féminin
  • en vie/mort
  • métier:zoologiste/philosophe/footballeur…
  • nationalité:français/anglais/…

Les métiers seraient directement hérités des catégories actuelles, ainsi que l'état de personne. "mort" serait hérité de "mort en XXXX". Le genre serait à ajouter dans l'article.

Il serait ensuite possible par exemple de faire une recherche sur des zoologistes ou des philosophes vivant et de sexe féminin.


De la même façon pour les animaux :

  • type:animal (hérité des taxobox)
  • biotope:tropical humide
  • distribution:nouvelle zélande/australie/…
  • activité:nocturne/diurne/crépusculaire
  • reproduction:ovipare
  • protection:annexe 2 CITES

On pourrait ainsi rechercher des animaux nocturnes vivants en milieu tropical humide et pondant des œufs.


Note : certaines informations ne sont pas aussi « catégoriques ». Par exemple une personne peut changer de nationalité au cours de sa vie, ou encore travailler et être connu dans un pays différent de sa nationalité. De même certaines espèces ont une reproduction sexuée mais peuvent dans certains cas avoir une reproduction non sexuée, ou bien être nocturnes à certaines périodes et diurnes à d'autres…
Il devrait être possible de cumuler plusieurs tags de même type dans un même article. Exemple : activité:nocturne,crépusculaire ; distribution:France,Italie,Suisse.
Une hiérarchie de tags permettrait aussi des regroupements simples : distribution:Europe permettrait d'inclure les tags de distribution de tous les pays d'Europe.

Présentation dans les articles modifier

Les tags étant nettement plus nombreux que les catégories il ne serait pas possible de les afficher tous par défaut.

On peut envisager un affichage à la demande (comme les catégories de maintenance actuellement). Il est aussi possible de ne montrer que les types de tags (nationalité, genre, métier…) sans leur contenu.

Fonctionnalités de recherche dans les portails modifier

Si le moteur de recherche est paramètrable, il serait possible sur les portails de fournir un moteur de recherche dans la thématique du portail.

Par exemple le portail HZB (histoire de la zoologie et de la biologie), on trouverait une "spécialisation" du moteur de recherche pour des "type:personne", ayant le tag biologiste "métier:biologiste" ou l'un de ses sous-tags (métier:botaniste, zoologiste, herpétologue, mycologue…). Comme dit plus haut la présence d'un tag "groupement" (biologiste) correspondant à la sélection de tous ses membres.

Difficultés modifier

Le problème principal, à mon sens, serait de maintenir une cohérence entre les tags, pour que le même tag ne serve pas à des choses différentes, ou que l'on ne crée pas plusieurs tags différents pour représenter la même chose.

Ce problème est similaire au maintient de la cohérence des catégories (par exemple "né en XXXX" et "naissance en XXXX"), mais le foisonnement des tags ferait que cela serait certainement plus difficile à maintenir.

Si les tags sont à déclarer (un peu comme les catégories), un suivi important serait nécessaire.

Rien n'empêcherait a priori d'ailleur d'avoir un mécanisme de hiérarchie dans les tags, comme pour les sous-catégories. Ce mécanisme serait d'ailleur souhaitable pour permettre de s'y retrouver lors d'une recherche.

Par exemple quelqu'un cherchant des animaux se verrait présenter la liste des tags associés. Il parait inutile de présenter des tags comme "insectivore", "ovovivipare" ou "arboricole" si l'on cherche des philosophes…

Exemple semi-détaillé modifier

Exemple de ce que pourrait être une partie de la hiérarchie de tags pour la biologie.

taxon:vivant → tous les « êtres »
Sur-ensemble contenant :
taxon:plante,animal,champignon,algue… (les « règnes »)
« animal » (par exemple) serait un sur-ensemble contenant :
taxon:mammifère,marsupial,saurien,…
Et ainsi de suite jusqu'au plus précis désiré (on retrouve là un découpage similaire aux catégories de taxons).

mode-de-vie:terrestre,aquatique,marin,souterrain
aquatique serait un sur-ensemble contenant : eau-vive,eau-stagnante,…


On peut également imaginer − dans un but de gestion et de présentation des informations − de pouvoir classer des groupes de types de tags dans des catégories (pas celles actuelles de wikipédia) afin d'indiquer un groupement thématique.
Par exemple les types mode-de-vie, distribution, biome/biotope pourraient être groupés dans une catégorie « milieu », permettant des regroupements thématiques pertinents (affichage dans les articles, présentation des choix…).

Plus difficile : intégrer la cohérence modifier

Il serait peut-être intéressant d'avoir une notion de filiation des tags, afin d'indiquer qu'un tag ne peut être utilisé que dans le cadre d'un article déjà tagué avec un tag parent.

Par exemple le « mode-de-vie » n'aurait de pertinence que dans un article déjà tagué « taxon » (idem pour les autres tags strictement liés à la biologie).
Là encore cela pourrait aider les affichages et simplifier la présentation des choix possibles (voir à ce propos les catégories sur commons, où des outils permettent de sélectionner les catégories à partir des éléments existants).


Voir aussi modifier

  • Une autre idée : en finir avec les catégories, en utilisant un mécanisme d'affiliation.

Projet:Catégories/Navigation recherche sémantique