Utilisateur:Hexasoft/Du TI et des titres

Quelques éléments de réflexions personnelles, sur les notions de titres, d'articles, de moindre surprise, de travail inédit et autres éléments.

En particulier, sur l'utilisation de « principe de moindre surprise » pour choisir les titres.


Je commence par une digression modifier

Sur Wikipédia, un article est identifié par un titre. Ce titre est utilisé comme point d'entrée (URL) et pour créer des liens internes (relier des articles entre eux).
Ça a l'avantage de la simplicité, encore que pour des sens différents on se retrouve à mettre des précisions entre parenthèses (par exemple « XXX (film, 2004) »). Pour les graphies alternatives, les autres titres possibles… il y a les redirections, qui permettent de faire une redirection automatique d'un titre vers un autre (avec une limite : une redirection de redirection ne marche pas).

C'est à mon sens un choix malheureux, même si dans beaucoup de cas il simplifie la vie, car c'est faire l'amalgame entre deux choses différentes :

  • l'identification d'un contenu (ce qu'on appelle un article), qui en pratique est une entrée dans une base de données
  • le ou les titres, qui selon moi font partie du domaine éditorial

Ceux qui accordent beaucoup d'importance au titre se battent parfois pour savoir quel titre sera le "principal", c'est-à-dire celui qui sera affiché en haut, en gros, quand on lit un article (les redirects n'ont droit, eux, qu'à une mention en plus petit en dessous du titre, et encore seulement si on suit un lien vers un redirect. Dans les autres cas on n'a d'autre information sur les autres titres que ce qui est écrit dans l'article).

Il est dommage qu'un article ne puisse avoir qu'un titre : après tout un titre n'est pas moins valide parce qu'il est moins connu ou moins utilisé… sauf à penser que le titre n'a pas d'importance (dans la mesure où tout redirige vers le bon contenu), mais alors pourquoi autant de règles sur les titres ? Et si on va par là, pourquoi ne pas donner comme titre d'identification un simple numéro (le numéro d'entrée dans la base de données) et faire tout rediriger dessus ?[1].

Principes, règles, recommandations… modifier

Puisqu'on parle des règles et autres, un petit tour d'horizon :

  • les principes fondateurs : inviolables, la base, si on n'est pas d'accord on va voir ailleurs
  • les règles : on doit les appliquer. Si on n'est pas d'accord, on consulte la communauté pour les changer
  • les recommandations : en gros on fait comme ça, c'est mieux, mais bon, ça va pas plus loin

Donc, en gros, si c'est dans les principes ou dans les règles, interdiction de faire autrement (avec le bémol que les règles peuvent se changer, mais c'est long et lourd). Pour le reste, éviter de faire différemment de l'usage, mais tout se discute.

Et les titres dans tout ça ? modifier

Il y a diverses recommandations, dont Wikipédia:Conventions sur les titres : conventions, ce sont des recommandations. On trouve là-dedans en particulier cette phrase :

« Si plusieurs titres sont possibles, le plus commun devrait être utilisé, par application du principe de moindre surprise. »

Un principe de moindre surprise ? Wouhaou ! Mais en fait non, ça n'a rien à voir avec les principes fondateurs. Ce n'est pas non plus une règle de wikipédia. Il faut probablement considérer ça comme une recommandation (puisque c'est énoncé dans une recommandation). D'ailleurs il n'y a semble-t-il pas d'entrée « principe de moindre surprise » dans l'espace Wikipédia:, il n'est donc pas per se une recommandation, mais un élément d'une recommandation.

Bref. Pour reprendre le thème d'une guerre ancienne qui avait secoué wikipédia il y a quelques années, voyons chicon et endive, termes désignant la même chose (puisque l'un redirige sur l'autre), tous les deux en français, mais pas dans les mêmes pays/régions.
Après moult débats (passionnés, voire enragés) endive a été choisi parce que plus utilisé, et qu'il faut bien un titre (car, comme je le disais plus haut, il faut un titre pour identifier un article).

Et bien sûr, derrière « le plus utilisé », on retrouve le principe de moindre surprise.

Or ce principe me dérange énormément. Pour plein de raisons.

Quelles sont donc ces raisons ? modifier

Principe, vous avez dit principe ? modifier

Pour commencer, le mot « principe » dans cette expression lui donne je pense trop d'importance. Rappelons-le, ce n'est qu'un élément de recommandation. Donc en gros, chacun a le droit de s'assoir dessus et c'est la communauté (c'est-à-dire en pratique les personnes qui s'intéressent à un article) qui tranche au final au cas par cas.

Et l'exactitude ? modifier

Ensuite le « principe » de moindre surprise s'oppose parfois au « principe » d'exactitude. Je veux dire par là que si la multitude associe à tort (la notion de "tort" étant très fluctuante d'un endroit à l'autre, d'une population à l'autre, et d'un moment à l'autre) un mot avec un contenu, on privilégie le "faux".
Mais sur ce point, wikipédia se veut le reflet des connaissances et usages, et non un référentiel quelconque de la langue française. C'est un effet d'un des principes (là, un vrai) qui veut que l'information soit sourcée et neutre. Si on n'aime pas, il ne faut pas venir sur wikipédia.
C'est toutefois parfois frustrant, d'autant plus quand la langue française ne possède pas de termes adaptés pour désigner la multiplicité des « réalités » (le langage parlé - et écrit - n'a pas souvent pour but d'être précis, sauf pour les vocabulaires techniques, mais ces vocabulaires sont en général ignorés de la multitude).

Que deviennent les autres titres ? modifier

De plus choisir un titre "principal" semble donner l'impression qu'un thème, un objet, un animal, une plante… a un nom « officiel », les autres étant plus ou moins relégués au rang d'anecdote, au même titre que les titres alternatifs pour cause de difficulté de frappe au clavier ou d'erreur d'orthographe classiques.
C'est à mon sens dommage, voire dommageable. Toutefois l'unicité du titre "identifiant" rend obligatoire d'en choisir un.

Mais au fait, comment on sait que c'est le plus utilisé ? modifier

Ah ! En voilà une question qu'elle est bonne… En général on a droit à un google-rank, qui montre que tel terme est bien plus courant que tel autre (vive google-fight).
Sauf que google ne reflète que ce qui est publié sur le net… Donc si un pays francophone n'a pas ou peu accès à l'internet, il sera forcément sous-représenté. De plus les termes commerciaux ou politiques auront en général une meilleur représentation de par les efforts financiers et marketings qui vont derrière. Enfin, google ne comprend pas le sens des mots (même si il fait un peu de contextuel pour éviter certaines grosses bêtises), et on peut donc amalgamer en un résultat des choses qui n'ont rien à voir.
Oh, et j'oubliai, le problème de l'auto-référencement : avec la quantité énorme de sites qui reprennent du contenu de wikipédia, on a aussi le risque de voir un terme très représenté uniquement parce qu'il est déjà utilisé sur wikipédia. Un comble pour une encyclopédie qui se veut le reflet des connaissances, et qui peut, sans précaution, modeler ces connaissances.

Ensuite viennent des considérations comme les termes commerciaux, la population comparée des pays ou régions concernés… Mais tout ça éloigne d'un des principes fondateurs : la nécessité de sourcer (c'est-à-dire de fournir des sources à l'appui des informations). Et là je trouve que ça coince : existe-t-il des sources sérieuses, c'est-à-dire des études scientifiques, qui portent sur l'emploi de tel terme par rapport à tel autre terme dans les populations francophones ? La majorité du temps, la réponse est non.
Pire, une des règles est l'interdiction du travail inédit : en gros, le travail inédit, c'est quand − que ce soit vrai ou non − vous écrivez une chose qui n'est pas soutenue par des sources. Ça découle plus ou moins directement du principe fondateur précédent.
Or pour moi faire sa petite recherche pour choisir le nom le plus fréquent (le moins « surprenant »), c'est du travail inédit, puisque bien malin celui qui trouvera des sources qui parlent justement de l'usage de tel ou tel terme dans les populations francophones… Pour rappel analyser des données primaires (existence d'un terme, populations comparées de pays/régions/…, fréquence d'occurrence dans des documents…) pour en tirer une conclusion c'est la définition du travail inédit.

Un dernier pour la route modifier

Enfin un dernier point qui me chiffonne, qui est plus ou moins lié à la section précédente. Voyons sur un exemple : il existe un caméléon, au doux nom scientifique Furcifer pardalis. L'article s'appelle Caméléon panthère (en référence à ses couleurs). Personnellement je n'ai rien contre ce nom. Et effectivement une recherche vous donnera plein d'occurrences, dans tous le monde francophone (il faut dire que c'est un des plus beaux caméléons, qu'on le rencontre en terrariophilie, donc forcément il fait parler de lui).

Là où ça me dérange, c'est qu'on rencontre à l'état sauvage ce caméléon à Madagascar, à la Réunion et sur l'île Maurice. Les deux dernières sont francophones, Madagascar l'est un peu. Je ne sais pas comment il est appelé à Madagascar (probablement par un nom malgache), mais à la réunion on l'appelle endormi ou lendormi. Par contre on ne le rencontre pas en Europe, au Quebec, ni en Asie (principaux lieux où vivent des francophones).
Et donc on a là un animal que près d'un million de personnes peuvent voir tous les jours dans leur jardin (enfin, ceux qui ont un jardin, je présume), pour qui c'est un lendormi, et pourtant l'article s'appelle caméléon panthère, pour être en accord avec quelques dizaines de milliers de terrariophiles qui le connaissent sous ce nom (faites l'essai : demandez autour de vous - sauf si vous habitez à la Réunion - si ils peuvent vous dire à quoi ressemble à caméléon panthère… Et ceux de la Réunion ne le connaîtront sans doute pas sous ce nom de toute façon).

Bref, il y a là pour moi une incohérence. Certes ce terme est connu, et répandu, mais l'usage réel dans le langage francophone courant ne devrait-il pas prendre le pas sur des conventions externes à propos d'un sujet (ici un animal) qui a une pénétration minime dans les populations qui l'utilisent ?

Vu du côté de la communauté scientifique (mais pas que) internationale, c'est bel et bien le nom latin qui prime, c'est le seul qui est universel. Par contre, c'est vrai il est latin, mais, ouf justement, il est latin ; qu'aurions nous eu si la langue internationale avait été le chinois, et bien quelque chose comme « 蛇 ». Bon ce mot veux dire « serpent », car le croirez-vous, il n'y a aucune page sur le caméléon panthère en chinois. Et ne me dites pas que je délire, ni dites pas « il est camé Léon », d'autant que je ne m'appelle pas Léon  .
Plus sérieusement, le titre Furcifer pardalis avec 1 ou 2 sous-titres ad hoc dans la langue de la page (avec autant d'indirections que de sous-titres) me semble être la solution. Le rasoir d'Ockham ou principe de simplicité me semble particulièrement bien adapté à cette question des titres. Gerardgiraud (discuter) 22 mars 2021 à 11:30 (CET)

Au final, tout ça pour quoi ? modifier

Tout ça pour rien ! On ne va pas ré-écrire wikipédia, et il faudra donc toujours choisir un titre. Autant avoir des méthodes homogènes pour le choisir.
Je pense qu'il faut toutefois avoir conscience des limites de ces choix, et surtout ne pas employer des termes et des arguments qui sont souvent hors de propos, quand ce n'est pas hors des principes fondateurs.


À titre personnel, je serai pour une refonte des titres, avec utilisation de sous-titres (ce qui commence d'ailleurs à se faire sur certains projets). On réhabilite ainsi les autres titres, en leur donnant une place au même niveau que le titre (ou presque).
Après tout, si le titre n'a pas d'importance (argument fréquent, c'est le contenu qui compte) qu'est-ce que ça change d'y adjoindre des sous-titres ?
Et après-tout, si le titre est important (argument encore plus fréquent) comment justifier de ne pas accorder une importance significative (même si elle est moindre) aux autres titres valides - dans le sens qu'ils représentent aussi une appellation valide du contenu ?

Hexasoft (discuter) 6 mars 2010 à 23:25 (CET)

Notes et références modifier

  1. Note : c'est comme ça sur wikidata par exemple. Une « entrée » va s'appeler Q1474 mais aura un ensemble de titres. Ceci dit wikidata est une base de donnée, alors que wikipédia est un wiki, qui utilise une base de donnée pour son fonctionnement (ce qui n'est pas pareil).