Discussion modèle:Imdb nom/Bot de nettoyage

Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Bonjour Émoticône,

La discussion sur la refonte du code du modèle {{imdb nom}} a mis en évidence l'intérêt de demander à un robot de nettoyer les usages de ce modèle dans l'espace encyclopédique.

Je lui en demande peut-être beaucoup... si je ne demande pas, je n'aurai pas; si je demande, j'aurai probablement ; peut-être pas tout Émoticône.

Sachant que les robots parlent un langage (le python) que je ne comprends pas, je vais m'exprimer en termes d'utilisateur (une business analysis), parfois je vais préciser ma pensée avec des termes techniques (modèle, module qui donne le détail que j'espère).

L'idée générale de ma proposition est d'obtenir, dans les articles de l'espace encyclopédique,

  • le modèle {{imdb nom}} officiel, en français
  • les paramètres positionnels explicités
  • la correction des usages d'alias supposés (mais non supportés) de paramètres,
    ce qui forçait des valeurs par défaut, pouvant provoquer elle-mêmes des liens externes erronés.
  • les valeurs par défaut explicitées (par clarté pour les contributeurs futurs)
  • les identifiants IMDb rendus cohérents avec... les identiants sur IMDb, tels qu'ils sont repris dans Wikidata.
    Une ancienne version du code exigeait une valeur numérique, obtenue par abstraction de caractères de l'identifiant officiel.
  • les titres corrects de liens web sous-jascents, i.e. uniquement le "nom" de la personne (sachant qu'une "nature de document" est précisée par le modèle)

Peu m'importe l'approche technique, c'est le résultat qui m'importe. Si des demandes ne peuvent pas être prises en compte, j'envisage le travail manuel tant que çà reste plus raisonnable que le dressage d'un bot.

Pour information, une demande similaire est en préparation pour {{imdb titre}}. Dresser ce robot-ci est par conséquent un travail récupérable.

Détails de la demande

modifier

Alias du modèle

modifier

Je demande à corriger leur usage par celui du modèle officiel : {{imdb nom}}

Source: statistiques wstat au 24/01/2024
Modèle alias # usages
{{IMDB nom}} 21
{{IMDb name}} 514
{{IMDb nom}} 955
{{imdb name}} 6 108

Paramètres positionnels

modifier

Il serait plus clair d'expliciter les paramètres positionnels avec leur paramètre nommé :

Source: statistiques wstat au 24/01/2024
paramètre positionnel paramètre nommé # usages
1 id 4 539
2 nom 275

Alias de paramètres

modifier

Des contributeurs ont spécifié des paramètres qui ne sont pas supportés. À l'analyse du contenu, j'ai compris que, sans consulter la doc, les contributeurs supposaient que ces paramètres devaient logiquement être supportés. 

J'ai aussi toujours perçu que la communauté du projet Modèle préférait l'utilisation des paramètres en français. Je profite de l'occasion

Dans le tableau, les spécifications détaillées. Une colonne précise si l'alias est supporté par le code.

J'aimerais que le bot remplace les alias par le paramètre privilégié.
Le dresseur décidera s'il traite ou non les alias supportés et ceux en faible nombre. S'il en reste, je ferai les manuellement après le passage suivant de wstat (name et titre exclus  ).


Source: statistiques wstat au 24/01/2024
paramètre privilégié alias   supporté /
  non supporté
# usages
nom name   Oui 787
titre   Non 90
texte   Non 5
title   Non 4
titre brut   Non 4
label   Non 2
id nm   Non 7
ID   Non 4
ide   Non 2

Syntaxe des identifiants IMDb

modifier

Une ancienne version du code du modèle exigeait un identifiant numérique, qui correspondait à l'identifiant sur le site, amputé des deuxpremiers caractères, les lettres "nm". Le code reconstituait l'url, entre autres en remettant ces caractères disparus.

En absence de cet identifiant, le code reconstituait une valeur par défaut en allant la chercher sur la page Wikidata associée, en amputant automatiquement les deux premiers caractères... pour les rajouter ensuite lors de la reconstruction de l'url.  

Le code actuel admet les deux syntaxes : avec et sans les lettres initiales. C'est le sous-modèle {{imdb nom/Identifiant}} qui se charge de constituer le bon identifiant (ou l'identifiant par défaut), qu'il soit alphanumérique, numérique ou absent.
La syntaxe correcte d'un identifiant imdb nom est nm\d{7,8}, i.e. les lettres n et m, suivies de 7 ou 8 chiffres.


Source: statistiques wstat au 24/01/2024
Alias # usages (i.e. # non vides)
id 13 763
1 4 506
nm 7
ID 4
ide 2
(total) 18 282

Notes :

  • par différence avec les 20 133 inclusions et sous hypothèse que 2 alias ne soient pas utilisés dans le même usage du modèle, on peut calculer que 1 851 usages se reposent sur la résolution de l'identifiant par défaut.
  • les alias sont présentés dans le tableau des statistiques. Rappelons que le renommage de tous ses alias en paramètre id est demandé dans la section #Alias de paramètres

Valeurs des paramètres "nom" et alias

modifier

En analysant les valeurs attribuées au paramètre nom et de ses alias, on peut constater que le paramètre n'est pas seulement utilisé afficher le nom de la personne, mais aussi

  • soit pour afficher, en plus du nom de la personne, le type d'information communiquée dans une sous-page
  • soit uniquement le titre de la sous-page, sans le nom de la personne.

C'est clairement un usage détourné.


Dans la nouvelle version du code du modèle (version janvier 2004, dont la promotion a été demandée aux administrateurs le 24/01/2024 car le modèle est protégé), l'usage montre une "nature de document" qui dépend du nom de la sous-page. Les détournements évoqués ci-dessus n'ont plus lieu d'être.

J'aimerais alors que les valeurs de "nom" (et ses alias, que je demande par ailleurs de renommer "nom" : #Alias de paramètres) soit nettoyées.
Je suggère une source (je sais qu'elle est complexe, probablement gourmande en ressources ; le dresseur peut avoir une meilleure idée) : retrouver dans Wikidata le nom français de l'entité qui a l'identifiant IMDB nom (paramètre P345) qui nous concerne (l'identifiant qui est explicité dans le paramètre id, s'il est explicité !).

Source: statistiques wstat au 24/01/2024
Alias # usages (i.e. # non vides)
nom 3 336
name 787
2 275
titre 90
texte 5
title 4
titre brut 4
label 2
(total) 4 503

Notes :

  • par différence avec les 20 133 inclusions et sous hypothèse que 2 alias ne soient pas utilisés dans le même usage du modèle, on peut calculer que 15 630 usages se reposent sur la résolution du nom par défaut
  • les alias sont présentés dans le tableau des statistiques. Rappelons que le renommage de tous ses alias en paramètre nom est demandé dans la section #Alias de paramètres

Discussion

modifier
Revenir à la page « Imdb nom/Bot de nettoyage ».