Utilisateur:ZiziBot/features

dessin robot CodexBot (edits, edits2) + ZiziBot (edits)DiscussionsFAQSondagesMonitoring • Configuration : sites externesdomain banISBNvilles

Légende : ✔️ module activé / ❌ module pas activé / ! Attendre (consensus)

Traitement modèle {Ouvrage}

modifier

Correction syntaxique des paramètres :

  •   correction des alias [invisible]
  •   conversion des paramètres enwiki ({{cite book}}) [invisible]
  •   correction de paramètres inconnus (prédiction) : erreur de frappe [1]
  •   signalement paramètre inconnu : commentaire HTML [2]   message en page discussion [3]
  •   extraction paramètres obsolètes (plume,extrait,commentaire) vers {plume},{{citation bloc}},{{commentaire biblio}}, {{début citation}}... [invisible]

Style : conservation partielle du style rédactionnel du modèle :   ordre des paramètres,   espacement/retour ligne,   noms de paramètre. [4]

Complètement de données d'après des bases bibliographiques :

  • recherche par  ISBN,   lien Google,   auteur+titre
  • Bases interrogées :   Google Books,   Open Library,  BnF,  WorldCat, WikiData
  • todo: décrire fiabilité données
  •   comparaison titre/auteur pour fiabilité infos
  • Exemple : [5]
  • Wikidata : wikiliens vers auteur (d'après ISNI/VIAF) et titre ouvrage (ISBN)

Améliorations typographiques :

Titre, sous-titre...

  •   Typo : majuscules, règle internationale " : " (bistro 08-2019)
  •  retire lien externe titre/sous-titre (Bistro 27 août 2011)
  •  retire {{lang}} : déplacé vers 'langue' [invisible]
  •   déplacement en 'sous-titre' [invisible]

Autres :

  •   pas de wikilien sur 'lieu' (stats/pertinence) : Paris -> Paris
  •  correction des confusions 'pages totales/passage' (prédiction).
  •  correction des confusions 'numéro chapitre'/'titre chapitre', etc
  •   complétion sous-titre exemple

Auteur :

  •   Attendre Prénom1+Nom1=>Auteur1 (si prénom/nom uniques ou prénom avec initiale) [invisible]
  •   Attendre distinction prénom/nom si 2 prénoms (ancrage).
  •   distinction auteurs multiples [6]
  •   ajout wikilien page d'auteur

Editeur :

  •   'lien éditeur' (obsolète) remplacé par wikilien [invisible]
  •   Attendre correction typographique : abbréviations du genre "(Éd.)"
  •   Attendre forme brève : Éd. de La Gourde => La Gourde, mais 'Éditions de Minuit' inchangé
  •   ajout du wikilien éditeur

Lieu :

  •   francisation des villes : London->Londres voir liste
  •   suppression wikilien : Londres->Londres

ISBN :

  •   conversion EAN (sans tiret) et ISBN-10 => ISBN-13 ([7])
  •   ISBN-10 archivé dans 'isbn10' (non affiché)
  •   signalement ISBN invalide (checksum, code pays/product) : commentaire HTML et 'isbn invalide=' + message PD
  •   contrôle des ISBN multiples (isbn2, isbn3)

Dates :

  •   confusion date/année [invisible]
  •   typo et conversions dates américaines
  •   Attendre Avec LUA plus besoin d'exploser la date en jour/mois/année. Faut-il convertir vers 'date' ?

Format :

  •   prédiction 'format livre' ou 'format électronique'

Lien vers Google Books :

  • Wikipédia:Le_Bistro/15_octobre_2019#Liens_Google_Livres Bistro
  •   simplification d'URL :  suppression des paramètres non nécessaires (infos de tracking) : conservation id, pg (page), dq (requête/surlignage) qui permettent d'obtenir la même interface.[cosmétique??]
  •   Attendre Suppression lien invalide (id manquant)
  •   dans {{Ouvrage}} : correction 'lire en ligne'/'présentation en ligne' selon accessibilité totale ou partielle du document. [8]
  •   conversion en {{Google Livres}} [9]
  •   ajout lien Google si livre d'accès complet.
  •   ajout lien Google présentation en ligne [10]
  •   ajout 'lire en ligne' si livre d'accès partiel.

Lien vers Internet Archive :

  •   ajout 'lire en ligne' vers livre numérisé (accès libre ou empruntable)
  •   privilégier lien vers IA plutôt que Google

Fonctionnement du bot :

  •   n'édite pas si correction invisible
  •   édit sans botflag si ajout de donnée substantiel (auteur,sous-titre...) ou prédiction incertaine
  •   arrêt si modification page discussion du bot
  •   ne traite pas les modèles contenant du commentaire HTML <!-- blabla -->
  • respecte les limitations {{nobots}} et {{bots}}
  •   suivi des reverts (apprentissage)

Sur page globale :

  •   déplacement de la mention langue à l'intérieur du modèle [11]
  •   pas d'intervention si édition humaine y'a moins de 15 minutes
  •   provisoirement pas d'intervention sur AdQ/BA
  •   analyse des {fr}, {en} pour ajout {fr} si ouvrages étrangers > 50%
  •   Message en PD pour ISBN invalide, suggestion de correctifs, etc. Par le passé, succès/efficacité.
  •   un seul wikilien identique par page

Estimation

modifier

Durée tâche :

  • 9 mois pour {ouvrage} avec ISBN (~200 edits/j, 10/h) 170'000
  • 2 ans pour {ouvrage} sans ISBN / 920'000 inclusions
  • Avec les limitations API Google, le bot analyse maximum 1000 citations/jour
  • Le bot ne devrait pas repasser sur un article avant 1 an

Dans sa version ancienne, suite aux édits du bot, y'avait environ 1% de modification humaine des citations. Les 2/3 portant sur la correction d'ISBN ou titres signalés erronés par le bot (genre message en PD).

Mentions libres de biblio (hors modèles)

modifier
  •   Attendre simplification d'URL Google Livres (paramètres de tracking)
  •   Attendre possibilité de conversion en {{Google Livres}} mais pas de consensus.
  •   conversion en {{ouvrage}}
  •   ajouts de données d'après bases biblio