Utilisateur:Salebot/À faire

  • Traitement majuscules : détecter \[a-z], pas seulement \b
  • Rapport sur "cas louches" ?
  • Mettre un bandeau méchant et écrire sur WP:RA en cas de récidive nette
  • utiliser {{CURRENTDAY}}, etc. pour les journaux
  • Gestion de l'heure (MT, UTC, CET)
  • Lien vers "false positives", cf. cluebot http://en.wikipedia.org/w/index.php?title=Black_Thursday&curid=2547445&diff=176189526&oldid=176189508
  • Nouveaux comptes contribuant sur un sujet/article "chaud" donné
  • Détecter les renommages faits par copier-coller par des participants inscrits (suppression de x chars, puis ajout de x chars ailleurs, ou ordre inverse, avec une marge)
  • Détecter lorsque le bot se fait révoquer par un utilisateur de confiance, effacer le casier de l'IP révoquée par le bot
  • Analyse par chaînes de Markov
  • Analyse par réseau de neurones (en:User:Cobi)
  • Détecter l'insertion ou la modification d'images, signaler comme les annonces de mort
  • IP scolaires
    • Détecter les IP scolaires à partir du FQDN (ac-*.fr), ajouter les bandeaux
    • Rapporter les modifs d'IP scolaires à partir de la catégorie
  • Détecter les pages sensibles (révocations, protections) et abaisser le seuil
  • En mode hargneux, ne pas révoquer la pdd de l'utilisateur
  • Suivre Wikipédia:Détection des proxy ouverts et marquer les IPs correspondantes
  • Détecter les guerres d'édition
  • Copyvios: Yahoo BOSS, http://developer.yahoo.com/search/boss/
  • Bandeau d'info quand un article est supprimé et qu'il n'y a qu'un seul participant
  • Si la modif reprend des mots de l'article, elle est probablement bonne (sauf les noms de personnes ?)
  • Articles sensibles : annuler les contributions de nouveaux utilisateurs ou d'IPs n'ayant pas participé auparavant
  • Lister certaines classes de vandalismes sur une page dédiée, par exemple pour suivre certains vandales de longue durée
  • Bug dans l'affichage des renommages
  • Rajouter des NOINDEX en haut de chaque page du journal (fait pour les nouvelles pages)
  • Détecter les modifications de nombres sur plusieurs articles
  • Formatter les résultats de vandalism.pl, probablement en XML (argl)
  • Détecter l'ajout du même texte sur plusieurs pages (exception pour les catégories et bandeaux)
  • Publier le détail des alertes sur IRC, au moins pour les cas "temporaires"
  • Déplacer certains paramètres (pages "auto-défense") sur le wiki
  • Commande !test diff_url qui envoie le résultat sur le wiki
  • Stocker un jour entier sur log-rc.txt pour lancer un parser dessus (détection de tous les types d'actions)
  • watchlist, les modifs d'utilisateurs suivis sont affichées avec "suivi"
  • Table RC: diff, reverted_by_human, reverted_by_bot. Permet de simuler un nouveau jeu de regex. Permet d'ajuster les scores (si une expression est toujours révoquée par un humain, augmenter la v.a. du score ; inversement pour éviter les faux positifs)
  • Changer le traitement des majuscules
  • sprintf localisé du genre "{loc} : %s" où {loc} est une clé
  • Tronquer automatiquement le journal des modifications suspectes
  • Class::DBI pour transformer %userdb en objet lié à une base de données
  • Mise à jour automatique de {{WikiDefCon}}
  • Mesurer les distances de Levenshtein
  • Option ignore1RR pour certaines regex
  • Ajouter un mode où le bot lit les modifs d'une IP, mais n'affiche rien si le score est > 0
  • Bandeau quand qqn rajoute un lien externe en 1ere modif
  • Table pages: creation_time, deletion_time, recent_revert_count, last_activity
  • Réduire la sensibilité pour les suppressions d'interwikis, cf. http://fr.wikipedia.org/w/index.php?title=Nanami&diff=next&oldid=36931922
  • Vérifier que la révocation a réussi, ou que quelqu'un d'autre l'a faite, sinon recommencer
  • Purger les données anciennes de la bdd
  • Compter les différents types d'action - si 0, risque d'erreur du parser
  • Message différent si l'utilisateur a déjà été révoqué sur l'article (--> le bot ignore la R1R)
  • Séparer les tests (vandalism.pl est un test, il y en a d'autres) ; changer le calcul du résultat (n-uplet de scores, pas score total)
  • Afficher les renommages
  • Recréation d'un article supprimé
  • Alerte pour page souvent modifiée par IPs/débutants (détection attaque jeuxvideo)
  • Le bot affiche parfois "la révocation a échoué" par erreur
  • Quand un message est tronqué dans le journal, garder la fin
  • Utiliser une nouvelle table SQL pour les stats (grouper par jour ?)
  • Utiliser un maximum de paramètres de configuration directement sur le wiki
  • Détecter la suppression d'une image se trouvant toujours sur commons
  • "Maladresse" et "vandalisme apparent"
  • Mesure du lag entre rc et message irc
  • Dans vandalism.pl, ne pas utiliser le diff fourni par wp, mais comparer les versions n et n-1, et évaluer les regex sur les blocs qui sont différents, pour voir quelles regex apparaissent ou disparaissent.
  • Utiliser deux comptes IRC: un pour les messages importants, un pour les autres, pour éviter le throttling anti-flood
  • Traiter les blanchiments comme des rv
  • Lorsqu'un autre participant révoque sur la même page que le bot, prévenir l'utilisateur que le bot ignorera la R1R
  • Ne prendre en compte les modifs patrouillées que lorsqu'il s'agit de la dernière version
  • Marquer comme patrouillées les modifications annulées (y compris quand plusieurs modifs sont annulées d'un coup)
  • Quand une page est blanchie après SI, indiquer le motif de la SI avec le bandeau de blanchiment.
  • Quand une page est restaurée après SI, ne pas la blanchir

Fait modifier

  • Tri des annonces par date (pointeur sur journal, détails sur journal/yyyy-mm-dd)
  • Changer les tags, du genre [namespace=0], [category=vandalism]
  • Gérer les nouvelles pages, pas seulement les modifications
  • Sur IRC, au lieu du score, mettre des étoiles
  • Vérifier ceci : plein de "je", "moi", "tu", un "je t'aime", et un "nique"... le bot a détecté des changements dans des paragraphes inchangés. --Gribeco 14 novembre 2007 à 02:58 (CET)
  • Mettre le bandeau en haut de la page de discussion
  • Poser le bandeau après {{IP partagée}} ou {{IP scolaire}}
  • Ne pas redémarrer en cas d'erreur de syntaxe (perl -c)
  • Pondérer le score en fonction de la taille de la modif (grosse modif = plus de chances de tomber sur des regex qui font tiquer le bot)
  • Révoquer proprement (jamais vers le même utilisateur)
  • Détection des révocations (admins, LiveRC) et ajustement du score
    • Ignorer la 1RR quand une révocation humaine a déjà eu lieu
  • Corriger l'enregistrement du bot sur IRC
  • Nombre de regex par rapport à la taille du delta
  • Nombre de regex + / -
  • Avertir des blanchiments (même partiels) sans commentaires
    • Laisser une IP blanchir son propre article
  • Corriger "score final" (contenu, page, utilisateur)
  • Détecter quand l'edit token est périmé ou invalide
  • Bug bandeaux sur Discussion Utilisateur:195.25.237.113
  • Bandeau pour catégorie ou image à corriger, ex. Discussion Utilisateur:88.123.40.32
  • Étendre la détection aux newbies
  • Séparer la détection dnsbl dans un nouveau package
  • Détecter les renommages en masse
  • Détecter les nouvelles pages et les importations faites par des débutants ou des IPs
  • Quand une expression est enlevée, inverser son score
  • vandalism.pl : séparer/regrouper par classe, pour mettre les annonces de mort sur "modifications suspectes"
  • Détection de bas de page supprimé, cf. http://fr.wikipedia.org/w/index.php?title=Les_Herbiers_Vend%C3%A9e_Football&diff=32574925&oldid=31646031
  • Meilleure explication ; grouper les détections et scores par catégorie (vandalisme, erreur, ...)
  • Détecter les contrefaçons du bandeau du bot
  • Avertissement sur gros ajout (même si le score est > 0)
  • whitelist_exp -> whitelist_exp_time
  • supprimer last_edit_time_str
  • Message IRC spécifique pour les blanchiments effectués par le bot (au lieu de "révocation")
  • Utiliser MediaWiki::API
  • Mettre les alertes (en plus des révocations) sur le journal, pour qu'elles soient lues par LiveRC et signalées à ses utilisateurs
  • Mieux surveiller Utilisateur:Salebot/Journal -- semi-protection à partir du titre
  • Ajouter le score dans le résumé
  • bug format: "retour à la version 33897039 deSalebot" (espace)
  • Inidiquer la raison et le score dans le résumé de blanchiment
  • Envoyer le détail des erreurs de détections (en particulier les erreurs de regex) sur IRC
  • Tronquer les entrées de journal trop longues
  • placer les avertissements du bot en dessous du bandeau {{Avertissement effacé}}
  • .config commun et overrides par langue
  • Bandeau utilisateur en cas de révocation systématique
  • Actions d'admins et d'utilisateurs expérimentés en vert (révocations, suppressions)
  • Annoncer les blocages quand l'utilisateur est dans la bdd
  • Signaler en rouge les révocations faites par un débutant ou une IP
  • Alerte pour modification de catégorie
  • Pour le spam, tenir le compte du nombre pages modifiées
  • Erreur en ajoutant le ":" aux catégories et aux images
  • Problème avec !wl (pas enregistré dans la bdd ?)
  • Gestion des patrolled edits (modifs vérifiées) maintenant qu'elles sont publiées sur IRC
  • MediaWiki::API : http://www.mediawiki.org/wiki/API:Query_-_Properties#revisions_.2F_rv pour lire une ancienne version (rvstartid/rvendid)
  • Modifs avec/sans bot flag ("&bot=0")
  • Commande pour ne plus afficher les suppressions -- mieux, afficher les suppressions pour les pages récemment modifiées seulement
  • Test 2020-07-19