Wikipédia:Bulletin du filtrage

Bienvenue sur le bulletin du filtrage. Cette page est principalement destinée aux modificateurs de filtre et à leurs discussions entre eux.

Les pages d'aide et de requêtes sont indiquées ci-dessous :

Filtre 362Modifier

  Ne pas archiver.

Bonjour,

J'ai mis à jour le filtre 362, suite à l'intervention de @Charlik sur le bistro, contributeur à l'origine de la requête pour sa création.

  Remarque la détection de mots-clés dans le commentaire de modification est loin d'être optimale (le filtre a laissé passer des cas qui auraient pu être filtrés), j'avoue ne pas trop savoir comment l'améliorer, j'ai testé contains_any sans succès et je n'ai pas testé une regex avec un marqueur * ; les regexes sont un peu différentes de celles que j'ai l'habitude de pratiquer (#C ; .NET), je préfère attendre d'être mieux documenté sur ce format  .

@Supertoff et @Jules* auriez-vous le temps de jeter un (deux) coup d'oeil d'ici les prochaines semaines ?

Bien à vous, LD m'écrire 1 septembre 2021 à 19:51 (CEST)Répondre[répondre]

Pourrais-je avoir accès à la liste des termes pour compléter les termes employés ? Sinon il faut penser aux variantes jouant sur les lettres au dessin identique en cyrillique et latin qui peuvent être interchangeables pour contourner les filtres tout en étant lisibles pour un humain (ex. p/р, e/е...). --Charlik (discuter) 1 septembre 2021 à 21:06 (CEST)Répondre[répondre]
@Charlik En théorie, on ne doit pas fournir des informations sur un filtre privé sur une page publique ; mais étant donné que la liste était publique avant que je privatise le filtre, suite à sa mise à jour (confidentialité de certains éléments), je vais te fournir les éléments non sensibles/qui étaient publics par mail. Une copie sera également transmise à mes collegues mentionnés pour une transparence totale. Bien à toi, LD m'écrire 1 septembre 2021 à 21:19 (CEST)Répondre[répondre]
@Charlik, c'est   pour le mail.
Pour les homoglyphes, c'est une bonne suggestion et j'ai récemment travaillé en partie sur cette question (trad. commencée de l'outil HomoglyphHunter) ; je regarderais ce qu'il est possible de faire ; à défaut, l'outil pourra toujours détecter des irrégularités, je t'invite donc à regarder de temps en temps. LD m'écrire 1 septembre 2021 à 21:30 (CEST)Répondre[répondre]
Bien reçu, merci. --Charlik (discuter) 1 septembre 2021 à 21:47 (CEST)Répondre[répondre]
  LD : salut. Pour le commentaire de diff, ça marche aussi bien que les mots clés ailleurs. Vu ton filtre, s'il y a eu des trucs non détectés c'est qu'ils n'étaient pas dans le filtre normalement ? 'toff [discut.] 2 septembre 2021 à 09:27 (CEST)Répondre[répondre]

Transfert d'éléments du 312 vers le 133Modifier

Hello,

Le filtre 312, dédié à Papa Franck (PF), contenait diverses grossièretés qui ne lui étaient pas spécifiques, conduisant à des déclenchements pour des vandalismes génériques sans aucun rapport avec PF. J'ai déplacé un certain nombre d'entre eux vers le filtre 133, que j'ai par ailleurs renommé de « Ajouts intempestifs récurrents » (titre un peu vague) en « Grossièretés et autres ajouts intempestifs », puisque la quasi-totalité des éléments filtrés sont des grossièretés, injures vulgaires, etc.

Il reste quelques vieux filtrages spécifiques dans le 133 (j'en ai encore retiré trois, obsolètes), que j'aimerais bien virer.

Bon dimanche, — Jules* discuter 27 novembre 2022 à 13:54 (CET)Répondre[répondre]

Le filtre 133 fait un tabac. Les regex déplacées depuis le 312 n'ont pas été modifiées : le nombre croissant de déclenchements est une conséquence du fait que le 133 s'applique très largement, à l'inverse du 312, dont le périmètre d'application était plus restreint (ligne 9). — Jules* discuter 29 novembre 2022 à 15:29 (CET)Répondre[répondre]
Salut @Jules* ;
Merci pour tout. Je suis plus réservé et mitigé sur cette modification (pas les précédentes) : les lignes 41-43 du 133 sont différentes de celles du 312.
Par exemple, les lignes 17-23 du filtre 312 pourraient être impactées par ce changement, celles-ci restent difficilement comparables avec l'effet entonnoir mentionné dans ton second message : c'est un autre entonnoir. Cela dit, je me pose la question de la juste place de ces lignes, tout comme celles l. 26-33 qui pourraient faire l'objet d'un filtre dédié. Dans le doute, j'aurais plutôt conservé certaines expressions, mais certaines autres me semblent bienvenues (et d'autres pourraient àmha encore être retirées).

Tu penses à quels éléments obsolètes du filtre 133 ?

Hors-propos : je rêverais que l'on puisse « importer » un filtre dans un autre (idée de phabricator !), la cascade permettrait de créer un filtre-dictionnaire et ainsi diminuer ces doublons.
Bien à toi, LD (d) 30 novembre 2022 à 00:17 (CET)Répondre[répondre]
Merci pour ton retour @LD. Oui pour les lignes 41-43, que j'ai d'ailleurs retouchées pour éviter tout FP, puisque j'avais conscience d'élargir la détection.
Bien vu pour les lignes 17-23 du 312 ; mais sauf la ligne 22 qui est spécifique (et sans doute obsolète), le reste participait vraisemblablement, avec l'ancien match, à détecter des trucs sans aucun rapport avec PF. Àmha on pourrait virer ces lignes 17-23.
Pour les lignes 26-33, un filtre dédié mais générique en les remaniant pourrait être pertinent, bonne idée ; à proposer sur le BA avant.
Dans le filtre 133, il reste des éléments hors grossièretés (lignes 30-35), et je viens d'ailleurs d'en ajouter un (qui n'est pas obsolète, donc). En fait, il manque un filtre à mon sens : le filtre 29 est dédié aux vandalismes spécifiques sur des pages spécifiques ou par des IP spécifiques, donc théoriquement, l'élément que j'ai ajouté aujourd'hui au 133 n'y a pas sa place ; et je n'ai pas trouvé de filtre plus approprié que le 133.
Hors-propos : plus qu'un import de filtre, ce serait un import de regex, une bibliothèque de regex, non ? Ça peut être une bonne idée, mais les cas de doublon de regex ne sont pas si courants, et j'ai peur qu'une telle fonctionnalité fasse perdre en clarté du code ce que l'on gagnerait en économie de caractères  . — Jules* discuter 30 novembre 2022 à 00:32 (CET)Répondre[répondre]
Non merci à toi  . Je regarderais à tête reposée mais avec ta réponse je me fais ces remarques :
  • l.17-23 du 312 seraient obsolètes si on transferait vers le 148 qui se veut propice et large : je pense que ça irait dans la bonne voie ;
  • H.S : la plupart des fonctions agissent souvent comme des bibliothèques de regex (ip_in_range, rmspecials, etc.). En dehors de AF "brut", des extensions viennent fournir des bibliothèques ; une extension BadWords, configurable en json ou autre, verra peut-être le jour. J'ai tendance à croire qu'on tend vers ce type de fonctionnement (Extensions AntiSpoof, StopForumSpam, CentralAuth, etc. viennent enrichir AbuseFilter). Alternativement à la « cascade » de biblothèque, donc sans se passer de la répétition des doublons, on pourrait « encadrer » les doublons récurrents. Par exemple, en créant un filtre dédié (non activé) qui listerait des variables (mots-clés récurrents) ou formats réutilisables (par ex. pour les pseudos). Cela permettrait probablement de « lisser » l'utilisation des variables, voire de tendre vers des variables concaténées et modifier les filtres en série comme si on venait appliquer un « patch » en copiant-collant la dernière bibliothèque. Par exemple toujours c/c (si ce n'est en mode commentaire) ou se référer à la dernière version de match_blabla du « filtre bibliothèque », en particulier si on passe de match_blabla = "a|b"; à match_blabla = "a|b|c|d"; ou qu'un nouveau FP est découvert ; plutôt que d'avoir une seule variable englobante dans laquelle on se perd au bout d'un an.
LD (d) 30 novembre 2022 à 01:08 (CET)Répondre[répondre]

Bilan subjectif de 2022Modifier

Hello,

J'ai publié un petit bilan subjectif de 2022, ainsi que des analyses tout aussi subjectives, sur le Bistro : Wikipédia:Le Bistro/2 janvier 2023#Vandalisme, harcèlement : bilan 2022 des filtres anti-abus. N'hésitez pas à compléter et à réagir  . — Jules* discuter 2 janvier 2023 à 15:50 (CET)Répondre[répondre]

Filtre 359Modifier

Salut, je t'adresse mes voeux et mes remerciements @Od1n pour ton implication et tes ajouts ;

cf. ces propositions (et ce début d'ébauche, en particulier les caractères spéciaux qui sont bornables) : Qu'en dis-tu ? Bien à toi, LD (d) 8 janvier 2023 à 22:59 (CET)Répondre[répondre]

Meilleurs vœux aussi (c'est ça qu'il faut socialement dire ?)
Le remplacement par l'intervalle unicode me semble être une bonne idée (sous réserve que cela corresponde bien, mais j'ai vérifié rapidement et ça semble bien être cela), avec le lien qui va bien en commentaire de code comme tu as fait.
Pas d'avis pour ce qui serait du déplacement, je vois des raisons de garder dans 359 comme des raisons de déplacer vers 319… je trouve que les deux solutions seraient acceptables, selon le point de vue.
od†n ↗blah 9 janvier 2023 à 00:55 (CET)Répondre[répondre]
Pour ce qui est des notes que tu as ajoutées dans 319, je les avais déjà remarquées, mais j'avoue ne pas m'être penché dessus… Mais s'il y a l'utilité pour ce genre de détections "larges", pourquoi pas, mais peut-être dans un filtre qui n'effectuerait pas d'action ? od†n ↗blah 9 janvier 2023 à 01:00 (CET)Répondre[répondre]
À la réflexion, je serais en fait d'avis de déplacer en partie le 359 vers le 319 comme tu as suggéré. D'une part parce que le 359 traite actuellement deux utilisations différentes, d'autre part parce que l'action réalisée par le 319 semble être ce qu'il faut faire. od†n ↗blah 9 janvier 2023 à 01:12 (CET)Répondre[répondre]
Merci de ta réponse.
Pour le 359, c'est fait.
Pour le 319, je me dis qu'il vaut mieux déplacer et le mettre à jour en même temps (interdire les caractères qui passent à travers les restrictions). L'un n'empêche pas l'autre, mais c'est pour ne pas allonger les historiques. Je dois cependant me documenter sur les caractères interdits. A partir de mw:Account creation user experience/Usernames, je devrais pouvoir trouver mon bonheur, je ne crois pas que cela diffère localement. LD (d) 13 janvier 2023 à 20:09 (CET)Répondre[répondre]