Un bot que j'ai conçu "sur le pouce" récolte les sections "personnalités" (sous plusieurs noms), et vérifie si elles parlent de "personnalités ultralocales" (l'idiot du village, par exemple) ou de personnalités nationales ayant une importance locale (la ville de naissance de Voltaire par exemple). J'espère ainsi nettoyer les sections célébrités des "orélimaptitchérikomjtmtro !" ou "M. Maurice Blanchard, boucher du village, qui propose une large variété de viandes", voire de "Mme Leplat, institutrice, qui m'a mis une super mauvaise note" (toute allusion à des personnes vivantes ou ayant existé est, bien entendu, purement fortuite, et je m'en excuse déjà).

Pour ce faire, il lit la page, vérifie si une telle section existe, récupère son contenu, puis, s'il y a un article sur Wikipédia sur une personne indiquée dans la section (en début de ligne seulement), vérifie le contenu de l'article (de manière très sommaire, se basant uniquement sur la longueur du texte). Si l'article n'existe pas, ou est très court, ou qu'il n'y a pas de lien interne, il recopie la ligne dans un journal que je poste ensuite ici avant de le traiter (mais si vous voulez aider, vous êtes les bienvenus Émoticône).

Le journal, les indications données, etc... ne sont qu'indicatifs (logique pour des indications), ce qui signifie qu'un ultracélèbre peut s'y trouver (ce n'est pas un bug, mais un cas particulier de la ligne le citant), ou un ultrainconnu ne pas s'y trouver (allez savoir, s'il crée un article long sur lui-même pile au moment où je passe dessus, ou dans le cas de bugs liés au signe =, mais je ne vais pas vous expliquer pourquoi, je viens juste de le régler Émoticône).
Des images peuvent aussi s'y trouver, non rarement, lorsqu'elles sont postées dans la section (c'est je crois toujours le cas s'il y en a, en fait - j'essaye de régler ça, mais ce n'est pas ultra urgent Émoticône ).

Je rappelle qu'un bot n'est pas parfait, donc il est normal qu'apparaissent dans les articles des ultra-célèbres, principalement si leur nom n'est pas en début de ligne, ou que des ultra-inconnus apparaisse, par concours de circonstances... C'est bien pour ça que le bot ne fait rien par lui-même, si ce n'est collecter les données Émoticône le pauvre petit chou ne publie même pas ses propres résultats... Je suis un monstre, un bourreau des bots !

dans les imperfections restant à corriger, je note les catégories de plus de 500 articles (les suivants ne sont pas traités) et les images ; cette dernière imperfection étant en voie de correction, un peu de patience, ça se verra pour les prochaines catégories (et pour les prochains passages pour celles qui sont déjà passées...) corrigées l'une comme l'autre !

99,2 % accompli (estimation)

environ 35695 communes prétraitées (données récupérées et traitées par un bot)

5,8 % accompli (estimation)
environ 2092 communes traitées (inconnus retirés par un humain) sur environ 36000 communes françaises
reprise du travail sur les
non-célèbres des communes le 10 02 09
Catégorie
département
Récupération
des données
Nombre
d'articles
Inconnus /
Personnalités
Retrait des
non-notoires
Ain ✔️ 419 99 / 221 ✔️
Aisne ✔️ 815 [1] ✔️
Allier ✔️ 320 [1] ✔️
Hautes-Alpes ✔️ 177 [1] ✔️
Alpes-Maritimes ✔️ 160 [1] ✔️
Alpes-de-Haute-Provence ✔️ 201 [1] ✔️
Ardèche ✔️ 341 87 / 190
Ardennes ✔️ 464 161 / 290
Ariège ✔️ 332 86 / 180
Aube ✔️ 435 144 / 233
Aude ✔️ 438 154 / 364
Aveyron ✔️ 305 116 / 214
Bouches-du-Rhône ✔️ 119 81 / 220
Calvados ✔️ 498 118 / 317
Cantal ✔️ 260 96 / 170
Charente ✔️ 405 112 / 239
Charente-Maritime ✔️ 472 194 / 295
Cher ✔️ 289 153 / 218
Corrèze ✔️ 284 81 / 205
Haute-Corse ✔️ 238 282 / 357
Corse-du-Sud ✔️ 126 85 / 123
Côte-d'Or ✔️ 498 140 / 238
Côtes-d'Armor ✔️ 373 154 / 393
Creuse ✔️ 259 77 / 220
Dordogne ✔️ 498 238 / 409
Doubs ✔️ 498 207 / 333
Drôme ✔️ 371 229 / 369
Essonne ✔️ 196 166 / 662
Eure ✔️ 498 149 / 290
Eure-et-Loir ✔️ 403 140 / 238
Finistère ✔️ 285 76 / 228
Gard ✔️ 353 192 / 321
Haute-Garonne ✔️ 499 218 / 454
Gers ✔️ 463 73 / 204
Gironde ✔️ 498 139 / 355
Hauts-de-Seine ✔️ 34 98 / 552
Hérault ✔️ 344 259 / 430
Ille-et-Vilaine ✔️ 351 214 / 388
Indre ✔️ 247 100 / 170
Indre-et-Loire ✔️ 276 144 / 263
Isère ✔️ 536 226 / 397
Jura ✔️ 544 289 / 453
Landes ✔️ 329 67 / 201
Loir-et-Cher ✔️ 290 110 / 171
Loire ✔️ 326 186 / 319
Haute-Loire ✔️ 261 133 / 199
Loire-Atlantique ✔️ 218 217 / 366
Loiret ✔️ 333 99 / 208
Lot ✔️ 340 103 / 277
Lot-et-Garonne ✔️ 319 96 / 291
Lozère ✔️ 184 40 / 83
Maine-et-Loire ✔️ 361 160 / 257
Manche ✔️ 601 181 / 390
Marne ✔️ 617 187 / 344
Haute-Marne ✔️ 434 190 / 277
Mayenne ✔️ 258 93 / 386
Meurthe-et-Moselle ✔️ 605 279 / 458
Meuse ✔️ 499 178 / 265
Morbihan ✔️ 262 363 / 513
Moselle ✔️ 693 166 / 335
Nièvre ✔️ 312 195 / 347
Nord ✔️ 655 398 / 793
Oise ✔️ 693 308 / 532
Orne ✔️ 505 162 / 319
Paris ❌
Pas-de-Calais ✔️ 895 313 / 542
Puy-de-Dôme ✔️ 470 119 / 230
Hautes-Pyrénées ✔️ 474 67 / 195
Pyrénées-Orientales ✔️ 226 413 / 518
Pyrénées-Atlantiques ✔️ 547 275 / 749
Bas-Rhin ✔️ 524 337 / 520
Haut-Rhin ✔️ 379 316 / 510
Rhône ✔️ 288 190 / 371
Haute-Saône ✔️ 544 205 / 300
Saône-et-Loire ✔️ 571 217 / 432
Sarthe ✔️ 373 201 / 305
Savoie ✔️ 304 137 / 259
Haute-Savoie ✔️ 295 189 / 349
Seine-Maritime ✔️ 747 184 / 444
Seine-Saint-Denis ❌ [2]
Seine-et-Marne ✔️ 513 413 / 739
Deux-Sèvres ✔️ 310 105 / 184
Somme ✔️ 784 248 / 349
Tarn ✔️ 325 130 / 268
Tarn-et-Garonne ✔️ 195 61 / 188
Territoire de Belfort ✔️ 101 20 / 40
Val-d'Oise ✔️ 182 138 / 362
Val-de-Marne ✔️ 37 43 / 264
Var ✔️ 153 142 / 285
Vaucluse ✔️ 150 121 / 311
Vendée ✔️ 282 184 / 328
Vienne ✔️ 282 87 / 167
Haute-Vienne ✔️ 203 133 / 224
Vosges ✔️ 516 296 / 488
Yonne ✔️ 456 213 / 339
Yvelines ✔️ 263 152 / 501
Guadeloupe ✔️ 32 96 / 140
Guyane ✔️ 22 4 / 26
Martinique ✔️ 35 12 / 63
La Réunion ❌ [2]
  1. a b c d et e Les chiffres ici sont manquants, version intermédiaire du bot qui a un peu capoté sur les statistiques...
    Je devais alors les lire dans le shell, sans penser au fait que 500 articles les faisaient sortir d'un shell avec un tampon très léger...
    Depuis il me les indique dans un journal sauvegardé en fichier texte.
  2. a et b L'organisation de la catégorie en sous-catégories empêche le bot de fonctionner correctement. Ceux qui veulent s'en occuper à la main sont les bienvenus...


Les communes dont le nom de section a été notablement changé sont listées aussi, à tout hasard...
Celles dont la section existe mais est vide ne sont pas listées.
Les personnalités sans lien interne, mais dont une courte biographie apparaît dans l'article, ont une indication de la longueur du texte en fin de ligne.
Les personnalités dont l'article fait moins de 300 caractères (décision purement arbitraire) sont listées aussi, là encore à tout hasard.
Le but de tout ceci est de supprimer les méchants enseignants qui mettent des mauvaises notes, ainsi que les amoureux et -euses, des "wikibloggers" (ne le niez pas, vous en avez déjà vu Émoticône).