Projet:Communes de France/VBA/Intro
Le présent article vise à introduire un tutoriel de VBA, une implémentation de Microsoft Visual Basic intégrée dans toutes les applications de Microsoft Office, et, en particulier dans le cas qui nous intéresse, à Microsoft Excel, dans la perspective d'améliorer les articles des divisions françaises dans Wikipédia, et en particulier les articles des communes de France.
Principe : la progressivité
modifierL'idée est la progressivité.
- d'abord apprendre à manipuler des données et créer des listes, tableaux ou palettes ;
- puis à générer du texte sous forme de phrases ou de paragraphes, avec des références ;
- puis à générer des sections entières intégrant texte, listes, tableaux ou autres éléments que l'on trouve habituellement dans les articles de WP.
Chaque exemple sera dédié à un cas particulier que l'on peut rencontrer dans les articles de divisions françaises.
Noter que les codes qui seront diffusés pourront être utilisés par n'importe quel utilisateur, même s'il ne s'est pas spécialement intéressé au tuto. Par exemple, en un clic tout utilisateur pourra générer la section "communes limitrophes", avec toutes les distances et tous les noms de communes wikifiés. Libre à l'utilisateur de le coller ensuite ou non à l'emplacement voulu de l'article concerné. Ce n'est qu'un exemple bien entendu.
Essentiels
modifierPour commencer, il faut bien entendu absorber quelques tutos, pour assimiler les bases du VBA. En voici deux :
- Excel pratique ;
- Manipuler les chaînes de caractères - essentiel. Car le principe de nos interventions sera de récupérer le contenu d'un modèle ou d'un article sous forme d'une immense chaîne de caractères que l'on manipule ensuite, puis que l'on recharge sur Wikipédia.
Noter que pour ce que l'on souhaite faire, à savoir intervenir sur les articles de Wikipédia, on n'a pas besoin d'être un expert en VBA, mais connaitre uniquement les manipulations et autres traitements nécessaires à ce que l'on veut obtenir. De la même manière que récupérer à la volée des données sur une page web (pas une base de données), se fera toujours de la même manière (et cela ne s'invente pas!).
Plan
modifierLe plan ci-après sera complété au fur et à mesure de la création des articles.
Utiliser une base de données structurées
modifierLe bot travaille ici à partir de tables Excel, issues de bases de données structurées téléchargées (en .dbf, .csv ou simplement en .xls)
- Listes
- Tableaux
- Palettes
- Textes
Utiliser des données récupérées à la volée sur le web
modifierLe bot travaille ici à partir de données récupérées à la volée sur des pages web. Il faut savoir en particulier s'affranchir des informations parasites qui peuvent venir perturber la récupération, comme l'affichage de bandeaux divers (pubicité, information, etc).
Utiliser des tables de blocs de textes
modifierLes tables de blocs de textes sont indispensables dès lors que l'on veut étoffer un texte descriptif. Avec des données sèches, on a en effet vite fait le tour.
Modifier un modèle ou un article de WP
modifier- en semi-automatique
- en automatique
Le stade ultime, que je ne mets néanmoins pas en chapitre, est … la création d'articles sur Wikipédia en semi-automatique ou en automatique complet. A ce stade le contributeur dispose de tous les outils pour se lancer. De nombreux domaines s'y prêtent, le tout étant de disposer de données en fichier ou directement récupérables à la volet sur le web. Le niveau de détail et de wikification des articles dépend du temps que l'on souhaite consacrer à la constitution des bases de données annexes (blocs de textes, wikification, etc) sur lesquels viendra s'adosser le bot. Quelques exemples de domaines :
- le cinéma (à partir des fiches ImdB) ;
- Les espèces animales ou végétales ;
- etc