Utilisateur:Michelsimard/Analyses

PrésentationDiscussionSuiviÀ faireBrouillonOutilsAnalysesCommentairesIndex
Analyses : Productivité des contributeurs

Ici 1=100 ou La productivité des contributeurs modifier

Contexte modifier

En réaction à des commentaires plus ou moins pertinents et polis de certains utilisateurs, j'avais indiqué en boutade sur ma page d'utilisateur 1=100 en voulant dire que plusieurs utilisateurs faisent beaucoup de blabla et ajoutait peu de contenu véritable à Wikipedia - et donc que l'attribut du nombre de modifications était peu pertinent -, ce qui m'avait valu une contravention d'un utilisateur qui jouait à la police. Le 100 voulait dire que le contenu réel ajouté par une de mes contributions équivalait à 100 contributions d'un utilisateur moyen. Bien que le nombre n'ait aucune importance, j'ai voulu tester certains attributs permettant de mieux apprécier la contribution réelle des utilisateurs.

Concepts modifier

Les contributions des utilisateurs sont le plus souvent comptabilisées en nombre de modifications et très rarement en termes de valeur ajoutée, c’est-à-dire l’ajout d’information pertinente aux articles. Le barème d’évaluation du développement de Wikipédia et de l’apport des différents contributeurs devrait selon l’objectif de valeur ajoutée être le volume d’information nette aux articles et pages connexes (modèles, palettes, catégories, annexes). Les contributions sont donc valables en autant que, d’une part, elles portent sur les articles et les pages connexes plutôt que sur les espaces de discussion ou les pages d’utilisateurs et, d’autre part et de manière plus importante, l’intensité des contributions soit le volume moyen de nouvelle information de contenu et la fréquence d’ajout de nouvelle information.

Il est donc fort possible que les utilisateurs qui créent le plus de valeur ajoutée ne soient pas nécessairement ceux qui effectuent le plus de modifications car celles-ci peuvent porter sur une proportion plus ou moins grande d’articles et de pages connexes et peuvent contenir en moyenne plus ou moins d’information nouvelle pertinente. L’analyse présentée ici vise à caractériser les comportements des utilisateurs en ce qui a trait à la valeur ajoutée et à tenter d’établir les attributs qui favorisent le développement de cette valeur ajoutée.

L’indicateur retenu pour mesurer la valeur ajoutée est le volume net sur les articles (Diff art), tel qu’indiqué dans le Wikistat. Cette mesure établit le volume d’information ajoutée en plus aux articles, sans préjuger de la qualité de celle-ci en termes de pertinence, d’importance ou de concision. Elle constitue donc une statistique facile à colliger et neutre en termes quantitatifs. L’absence de référent à une indication de qualité peut être vu comme un avantage ou une limite de cette mesure – néanmoins, la mesure de la qualité de l’information est un exercice difficile et complexe et laissant place à une subjectivité évidente bien que nécessaire. Ainsi, les exercices de révision d’articles, particulièrement de dernière révision, résultent souvent en une réduction de la taille des textes, ou suivant l’indicateur, en une réduction de la valeur ajoutée alors que la valeur ajoutée est en réalité augmentée.

Une autre limite de l’indicateur est la comptabilisation de codage inefficient, par exemple le recours à un modèle qui induit le plus souvent moins de code que l’utilisation simple du codage engendre une même valeur ajoutée pour un volume d’informations moindre. Inversement, l’utilisation des modèles de référence qui occupent le plus souvent plus de code que les références simples (souvent moins rigoureuses) peuvent être considérées comme supérieures en valeur ajoutée car garantissant la qualité de la présentation des références et également le potentiel de modification uniformisée automatisée ultérieure au besoin. Toutefois, comme dans les exercices de sommation et de structuration d’informations dans les articles et pages connexes, l’augmentation de la valeur ajoutée résulte en une augmentation de la taille de volume d’informations et que ces exercices représentent la très grande majorité du travail de rédaction des articles, il est donc raisonnable de faire l'hypothèse que la valeur ajoutée soit bien traduite par la différence nette sur les articles.

Méthodologie modifier

L'analyse se fait en colligeant les données statistiques d'utilisateur selon le Wikistat. Les variables primaires retenues comprennent : le nombre d'éditions, le nombre de modifications d'articles, le nombre de modifications d'annexes, le nombre de mois de participation, le nombre de jours de participation, le nombre d'heures de participation, la différence de changement de texte d'articles hors révocation (indicateur de valeur ajoutée), le nombre de petites modifications d'articles (< 100), le nombre de modifications moyennes d'articles (100-1000), le nombre de grandes modifications d'articles (>1000), le nombre d'articles créés, le premier mois de participation, le dernier mois de participation.

Des indicateurs sont dérivés de ces variables primaires, notamment :

  • Apport moyen net par modification = Différence nette de texte d'articles hors révocation / Nombre d'éditions

L'unité d'enquête est l'utilisateur de la Wikipédia francophone. Selon le Wikistat au 20 août 2017, la population totale est de 766 311 utilisateurs de la Wikipédia francophone. L'échantillon se fait au moyen d'un tri aléatoire d'utilisateur rangé selon le nombre total de contributions à tous les 25 ou 100 utilisateurs. La taille de l'échantillon final n'est pas encore déterminé mais doit engendrer des résultats significatifs et sans biais (donc au moins 400).

Résultats parcellaires modifier

Sur un échantillon infime (et non singificatif et avec biais) de 12 utilisateurs (parmi les 300 ayant fait le plus de contributions), les principaux résultats quant aux indicateurs sont présentés dans le tableau suivant. PS Ne pas utiliser ces résultats.

Indicateurs de productivité, au 2017-08-20
Indicateur Valeur moyenne
Taille d'échantillon 12
Nb d'éditions 83 602
% articles 66,3 %
% annexes 4,0 %
% articles + annexes 70,3 %
Nb mois 110
Heures/mois 34,9
Diff art (k) 9 880
Apport moyen net par édition (octets) 118
% grandes modifications 6,1 %

À ce jour sur ce mini-échantillon de contributeurs majeurs, 1=7,6 (8,2 en comptant mes participations en espagnol).