Wikipédia:Nouvelles du Wikilab/Brouillon
Compte-rendu hebdomadaire des travaux scientifiques sur Wikipédia
· S'inscrire · Se désinscrire ·
|
Les Nouvelles du Wikilab visent à présenter des études scientifiques ayant Wikipédia pour objet de recherche.
La sélection reprend généralement les travaux mentionnés dans la Research Newsletter de Meta-Wiki. Elle apporte pour chacun d'entre eux des précisions complémentaires.
L'économie wikipédienne
modifierLe traitement de Wikipédia par les sciences économiques donne lieu à deux approches très distinctes.
La première s'attache à mettre en évidence l'impact informationnel de l'encyclopédie sur le comportement des acteurs. On reste dans un cadre microéconomique où l'encyclopédie ne vient que modifier à la marge un écosystème économique. L'étude de Moat et al. sur d'hypothétiques corrélations entre consultation/édition de wikipédia et les cours de la bourse se situe dans ce cadre.
La seconde se veut plus ambitieuse. Elle implique de considérer Wikipédia comme une infrastructure inédite, dotée de ces propres règles de fonctionnement et éventuellement susceptible de renouveler les structures économiques classiques. Plusieurs approches théoriques sont ici en concurrence : l'économie de la contribution de Bernard Stiegler, la Wikinomie etc. La thèse de Robin Paulson esquisse une approche inédite : elle tente d'intégrer Wikipédia et, de manière générale, les communautés en ligne à la pensée marxiste.
Prédire les marchés avec Wikipédia
modifierWikipédia suscite des usages insoupçonnées. Si l'on en croit une équipe de chercheur anglo-américaine, l'encyclopédie en ligne pourrait servir d'indicateur économique prédictif. Intitulée Wikipedia Usage Patterns Before Stock Market Moves ('Quantifier les modes d'usage de Wikipédia avant les mouvements du marché), leur étude a été assez médiatisée (cf. les recensions dans Wired ou les Échos). Elle s'appuie sur une méthodologie quantitative pour évaluer l'incidence de Wikipédia sur les réactions des investisseurs.
Selon Moat et al., les outils numériques ne diffusent pas seulement plus d'information, mais aussi plus d'information sur les usages de l'information. L'archivage des différents états d'un texte et des statistiques de consultation permet de mieux cerner ses conditions de production et de sa réception. Les auteurs soulignent que leur travail se situe dans la continuité de plusieurs investigations antérieures sur la capacité prospective des requêtes google ou des messages twitter à renseigner des mouvements de marché émergents.
Le corpus analysé comprend des entreprises cotées au Dow Jones. Deux indices ont été élaborés : l'un sur le taux d'édition, l'autre sur le taux consultation. Les chercheurs ont tenté d'identifier les gains réalisés, lorsqu'on suivait l'on utilisait les deux indices comme critère de sélection. Ils produisent des résultats assez radicalement différents :
- L'indice du taux d'édition suit une courbe ordonnée, assez proche de la Loi Normale. Le pic est atteint lorsque la valeur ne génère aucun revenu (aux alentours de 0% d'évolution). Le suivi de l'indice ne permet que de réaliser une opération à taux zéro.
- L'indice du taux de consultation est plus heurté. Dans le jargon des statisticien, on qualifierait cette courbe de leptokurtique : le pic maximal est surélevé au détriment des valeurs intermédiaires et extrêmes. La localisation de ce dernier est également assez différente : il prend place lorsque la valeur génère un revenu correct (1 sur une échelle logarithmique s'étendant de -2,5 à 2,5). Le suivi de la courbe permet de dégager manifestement un bénéfice non négligeable.
L'étude se révèle ainsi assez riche d'enseignement. Elle met en évidence que les contributeurs ne suivent pas les même logiques que les lecteurs des articles financiers. La participation des premiers n'est quasiment pas corrélée avec le cours de l'entreprise. Le contenu de l'article évolue sans doute davantage en fonction de données extérieures (la médiatisation de telle ou telle activité de l'entreprise) ou ponctuelles (l'intérêt soudain d'un ou de plusieurs contributeurs).
Le lectorat, par contre, suit une logique prédictive (et, vraisemblablement, performative). Il s'agit, dans sa majorité, d'investisseurs, désireux de s'informer sur tel ou tel état du marché. L'intérêt informationnel pour une valeur entraîne logiquement son appréciation à court terme.
<Note d'Alexander Doria : je me suis intéressé à une série d'études assez proches pour les besoins de ma thèse. Elles cherchent à évaluer l'impact de médias journalistiques, comme le Wall Street Journal. Plusieurs analyses quantitatives ont mis en évidence leur rôle correctif ou amplificateur : la tonalité stylistique des chroniques financières contribue à accentuer ou déprécier des tendances préexistantes. Il serait sans doute intéressant de réaliser le même type d'étude sur Wikipédia. Par exemple, est-ce que la tonalité plus ou moins neutre d'un article conditionne éventuellement la réputation financière d'une entreprise ou d'un investisseur ?>
Une alternative au capitalisme ?
modifierEntre la thèse de Robin Paulson et l'étude de Moat et al., le contraste et total. Digital Commons : Escape from Capital ? ne s'intéresse pas uniquement à l'impact ponctuel de Wikipédia sur telle ou telle cotation marchande, mais à une forme d'incidence structurelle. L'encyclopédie, ainsi que plusieurs autres projets collaboratifs libres comme Linux ou OpenStreetMap, semblerait amorcer une refondation en profondeur des économies modernes, en promouvant certaines valeurs et modalités organisationnelles situées complètement hors du cadre du paradigme néo-classique. Paulson tente d'évaluer la portée réelle de cette promesse révolutionnaire.
Digital Commons s'inscrit dans un cadre théorique plutôt marxisant, s'inspirant notamment des Manuscrits de 1844 et de ses lointains avatars altermondialistes (en particulier Empire de Michael Hardt et Antonio Negri). Paulson souligne que les sociétés humaines s'orientent vers une privatisation indéfinie des biens communs : ainsi de nombreux projets issus de la révolution informatique des années 1970 et 1980 ont finalement été récupéré par des investisseurs privés. Cette privatisation provoquerait une forme de retournement dialectique : l'appropriation atteindrait son point de saturation, entraînant a contrario l'émergence d'interfaces communalisées.
La thèse est découpée en deux parties. La première égrène les descriptions assez peu originales des principaux projets étudiés : celle de Wikipédia court de la p. 39 à la p. 45. La seconde partie est beaucoup plus stimulante. Elle pense les communautés collaboratives sous le prisme de plusieurs notions marxistes.
- La classe : il existe manifestement des formes de stratification sociale. L'éducation constitue manifestement le discriminant principal : ajouter sa pierre à Wikipédia et, plus encore, à Linux, nécessite un bagage intellectuel non négligeable. Paulson note également une certaine tendance à prolonger des habitus sociaux préexistants. Wikipédia n'admet ainsi que des sujets notables, agréé d'une certaine manière par les institutions sociales dominantes. A contrario, l'usage d'un dispositif anonyme et ouvert met à mal les mécanismes de reconnaissance de classe. De nombreux déterminants (la localisation géographique, l'apparence corporelle, les origines familiales…) ne peuvent plus jouer dans le cadre.
- Le bien : Paulson émet à ce propos une position beaucoup plus tranchée. Les communautés collaboratives concrétisent, selon lui, une dissolution complète de l'échange marchand. La théorie de la gratification symbolique (le bénévole tire sa motivation de la reconnaissance de ses pairs) n'est pas véritablement probante. La reconnaissance communautaire signale une absence de rétribution, mais ne la remplace pas : « Comme il n'y a pas d'échange ou, plutôt, que l'un des éléments de l'échange est un symbole, l'admission d'une dette sociale plutôt qu'économique, les artefacts rassemblés par les commoners ne peuvent pas être des biens marchands » <Note d'Alexander Doria : cette analyse est intéressante, mais un peu partiale. On pourrait facilement renverser la terminologie employée. Les économistes conventionnalistes, comme André Orléan insistent a contrario sur la dimension essentiellement symbolique de l'échange marchand, qui reflète une intrication complexe de structures sociales et de cadres mentaux. En ce sens, l'analogie de la contribution collaborative et de l'acte marchand devient tout-à-fait envisageable.>.
- Le travail et l'aliénation : la licence libre joue ici un rôle essentiel. Elle interrompt la dynamique de privatisation et d'enclosure des activités humaines. Bien que toujours possible, l'aliénation marchande est fortement limitée dans ce cadre. Ce garde-fou ne garantit pas pour autant une libération complète du travailleur/contributeur. Paulson note que « Au sein de Wikipédia (…) l'essentiel du prestige et de la reconnaissance est conféré à un petit groupe de personnes, ignorant tous les autres qui prennent part au travail d'édification de l'encyclopédie ». Ici, le contributeur ponctuel, et/ou non-enregistré est confronté à une certaine forme d'aliénation : le produit de son travail est partiellement capté par des contributeurs expérimentés, et lui devient ainsi étranger. Il existe aussi une autre forme d'aliénation, plus diffuse : la médiatisation des fondateurs des projets collaboratifs (Linus Torvald pour Linux, Jimmy Wales pour Wikipédia), laisse un peu dans l'ombre la communauté dans son ensemble.
- Le fétichisme : pour Marx, la marchandise devient fétiche dès lors que l'information sur ses conditions de production est quasi-nulle. Les représentations symboliques prennent alors le pas sur les considérations rationnelles. Les projets collaboratifs inverseraient cette dynamique. Chaque contribution est explicitement créditée ; les étapes du processus de production sont publiques ; l'interaction entre le consommateur et le producteur est souvent directe. Sur Wikipédia « Les pages de discussion ont aussi un historique, de telle sorte que chaque commoner peut identifier l'identité de leurs intervenants et vérifier si les commentaires ont été supprimé, réordonné ou modifiés. Les relations sociales, inhérentes à tout rassemblement d'artefacts, sont toujours présentes. La nature véritable du travail réalisé peut toujours être révélée » (p. 90).
- La plus-value : dans les théories marxistes, elle est toujours de nature monétaire. En versant au salarié une somme inférieure à la valeur réelle de son travail, le capitaliste réalise une marge plus ou moins significative, qui contribue à pérenniser sa domination. Cette plus-value monétaire est évidemment impossible dans les projets collaboratifs. Paulson met en évidence l'existence d'une plus-value symbolique : certains wikipédiens médiatiques bénéficient d'une reconnaissance bien supérieure à ce que vaut objectivement leur travail. Celle-ci reste néanmoins limitée. En renonçant à toute perspective d'exploitation personnelle de Wikipédia, Jimmy Wales a garantit l'indépendance de la communauté et sa reconnaissance symbolique en tant qu'entité.
La conclusion de la thèse est plutôt positive. À de nombreux égards, les projets collaboratifs s'émancipent des mécanismes fondamentaux du capitalisme. Néanmoins, plusieurs difficultés demeurent. La structure des communauté demeure fondamentalement élitiste, même si il s'agit d'une élite ouverte, dont le travail effectif constitue le principal critère d'intégration. Pour corriger ce biais, Paulson appelle à décentraliser davantage le fonctionnement des projets, en passant par plusieurs interfaces en réseau plutôt que par une interface unique <Note d'Alexander Doria : cette conception n'est pas si éloignée de la dernière création de l'inventeur du wiki, Ward Cunninham : The Smallest Federated Wiki>.
Varia
modifier- Des chercheurs barcelonais ont mis au point une case studies sur la réception de Wikipédia par les dyslexiques. Ils notent en effet que 10% des étudiants, dans le monde, sont atteints de formes plus ou moins sévères de dyslexie, qui limitent sérieusement leur accès à l'encyclopédie en ligne. Une expérience réalisée avec 28 dyslexique a permis de comparer l'efficacité de différentes tailles typographiques (10, 12, 14, 18, 22 et 26 points) ainsi que différents espacements (0,8, 1,0, 1,4, et 1,8). L'espacement n'a aucune incidence sur la réception du texte. La grosseur du texte a, par contre, un impact significatif. Les chercheurs montrent que les caractères en 18 points représentent une situation optimale : au-delà les gains de compréhension devient plus limités.
- Une équipe allemande s'est intéressée à une donnée peu analysée à ce jour : l'ajout et le retrait des wikiliens. Leur corpus comprend plusieurs centaine de milliers d'articles issus de plusieurs Wikipédia (francophone, germanophone, italophone et nééerlandophone…) — le corpus issu de la wikipédia francophone étant le plus étendu avec 180 000 articles. Les informations ainsi récupérées permettent d'énoncer plusieurs prédictions. L'attachement préférentiel (c'est-à-dire le réseau des liens rapproche un article a d'un article b, sans que l'un et l'autre soient directement connectés) constitue un indicateur probabiliste très fiable : lorsque la proximité est forte, la probabilité d'un wikilien est supérieure à 50%. Il existe également d'autres indicateurs plus complexes : l'embarquement (embedded) fait référence à l'appartenance d'un article à un nœud thématique cohérent, le déficit de nouveauté (liability of newness) est élevé lorsque les nouveaux liens sont fréquemment retirés, l'instabilité (instability) est patente lorsque le réseau d'article est destructuré ou inexistant. Toutes ces propriétés fournissent un cadre théorique autorisant une analyse en profondeur des wikilen. Les chercheurs soulignent que ce travail préparatoire pourra servir de bases à plusieurs analyses ultérieures.
Carnet du Wikilab
modifier- Alexander Doria (d · c · b) et la communauté HackYourPhd organisent un atelier de recherche sur les nouvelles pratiques d'évaluation scientifique le 22 mai à la Maison de la Recherche (Paris) de 18h à 20h. L'atelier s'interrogera notamment sur les procédés émergents notamment mis en œuvre sur Wikipédia et évoquera le lancement de la revue de recherche Wikilogie.Il est possible de s'inscrire sur l'événement Facebook ou [[Atelier pour sur Wikipédia.
- L'ISCC a publié le programme de la journée d'étude du 5 juin, Wikipédia et la science. Il y a près d'une vingtaine d'intervenants, dont quelques wikimédiens (Cymbella, Alexander Doria, Alexandre Moatti…). L'entrée est libre, mais il est préférable de contacter au préalable les deux organisateurs, Lionel Barbe et Valérie Schaffer.
- Un colloque consacré à DBPedia est programmé les 23 à 25 octobre 2013 à Sidney en Australie. Les propositions de communication peuvent être envoyées jusqu'au 8 juillet.
Bibliographie
modifier- (en) Helen Susannah Moat, Chester Chunne, Adam Avakian, Dror Y. Kenett, H. Eugene Stanley et Tobias Preis, « Quantifying Wikipedia Usage Patterns Before Stock Market Moves », Scientific Reports, vol. 3, (lire en ligne)
- (en) Robin Paulson, The Digital Commons: Escape from Capital?, University of Auckland, , 129 p. (présentation en ligne)
- (en) Luz Rello, Martin Pielot, Mari-Carmen Marcos et Roberto Carlini, « Size Matters (Spacing not): 18 Points for a Dyslexic-friendly Wikipedia », W4A2013, (lire en ligne)
- (en) Julia Preusse, Jérôme Kunegis, Matthias Thimm, Thomas Gottron & Steffen Staab, « Structural Dynamics of Knowledge Networks », sur Uni-Coblenz.de, (consulté le )
Discussion
modifierN'hésitez pas à discuter ci-dessous les informations publiées sur cette page (ou à apporter des compléments aux études scientifiques présentées) :