Wikipédia:RAW/2012-07-01

Message de Cantons-de-l'Est

Chères lectrices, Chers lecteurs,

Du 2 au 6 juillet, j'ai participé au Forum mondial de la langue française (FMLF) à Québec. Je souhaitais vous informer de quelques observations. Si le sujet de cette infolettre n'avait porté que sur le FMLF, vous m'en auriez peut-être tenu rigueur. J'ai augmenté son contenu pour me faire pardonner.

Je vous souhaite d'agréables moments cet été.

Brèves modifier

  • de:Pizzakarton est un Lesenswerte Artikel (équivalent de notre BA) depuis le 19 novembre 2011 (son seul interwiki pointe vers une section de trois paragraphes dans un article en anglais, et depuis ce 8 juillet 2012, vers un nouvel article en français, Carton à pizza). Les contributeurs qui ont participé à sa rédaction ont récemment reçu un Zedler-Preis spécial. [2]
  • « [Quand] il y a un conflit d'intérêt évident qui provient du lien entre un professionnel en relations publiques et le sujet de l'entrée dans la Wikipédia, que ce soit un client ou un employeur, [ces personnes] ne devraient pas directement modifier [l'article][trad 1]. » Ce conseil est inscrit dans un « guide de pratiques lors d'un conflit d'intérêt[trad 2] », rédigé par Wikimedia UK et le Chartered Institute of Public Relations (en), association de professionnels britanniques en relations publiques. [3]
  • Comment réussir la page Wikipédia de son entreprise ? : « Il ne faut pas oublier que Wikipédia est une encyclopédie et non une vitrine commerciale. » « Les faits, rien que les faits et rien ne vous sera reproché. » « Wikipédia est l'outil de communication le moins flexible du web ».
  • Dans le cadre d'une convention avec Wikimédia Suisse, l'université de Neuchâtel a confié la numérisation de son herbier, comportant plus de 30 000 images et descriptions scientifiques de plantes suisses, à une équipe de wikimédiens. C'est une première en Suisse. (fr)[4]
  • « L'encyclopédie permettrait de mieux comprendre comment fonctionne la propagation d'une actualité, en analysant à la fois les modifications et les contenus de ses pages. » Des chercheurs du MIT ont préféré Wikipédia « du fait de la pluralité des données [et] parce que le site permet de mesurer de manière régulière, à la différence d'autres, des contenus dynamiques pour contrôler les changements sur le long terme. » (fr)[5]
 
Une Chrysiridia rhipheus féérique apparaît sur cette carte offerte dans un paquet de cigarettes. Dessin publié en 1928.
  • Le 29 juin 2012, un étudiant à la maîtrise de l'université McGill à Montréal a publié sur son expérience de contributeur dans la Wikipédia en anglais. Il affirme avoir rédigé le plus gros de en:Chrysiridia rhipheus, un featured article mis en lumière le 7 avril 2012. Il rapporte qu'un professeur américain a imposé à ses étudiants en médecine de rédiger des articles sur les « espèces de mouches d’importance médico-légale ». (fr)[6]
  • La société Résonéo, utilisant un outil maison, avance que, en analysant 4,6 millions de requêtes faites à Google.fr en juin 2012, Wikipédia est à la première place pour la visibilité devant YouTube et Dailymotion. Son « score de visibilité » dépasse 200 millions, YouTube suit à 145 millions et Dailymotion est à 66 millions. (fr)[7]
  • Le Parlement européen a rejeté ACTA. Il faudra plusieurs mois avant qu'une alternative ne soit proposée et débattue à nouveau. [8]
  • Dans le cadre de Pas Sage En Seine, Sylvain Boissel (salarié de Wikimédia France [9]) a expliqué le 15 juin 2012 comment se fait la lutte au vandalisme dans la Wikipédia en français. À min, je lis qu'à chaque jour l'ensemble des Wikipédias serait alimenté « par plus de 100 000 contributeurs ». (fr)[10]
  • « La force de l'encyclopédie réside en grande partie dans le référencement des pages internes ». « La mise à jour constante des articles et l'utilisation par [Wikipédia] de Facebook ou de Twitter pour les diffuser est également un atout conséquent. » (fr)[11]
  • Une nouvelle définition pour le Wiktionary ? « Encyclopédie (n. f.) : Wikipédia en papier, sans page de discussion, qui ne traite que de sujets sérieux et dont les erreurs sont définitives. » [12]
  • L'ONU a déclaré que l'« Internet libre » est un droit fondamental des personnes. Cette liberté sous-entend la liberté d'expression dans Internet. Son application est volontaire. [13]

Plagiats de masse modifier

La communauté scientifique allemande vit une série de scandales de plagiats depuis le début de l'année 2011. Deux communautés de « chasseurs » utilisent des wikis pour coordonner leurs activités. Elles ont ainsi montré que les thèses doctorales de juristes, de scientifiques, de chefs d'entreprises et de politiciens comprennent un grand nombre d'extraits qui ne sont pas attribués à leur auteur. Ironiquement, un manuel met ses lecteurs en garde contre les « emprunts » de la Wikipédia en allemand, manuel qui comprend pas moins de 18 extraits de cette Wikipédia qui ne sont pas attribués. [14]

Le 16 février 2011, le Süddeutsche Zeitung publie un article qui avance que la thèse doctorale du ministre de la Défense allemand Karl-Theodor zu Guttenberg comprend beaucoup de texte plagié. Cette information donne l'impulsion à des scientifiques de se coordonner pour mettre à jour d'autres plagiats de M. Guttenberg. Ils utilisent les outils de Google Documents au début, mais découvrent rapidement qu'ils ne peuvent répondre aux requêtes d'une communauté dépassant 100 membres. Quelques membres jugent qu'un wiki répondrait mieux à leurs besoins et l'ont donc lancé dans Wikia : GuttenPlag Wiki. Au terme de la « chasse », cette communauté montre que 63 % des lignes dans 94 % des pages de la thèse sont plagiées. Pour réduire la virulence des attaques, M. Guttenberg a quitté pour les États-Unis.

En avril 2011, des « chasseurs » montrent que la thèse doctorale de la fille d'un politicien bavarois bien connu comprend beaucoup de plagiats. Cette découverte incite des gens à lancer VroniPlag Wiki (en), qui se donne comme mission de mettre à jour les plagiats dans les thèses doctorales allemandes. Même si la taille de cette communauté est moindre que la précédente, ce wiki accepte des soumissions anonymes et reçoit régulièrement des propositions par courriel. Présentement, la communauté semble animée par une dizaine d'administrateurs aidés de « passants ». Comme pour Wikipédia, la communauté doit compter avec les trolls.

VroniPlag Wiki a démontré que 26 thèses comportent beaucoup de plagiats. Parmi celles-ci, huit ont été annulées et des poursuites judiciaires seraient en cours. Ces découvertes semblent montrer que le plagiat est courant parmi les doctorants allemands. En Pologne et au Danemark, des études ont mis à jour des comportements semblables. Par exemple, une thèse publiée au Danemark par un étudiant pakistanais porte sur les réseaux terroristes. L'auteur a recopié plusieurs extraits de textes déjà publiés en remplaçant « criminal » par « terrorist ». Hors VroniPlag Wiki, des thèses de personalités d'autres pays (le ministre de l'éducation roumain, le président de la Hongrie et un parlementaire sud-coréen, par exemple) sont aussi étudiées. La mise en ligne des thèses, indexées par des moteurs de recherche, faciliterait de beaucoup la détection des plagiats, peu importe la langue.

Les universités allemandes seraient incapables de réagir de façon cohérente et sensée aux révélations. Elles ne semblent pas vouloir non plus lancer une campagne d'informations sur la violation du droit d'auteur. Huit anciens responsables universitaires de haut rang ont signé une lettre adressée au Süddeutsche Zeitung pour demander que cesse la « chasse » aux plagiats et laisser les universités faire leur travail. C'est qu'il est plutôt rare que la population remette en cause l'efficacité des universités allemandes.

Les moteurs de recherche devenant de plus en plus puissants et les communautés de « chasseurs » voyant l'utilité d'un wiki pour échanger, il y a fort à parier que les plagiats seront de moins en moins faciles.

FMLF, observations modifier

 
Flamants de James pendant une parade nuptiale. Cette photo est featured picture sur la Wikipédia en anglais. Prise par Pedros Szekely, elle provient de Flickr où elle est publiée sous CC BY 2.0.

Du 2 au 6 juillet, quatre wikipédiens tiennent un stand au Forum mondial de la langue française (FMLF). Je suis heureux d'être avec de tels équipiers : efficaces, agréables et passionnés (Letartean, Serein, Simon Villeneuve et moi — Cantons-de-l'Est). En plus des visiteurs canadiens, notre stand est couru par des gens de toutes nationalités : Mali, Cameroun, Burkina Faso, Bénin, Côte d'Ivoire, Sénégal, Madagascar, Cuba, Japon, Chine, Venezuela, Ukraine, Russie, France, etc. Chacun et chacune veut comprendre comment se rédige Wikipédia, mais leurs connaissances technologiques sont très variables. Défi intéressant, mais épuisant.

25, 32, 32 et 47 sont nos âges respectifs. Saguenay, Paris, Québec et Sherbrooke sont les villes où nous demeurons. ♀, ♂, ♂ et ♂, c'est-à-dire une belle et trois bêtes. Letartean et moi sommes accros. Doublement. J'ai parié un BA qu'il a tort sur un film de la série James Bond, que nous avons vu et revu au complet. Je vais gagner et Wikipédia y gagnera un BA. J'ai gagné : Frontière entre le Québec et Terre-Neuve-et-Labrador sera proposé.

Portraits succincts de visiteurs :

  • on crée un compte pour le premier visiteur du kiosque, un journaliste camerounais. Dans les jours suivants, il crée 4 articles sur Wikinews ;
  • une Marocaine qui n'a jamais utilisé Wikipédia ;
  • un Français qui veut des informations sur le comité éditorial ;
  • un salarié de la DGLF qui est enthousiasmé par la Wikipédia ;
  • une dame à l'emploi de l'OQLF qui m'assure qu'un salarié surveille régulièrement les articles « stratégiques » ;
  • un journaliste nigérien, salarié de l'agence qui s'occupe de publier le journal national, qui ne connaît pas Wikipédia.
  • un Camerounais, surpris que les Québécois ne semblent pas connaitre le macabo, crée l'article en français. Ce dernier existait préalablement dans 9 autres langues.
  • une Hongroise qui créé son compte dans la Wikipédia en français, mais qui préfère contribuer dans la Wikipédia en hongrois : elle a créé hu:Le Monde diplomatique, sujet déjà présent dans 20 autres Wikipédias.

De mes échanges avec les visiteurs, j'en conclus que la Wikipédia en français jouit d'un immense capital de sympathie.

Le soir, nous nous réunissons pour discuter des projets passés, en cours et futurs. Il est tellement agréable de pouvoir échanger avec des internautes du Web 3.0. J'ai appris que la Wikipédia en français est peut-être trop rigoureuse avec les copyvios. Elle pourrait réagir seulement sur plainte, mais préfère les rechercher de façon préventive. J'ai appris l'existence d'un serveur web matériel auquel il suffit de brancher une clé USB proprement formatée pour créer un site web accessible par Wi-Fi. La clé peut contenir une version figée de la Wikipédia en français. Le gouvernement du Québec, s'inspirant de dataBC du gouvernement de la Colombie-Britannique, a commencé à mettre en ligne des informations sous une licence ouverte : Données ouvertes. Le projet en est à ses débuts et présente des incohérences. Selon notre interlocuteur, l'obstacle le plus important à surmonter est de convaincre les ministères de l'intérêt d'agir ainsi (par exemple plusieurs croient que ces données ont une valeur commerciale que le gouvernement devrait monnayer). Le vendredi 6 juillet, Letartean et deux autres participants sont invités à l'émission radiophonique Bandeapart.fm de Radio-Canada pour présenter leurs perceptions du FMLF. Vous pouvez entendre les commentaires d'Antoine Letarte à partir de min 5 s jusqu'à 26 min (dans l'image, il est au centre).

Dans les coulisses de la Wikimedia modifier

Ce qui suit parle essentiellement de technique.
  • Le Board of Trustees (BoT) de la WMF accepte dorénavant que deux personnes non élues participent à ses débats. Ces personnes devront détenir des compétences qui serviront à enrichir les débats du BoT. [15]
  • À la fin de juillet 2012, il y aura une deuxième tentative d'activer HTML5 dans le moteur de MediaWiki. En février 2011, la première tentative avait très rapidement échoué. Les outils logiciels étaient le plus souvent incapables de lire les données publiées en HTML5, mais en 18 mois la situation a beaucoup changé. Si HTML5 est activé, plusieurs balises obsolètes ne seront plus reconnues, notamment <font> et <center>. En revanche, HTML5 offre <video> et les canvas. [16]
  • Le 28 juin, la WMF a demandé à la communauté si elle devait joindre ses forces à celle de l'Internet Defense League pour participer à des efforts de lobby contre les lois américaines qui restreindraient les libertés offertes par Internet. La procédure s'est terminée le 3 juillet et la réponse est « non ». [17]

Données et métadonnées modifier

Note : J'ai traduit/résumé cet article au mieux de mes connaissances, mais ce n'est pas un domaine où je comprends facilement le jargon utilisé. Je vous remercie de votre indulgence pour mes erreurs.

 
L'Oceanogràfic, un « complexe d'environ 100 000 m2 situé à Valence en Espagne où sont représentés les différents habitats marins. »

Avec la mise en place imminente de la première phase de Wikidata, le responsable de la création d'archives numériques pour le compte de la bibliothèque Bodléienne, a rédigé un op-ed sur les données et les métadonnées. [18]

Selon lui, les données acquièrent le plus souvent de la signification dans un contexte, lequel existe à l'intérieur d'une métadonnée. C'est vrai pour les flux de données numériques, mais aussi pour les textes et les images. Par exemple, savoir où et à quel moment est écrit un texte sont souvent essentiels pour en comprendre le sens. Il affirme que les données et les métadonnées sont des facettes complémentaires d'un plus grand tout. Il n'existe pas un seul standard pour représenter les métadonnées, il y en a une multitude. Il faut donc accepter que plusieurs puissent co-exister en parallèle dans un même environnement informatique. Il explique qu'un système peut représenter les données bibliographiques, un autre les informations relatives au copyright et un troisième les données sur les méthodes de conservation.

Il met en garde les décideurs de Wikidata d'imposer un seul standard. Il serait trop tôt pour savoir si un système est supérieur à un autre, car la représentation des données est un sujet complexe. Par exemple, ils ignorent quelles sont les informations qui seront utiles à l'usage. Par ailleurs, il demande de renoncer à vouloir structurer de façon hiérarchique les données, il serait mieux qu'elles soient structurées par un quasi-graphe, façon dont les personnes structurent les connaissances. Stocker les informations dans des bases de données relationnelle est tentant, mais leurs avantages à long terme ne sont pas clairement établis pour ce type de données. Si les données sont accessibles par un adressage web, elles seront probablement plus faciles à parcourir et à indexer par un moteur de recherche. Dans les sciences sociales, il est souvent avantageux de pouvoir établir des relations entre différents objets. Si les informations sont structurées de façon hiérarchique, il sera beaucoup plus difficile d'établir des multitudes de relations. Il écrit qu'il est désirable d'utiliser le Resource Description Framework (RDF) et le Web des données pour structurer les relations entre les données. Dans la pratique, il est cependant inutile d'exprimer toutes les métadonnées par un tel système, car ce n'est pas efficace en termes de performance et de facilité d'utilisation.

En ce qui concerne les données de Wikidata, il faut aussi offrir un moyen de qualifier une relation pour connaître la provenance de l'information : qui en est l'auteur, quand l'a-t-il écrit, en s'appuyant sur quoi et en quelles circonstances. En qualifiant cette relation, il est possible (1) d'exprimer les désaccords entre les experts, (2) d'exprimer la qualité de la source (incomplète ou en partie floue si numérisée), (3) de situer temporellement l'information (par exemple, tel auteur antique a écrit telle information à telle époque) et (4) de documenter les omissions ([NdT : par exemple, une partie des informations sont inaccessibles pour des raisons d'État]).

Pour toutes les raisons exposées, en ce qui concerne l'usage d'outils logiciels pour l'exploration de données, l'auteur de l'article affirme que nous devons cesser de croire qu'il existe dans la pratique une seule vérité factuelle. Beaucoup d'informations qui nous parviennent sont le résultat d'inférences qui s'appuient sur un corpus d'informations qui est limité et imparfait, ce qui est particulièrement vrai dans le domaine des sciences sociales. Nous devons donc mettre en oeuvre un système qui documente cette imperfection, y compris les omissions, les incertitudes et les différences d'opinion.

« Les armes nucléaires sont les seules [...] gardiennes de la paix que le monde ait jamais connues[trad 4] »[note 1],[1]
Rédigé/traduit par un collectif de contributeurs
Citations originales
  1. (en) « [W]here there is a clear conflict of interest created by the relationship between the public relations professional and the subject of the Wikipedia entry, such as a client or employer, they should not directly edit it. »
  2. (en) « conflict of interest guideline »
  3. (en) « Collecting penises is like collecting anything. You can never stop, you can never catch up, you can always get a new one, a better one. »
  4. (en) « Nuclear weapons are the only peacekeeping weapons that the world has ever known. »
Notes
  1. Je n'ai pu m'empêcher de citer cette affirmation qui remet en question la stratégie américaine de réduction des stocks d'armes nucléaires. Je crois qu'elle emprunte pour beaucoup au modèle économique dominant qui avance que la compétition est gage de progrès.
Références
  1. Kenneth Waltz, Nukes Are "The Only Peacekeeping Weapons the World Has Ever Known," Says Waltz, The Diplomat, 6 juillet 2012 (article rédigé suite à la parution d'un article de Kenneth Waltz dans Foreign Affairs : Why Iran Should Get the Bomb)