Journalisme de données

type de journalisme

Le journalisme de données (data journalism en anglais), ou journalisme de bases de données (database journalism), est un mouvement visant à renouveler le journalisme par l'exploitation de données statistiques et la mise à la disposition de celles-ci au public[1].

Il est également lié à la libre disponibilité des données : de plus en plus de données statistiques sont diffusées par les institutions et les gouvernements, et un journaliste d'investigation sachant les analyser peut mettre en lumière des faits importants comme cela a été le cas dans le scandale des notes de frais des parlementaires britanniques[2].

La question de la visualisation de données est également un aspect important de ce type de journalisme.

DéfinitionModifier

Pour Adrian Holovaty (en), l'un des chefs de file du mouvement, le travail du journaliste traditionnel consiste essentiellement à collecter des données. Alors que ce dernier dissémine les données (les informations) qu'il a obtenues dans un texte rédigé, le journaliste de données les collecte sous forme structurée afin de pouvoir ensuite les réutiliser plus facilement à des fins de comparaison[3].

Simon Rogers, auparavant responsable du journalisme des données au Guardian, fait une différence entre le journalisme de données et l'infographie. Pour lui, l'infographie consiste uniquement à présenter des chiffres alors que le journalisme de données consiste à les présenter mais aussi à les analyser et les expliquer[4].

À l'inverse du journaliste classique qui protège ses sources, le journaliste de données donne accès aux données au plus grand nombre. Simon Rogers compare l'esprit du journalisme de données à l'esprit punk qui dans les années 1970 encourageait chacun à prendre un instrument et à en jouer[5].

Sylvain Parasie propose l'expression « journalisme hacker » (en anglais hacker journalism), censé rapprocher les passionnés d'informatique (hackers, litt. « pondeurs de code », « bidouilleurs ») et les journalistes (hacks, litt. « journaleux », « plumitifs ») pour faire évoluer le journalisme[3].

HistoireModifier

Le journalisme de données est aussi ancien que l'exploitation des données.

Dès 1821, on trouve dans le Manchester Guardian un tableau de données sur les écoles de Manchester et Salford contenant des informations sur le nombre d'élèves dans chaque école et les dépenses annuelles de chacune des écoles[6],[7],[8].

 
La carte du choléra à Londres en 1854, dressée par John Snow.

Pour le journaliste du Guardian, Simon Rogers, la carte du cholera proposée par John Snow en 1854 est un exemple de journalisme de données. La carte, qui montre la concentration de choléra autour des pompes à eau, a permis de comprendre l'origine de l'épidémie[9].

 
Diagramme des causes de mortalité au sein de l'armée en Orient par Florence Nightingale.

En 1858, Florence Nightingale publie des données sur la mortalité des soldats dans l'armée britannique. Pour le journaliste du Guardian Simon Rogers, cela constitue un des premiers exemples de journalisme de données[6].

Dans les années 1950 se développe le computer-assisted reporting (en) (le journalisme assisté par ordinateur). Par exemple, la chaîne de télévision américaine CBS collecte des données pour pouvoir prédire les résultats des élections américaines[8].

Dans les années 1970, Philip Meyer propose la notion de « journalisme de précision » qui vise à utiliser les méthodes des sciences sociales et comportementales dans le journalisme[8].

Le journaliste américain Bill Dedman (en) reçoit le prix Pulitzer en 1989 pour une étude statistique montrant que les noirs obtiennent moins de crédits bancaires que les blancs à Atlanta[10].

À partir des années 2000, le développement de l'informatique permet la démocratisation de l'accès aux bases de données et le développement d'un véritable « journalisme de données ». Plusieurs médias anglo-saxons ont investi ce domaine[3].

En , Adrian Holovaty publie un texte manifeste intitulé A fundamental way newspaper sites need to change, dans lequel il défend l'idée que les journalistes devraient publier des données sous forme structurée de manière qu'elles puissent faire l'objet d'une analyse statistique[8],[11].

À partir de , le journaliste Simon Rogers anime pour The Guardian le « datablog » qui coordonne les travaux relevant du journalisme de données[12].

En , se tient la première conférence consacrée au journalisme de données à Amsterdam dans les locaux du European Journalism Centre (en). La conférence rassemble près de 60 journalistes venant du monde entier[8],[13].

En , lors du festival annuel Mozilla, plusieurs acteurs du système se réunissent sous l'égide du European Journalism Centre (en) et de la Open Knowledge Foundation pour rédiger un manuel de journalisme de données, publié en 2012 sous le titre Data Journalism Handbook[14],[15]. Ce manuel est traduit en français en 2013 par la société Journalism++(en) et diffusé en licence Creative Commons[16],[17].

En 2012, deux journalistes du Seattle Times, Michael J. Berens et Ken Armstrong, sont récompensés du prix Pulitzer du journalisme d’investigation pour un travail relevant du journalisme de données montrant qu'un grand nombre de décès dans l'État de Washington était lié à une surdose de méthadone, anti-douleur prescrit aux bénéficiaires de Medicaid pour des raisons d'économie[18].

En FranceModifier

En 2010, le pure player indépendant OWNI popularise cette pratique. Premier partenaire français de WikiLeaks, OWNI publie les carnets de guerre de l'armée américaine en Irak[19],[20]. En 2011, Pierre Romera et Nicolas Kayser-Bril, deux anciens d'OWNI[21], lancent Journalism++(en), une société de services spécialisée dans le journalisme de données[22]. C'est à elle que l'on doit notamment les Migrants Files, une enquête internationale visant à évaluer le coût humain et financier des politiques anti-migratoires en Europe[23],[24], récompensée de plusieurs prix comme le GEN Data Journalism Award en 2014[25] et l’European Press Prize en 2015[26].

L'émission DataGueule, ouverte en 2014 par Julien Goetz, est une Web-série hebdomadaire diffusée sur France 4 et sur YouTube et Dailymotion. Le principe de l'émission est de « déconstruire des mécanismes, avec de l'humour et si possible un prisme historique (...) des sujets où l'on se rend compte que ça ne tourne pas rond. Même s'il faut les décortiquer pour comprendre exactement ce qui ne tourne pas rond »[27].

En 2013, le magazine Paris Match lance Data Match, une page spécifique intégrée à sa rubrique "Match de la semaine". En 2014, le journal Le Monde lance la rubrique Les Décodeurs, dédiée au fact-checking[28]. En 2015, le journal Libération lance la rubrique Six Plus dédiée au journalisme de données[29] qui a été renommée Libé Labo début 2019[30].

En 2019, alors que la visualisation de données est devenu une pratique usuelle dans le journalisme, un article propose une expérience de représentation sonore de données à partir des chiffres de la cote de popularité du président Macron[31].

DistinctionsModifier

Depuis 2012, le Global Editor Networks (en) organise les Data Journalism Awards[32] (oscars du journalisme de données).

ExemplesModifier

Aux États-Unis, The Texas Tribune (en) met à la disposition de ses lecteurs une base de données contenant les salaires de 667 000 employés du secteur public. L'article contient un lien vers les données brutes mais aussi des visualisations avec un histogramme de la distribution des salaires et des tableaux montrant le salaire moyen, médian, maximum et minimum en fonction de la nature de l'emploi et de l'employeur[33],[34].

En France, pendant la campagne électorale pour l'élection présidentielle de 2012, la chaîne de télévision iTélé et le site web d'information OWNI ont mis en place un outil intitulé le « véritomètre » permettant de confronter les chiffres avancés par les différents candidats pendant la campagne avec la réalité[35].

Le Wall Street Journal a mis en place, à la disposition du public, une base de données sur les statistiques de la criminalité aux États-Unis entre 2000 et 2010[36],[37].

En 2017, le Consortium international des journalistes d'investigation et ses partenaires dévoilent les résultats d'un an d'enquête dans le cadre des Paradise Papers. À la pointe des techniques du journalisme de données, ces révélations se basent sur une immense fuite de plus de 13,5 millions[38] de documents confidentiels notamment issus du cabinet d'avocats Appleby, détaillant des informations sur des sociétés offshore. Parmi eux se trouvent des multinationales et de nombreuses personnalités de la vie publique[39],[40],[41].

CritiquesModifier

Dans Le Monde diplomatique, Giulio Frigieri déplore que de nombreuses infographies privilégient l'aspect esthétique sur l'intelligibilité[42].

En 2014, plusieurs éditeurs de logiciels[43] commercialisent des robots rédigeant automatiquement des articles sur la base de grands volumes de données[44]. Dans les années à venir, ceci pourrait limiter le travail du journaliste de données à une activité de reformulation[45].

BibliographieModifier

  • (en) Paul Bradshaw, Scraping for Journalists, Leanpub, (présentation en ligne)
  • Sophian Fanen, « Le journalisme les doigts dans les données », Libération,‎ (lire en ligne)
  • (en) Jonathan Gray, Lucy Chambers et Liliana Bounegru, Data Journalism Handbook, O'Reilly Media, , 220 p. (ISBN 978-1-4493-3006-4, lire en ligne)
  • Jonathan Gray, Liliana Bounegru, Lucy Chambers, Nicolas Kayser-Bril, Collectif Eyrolles (trad. de l'anglais), Guide du datajournalisme : collecter, analyser et visualiser les données, Paris, Eyrolles, , 220 p. (ISBN 978-2-212-13685-2, lire en ligne)
  • (en) John Herbert, Journalism in the Digital Age : Theory and Practice for Broadcast, Print and On-Line Media, Focal Press, , 349 p. (ISBN 978-0-240-51589-2)
  • Alain Joannès, Data journalisme : Bases de données et visualisation de l'information, Paris, CFPJ Éditions, , 169 p. (ISBN 978-2-35307-037-4)
  • (en) David McCandless, Information is Beautiful : The Information Atlas, Collins,
  • (en) Philip Meyer, Precision Journalism, Indiana University Press, , 342 p. (ISBN 978-0-253-20163-8)
  • Sylvain Parasie et Éric Dagiral, « Portrait du journaliste en programmeur : L'émergence d'une figure du journaliste hacker », Les cahiers du journalisme, nos 22-23,‎ (lire en ligne)
  • (en) Simon Rogers, Facts are Sacred : The power of data, Guardian Books, , 92 p.
  • (en) David Weaver et Maxwell McCombs, « Journalism and Social Science: A New Relationship? », Public Opinion Quarterly, vol. 44, no 4,‎ (DOI 10.1086/268618, lire en ligne)
  • Liu Yikun et Dong Zhao (trad. de l'anglais), La datavisualisation au service de l'information, Paris, Pyramyd, , 240 p. (ISBN 978-2-35017-389-4)

FilmographieModifier

Notes et référencesModifier

  1. Nicolas Vanbremeersch, « Pour un journalisme de données », Slate.fr,‎ (lire en ligne)
  2. (en) Daily Telegraph.
  3. a b et c Sylvain Parasie, « Le journalisme « hacker » : Une nouvelle utopie pour la presse ? », La Vie des idées,‎ (lire en ligne)
  4. Sophian Fanen, « WikiLeaks a changé la vision des rédactions : Entretien avec Simon Rogers », Libération,‎ (lire en ligne)
  5. (en) Simon Rogers, « Anyone can do it. Data journalism is the new punk », The Guardian,‎ (lire en ligne)
  6. a et b (en) Simon Rogers, « Data journalism at the Guardian: what is it and how do we do it? », The Guardian,‎ (lire en ligne).
  7. (en) Simon Rogers, « The first Guardian data journalism: May 5, 1821 », The Guardian,‎ (lire en ligne).
  8. a b c d et e (en) Liliana Bounegru, « Data Journalism in Perspective », dans Data Journalism Handbook, (lire en ligne).
  9. (en) Simon Rogers, « John Snow's data journalism: the cholera map that changed the world », The Guardian,‎ (lire en ligne).
  10. Sophian Fanen, « Les Américains défricheurs du déchiffrage », Libération,‎ (lire en ligne).
  11. (en) Adrian Holovaty, « A fundamental way newspaper sites need to change », holovaty.com,‎ (lire en ligne).
  12. Pablo René-Worms, « Les coulisses du journalisme de données », Le Point,‎ (lire en ligne).
  13. (en) Nicolas Kayser-Bril, « Reasons to cheer from Amsterdam’s Data-Driven Journalism conference », journalism.co.uk,‎ (lire en ligne).
  14. (en) « Featured Guide: Data Journalism Handbook - A New Approach To Storytelling », Rising Voices,‎ (lire en ligne)
  15. (en) Federica Cocco, « Hacks and hackers gather to write the first Data Journalism Handbook », Data Driven Journalism,‎ (lire en ligne).
  16. « Guide du datajournalisme », sur www.eyrolles.com (consulté le 8 juillet 2018)
  17. « Guide du datajournalisme », sur jplusplus.github.io (consulté le 8 juillet 2018)
  18. « Le journalisme de données récompensé », Courrier international,‎ (lire en ligne).
  19. Le Point, magazine, « DOCUMENTS SECRETS - OWNI, la plate-forme française qui a aidé WikiLeaks », Le Point,‎ (lire en ligne, consulté le 8 juillet 2018)
  20. Antoine Mairé, « Comment les Français d’Owni ont aidé WikiLeaks à faire courir la fuite », Télérama,‎ (lire en ligne, consulté le 8 juillet 2018)
  21. « “Allô, c’est Julian Assange” », sur owni.fr (consulté le 8 juillet 2018)
  22. « Rencontre avec deux journalistes++ », Atelier des médias,‎ (lire en ligne, consulté le 8 juillet 2018)
  23. « Une carte recense les migrants et réfugiés morts sur les routes de l’Europe », sur Le Monde.fr (consulté le 8 juillet 2018)
  24. « La Tunisie en "bonne place" sur la carte des naufrages les plus meurtriers en Méditerranée », Al HuffPost Maghreb,‎ (lire en ligne, consulté le 8 juillet 2018)
  25. (en) Alison Langley, « European Union journalists cross borders for story collaboration », Columbia Journalism Review,‎ (lire en ligne, consulté le 8 juillet 2018)
  26. (en-US) « 2015 - European Press Prize », sur europeanpressprize.com, (consulté le 8 juillet 2018)
  27. « #DataGueule : les coulisses de l’émission », Nil Sanyas,‎ (lire en ligne, consulté le 8 juillet 2018)
  28. « Pour les Décodeurs du journal Le Monde, "l'objectif c'est de trouver la source" », RTBF Info,‎ (lire en ligne, consulté le 8 juillet 2018)
  29. « Le data-journalisme, un journalisme d'investigation qui s'ignore (INTERVIEW) – french.xinhuanet.com », sur french.xinhuanet.com (consulté le 8 juillet 2018)
  30. « Six Plus devient Libé Labo », sur Libération.fr, (consulté le 31 mars 2019)
  31. « Avez-vous déjà écouté la petite musique d'une cote de popularité ? », sur Libération.fr, (consulté le 16 mars 2019)
  32. « Data Journalism Awards » (consulté le 27 avril 2013)
  33. (en) « Government Employee Salaries », sur The Texas Tribune (consulté le 14 août 2012)
  34. (en) Simon Rogers, « Some Favorite Examples », dans Data Journalism Handbook, (lire en ligne)
  35. Nicolas Patte, « Le Véritomètre de la présidentielle », OWNI,‎ (lire en ligne)
  36. (en) « Murder in America », sur Wall Street Journal (consulté le 3 septembre 2012)
  37. « États-Unis : des chiffres et des meurtres », Les Inrockuptibles,‎ (lire en ligne)
  38. (en-US) Pierre Romera et Cécile S. Gallego, « How ICIJ deals with massive data leaks like the Panama Papers and Paradise Papers - ICIJ », ICIJ,‎ (lire en ligne, consulté le 8 juillet 2018)
  39. (de) « Das sind die Paradise Papers », Süddeutsche Zeitung,‎ (lire en ligne, consulté le 8 juillet 2018)
  40. (en-GB) Paradise Papers reporting team, « Tax haven secrets of ultra-rich exposed », BBC News,‎ (lire en ligne, consulté le 8 juillet 2018)
  41. (en) Mike McIntire, Sasha Chavkin et Martha M. Hamilton, « Commerce Secretary’s Offshore Ties to Putin ‘Cronies’ », The New York Times,‎ (lire en ligne, consulté le 8 juillet 2018)
  42. Giulio Frigieri (trad. Isabelle Boski), « L’infographie dans la production du savoir », Le Monde diplomatique,‎ (lire en ligne)
  43. tels que Melty, Narrative Science (en) et Automative Insights
  44. Après l'informatisation et la numérisation, la robotisation
  45. Chez « Associated Press », le robot repère et le journaliste analyse

Articles connexesModifier