PhotoADN

Informations
Type	Perceptual hashing (en)
Site web	www.microsoft.com/en-us/photodna

PhotoADN, ou photoDNA en anglais, est un logiciel propriétaire d'identification d'images et de filtrage de contenu^[1] largement utilisée par les fournisseurs de services en ligne (en)^[2]^,^[3].

Histoire modifier

PhotoDNA est développé par Microsoft Research et Hany Farid (en), professeur au Dartmouth College, à partir de 2009. À partir d'une base de données d'images et de fichiers vidéo connus, il crée des hachages uniques pour représenter chaque image, qui peuvent ensuite être utilisés pour identifier d'autres instances de ces images^[4].

La méthode de hachage repose initialement sur la conversion des images dans un format noir et blanc, en les divisant en carrés et en quantifiant l'ombrage des carrés^[5], elle n'utilise pas la technologie de reconnaissance faciale, ni ne pouvait identifier une personne ou un objet dans l'image^{[réf. nécessaire]}. La méthode cherche à résister aux altérations de l'image, y compris le redimensionnement et les altérations mineures de la couleur^[4]. Depuis 2015, des méthodes similaires sont utilisées pour les images vidéo (en) individuelles dans les fichiers vidéo^[6]^,^[7].

Microsoft a fait un don^{[Pas dans la source]} la technologie PhotoDNA au projet VIC, géré et soutenu par le Centre international pour les enfants disparus et exploités (ICMEC) et utilisé dans le cadre d'opérations de criminalistique numérique (en)^[8]^,^[9] en stockant des "empreintes digitales" qui peuvent être utilisées pour identifier de manière unique une photo individuelle^[9]^,^[10]. La base de données comprend des hachages pour des millions d'éléments^[11].

En décembre 2014, Microsoft a mis gratuitement PhotoDNA à la disposition des organisations qualifiées dans un modèle de logiciel en tant que service via Microsoft Azure^[12].

Dans les années 2010 et 2020, PhotoADN est mis en avant dans le cadre de propositions politiques relatives à la modération de contenus et à la censure d'Internet^[13], notamment lors des auditions du Sénat américain (2019 sur la "responsabilité numérique"^[2], 2022 sur l'EARN IT Act ^[14]) et diverses propositions de la Commission européenne baptisées « filtres de téléchargement » par la société civile^[15]^,^[16] comme les codes dits volontaires (en 2016^[17] sur le discours de haine^[18] après les attentats de 2015 contre Charlie Hebdo, 2018^[19] et 2022 sur la désinformation^[20]), la législation sur le droit d'auteur (principalement la directive sur le droit d'auteur dans le marché unique numérique de 2019, débattue entre 2014^[21] et 2021), la règlementation européen contre la diffusion du terrorisme en ligne^[22] et la réglementation sur les écoutes téléphoniques sur Internet (en) (2021 "chat control")^[23].

En 2016, Hany Farid propose d'étendre l'utilisation de la technologie aux contenus liés au terrorisme^[24]. En décembre 2016, Facebook, Twitter, Google et Microsoft annoncent leur intention d'utiliser PhotoADN pour supprimer les contenus extrémistes tels que les vidéos de recrutement terroriste ou les images terroristes violentes^[25]. En 2018, Facebook déclare que PhotoADN est utilisé pour supprimer automatiquement les vidéos d'Al-Qaïda^[13].

En 2019, des GAFAM telles que Microsoft, Facebook et Google annoncent publiquement que depuis 2017, elles exploitaient le Global Internet Forum to Counter Terrorism (en) en tant que base de données partagée de contenu à censurer automatiquement^[2]. À partir de 2021, on pensait qu'Apple utilisait NeuralHash à des fins similaires^[26].

En 2022, le New York Times couvre l'histoire de deux pères dont les comptes Google ont été fermés après que les photos qu'ils ont prises de leur enfant à des fins médicales ont été automatiquement téléchargées sur les serveurs de Google^[27]. L'article compare PhotoADN, qui nécessite une base de données de hachages connus, avec la technologie basée sur l'IA de Google, qui peut reconnaître des images d'exploitation inédites^[28]^,^[29].

Usage modifier

Microsoft utilise à l'origine PhotoADN sur ses propres services, notamment Microsoft Bing et Micrsoft OneDrive^[30]. À partir de 2022, PhotoADN est largement utilisé par les fournisseurs de services en ligne pour leurs travaux de modération de contenu^[10]^,^[31]^,^[32] y compris Gmail de Google, Twitter^[33], Facebook^[34], Adobe Systems^[35], Reddit^[36], Discord^[37].

La UK Internet Watch Foundation, qui a compilé une base de données de référence des signatures PhotoADN, aurait eu plus de 300 000 hachages de matériel connu d'exploitation sexuelle d'enfants^{[réf. nécessaire]}. Une autre source de la base de données était le National Center for Missing & Exploited Children^[38]^,^[39].

PhotoADN est largement utilisé pour supprimer du contenu^[2], désactiver des comptes et signaler des personnes^[7]. En 2021, Google aurait à lui seul déposé 600 000 signalements pédopornographique et aurait désactivé les comptes de plus de 270 000 utilisateurs^[3].

Références modifier

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « PhotoDNA » (voir la liste des auteurs).

↑ (en) Matthijs Douze, Giorgos Tolias, Ed Pizzi, Zoë Papakipos, Lowik Chanussot, Filip Radenovic, Tomas Jenicek, Maxim Maximov, Laura Leal-Taixé, Ismail Elezi, Ondřej Chum et Cristian Canton Ferrer, « The 2021 Image Similarity Dataset and Challenge », 21 février 2022 (arXiv 2106.09672) : « ILes empreintes digitales d'image, telles que PhotoDNA de Microsoft, sont utilisées dans l'ensemble de l'industrie pour identifier les images qui dépeignent l'exploitation et la maltraitance des enfants. »
↑ ^{a b c et d} « The Rise of Content Cartels », knightcolumbia.org, 11 février 2020 (consulté le 21 août 2022)
↑ ^{a et b} (en-US) Kashmir Hill, « A Dad Took Photos of His Naked Toddler for the Doctor. Google Flagged Him as a Criminal. », The New York Times,‎ 21 août 2022 (ISSN 0362-4331, lire en ligne, consulté le 11 janvier 2023)
↑ ^{a et b} « New Technology Fights Child Porn by Tracking Its "PhotoDNA" », Microsoft.com, Microsoft Corporation, 15 décembre 2009 (consulté le 9 septembre 2016)
↑ « Photo DNA: Step by step » [archive du 21 septembre 2013], Microsoft (consulté le 11 février 2014)
↑ « How PhotoDNA for Video is being used to fight online child exploitation », 12 septembre 2018
↑ ^{a et b} « How PhotoDNA for Video is being used to fight online child exploitation », news.microsoft.com, 12 septembre 2018
↑ William Jackson, « Improved image analysis tools speed exploited children cases », GCN, 27 août 2014
↑ ^{a et b} Liat Clark, « Child abuse-tracking tech donated to the world », Wired UK,‎ 30 avril 2014 (lire en ligne)
↑ ^{a et b} « Microsoft's response to the consultation on the European Commission Communication on the Rights of the Child (2011–2014) » [archive du 24 octobre 2017], European Commission
↑ Mark Ward, « Cloud-based archive tool to help catch child abusers », BBC News, 23 mars 2014
↑ « PhotoDNA Cloud Service », Microsoft.com, Microsoft Corporation (consulté le 19 février 2015)
↑ ^{a et b} (en) Richard Allan, « Hearing at 11:14 », 18 juin 2018 in « The EU's horizontal regulatory framework for illegal content removal in the DSM »
↑ Thu, Feb 10th 2022 03:30pm-Berin Szoka et Ari Cohn, « The Top Ten Mistakes Senators Made During Today's EARN IT Markup », Techdirt, 10 février 2022 (consulté le 21 août 2022)
↑ Christoph Schmon, « The EU Commission's Refusal to Let Go of Filters », Electronic Frontier Foundation, 3 juin 2021 (consulté le 21 août 2022)
↑ « Upload filters: a danger to free internet content? », IONOS Digitalguide (consulté le 21 août 2022)
↑ « Fighting illegal online hate speech: first assessment of the new code of conduct », ec.europa.eu, 6 décembre 2016 (consulté le 21 août 2022)
↑ « The EU Code of conduct on countering illegal hate speech online | European Commission », Ec.europa.eu (consulté le 29 août 2022)
↑ « Code of Practice on Disinformation | Shaping Europe's digital future »
↑ « The 2022 Code of Practice on Disinformation | Shaping Europe's digital future »
↑ « Procedure File: 2014/2256(INI) | Legislative Observatory | European Parliament »
↑ « Terrorist content online »
↑ Markus Reuter, Tomas Rudl, Franziska Rau et Holly Hildebr, « Why chat control is so dangerous », European Digital Rights (EDRi) (consulté le 21 août 2022)
↑ Kaveh Waddell, « A Tool to Delete Beheading Videos Before They Even Appear Online », The Atlantic,‎ 22 juin 2016 (lire en ligne, consulté le 10 septembre 2016)
↑ (en) « Partnering to Help Curb Spread of Online Terrorist Content | Facebook Newsroom » (consulté le 6 décembre 2016)
↑ (en) Auteur inconnu, « Bugs in our Pockets: The Risks of Client-Side Scanning », 14 octobre 2021.
erreur modèle {{Lien arXiv}} : renseignez un paramètre « |eprint »
↑ « A Dad Took Photos of His Naked Toddler for the Doctor. Google Flagged Him as a Criminal. », The New York Times,‎ 21 août 2022 (lire en ligne, consulté le 21 août 2022)
↑ « Google Flagged Parents' Photos of Sick Children as Sexual Abuse », Gizmodo, 22 août 2022 (consulté le 28 août 2022) : « According to Google, those incident reports come from multiple sources, not limited to the automated PhotoDNA tool. »
↑ Emma Roth, « Google AI flagged parents' accounts for potential abuse over nude photos of their sick kids », The Verge, 21 août 2022 (consulté le 28 août 2022) : « Google has used hash matching with Microsoft’s PhotoDNA for scanning uploaded images to detect matches with known CSAM. [...] In 2018, Google announced the launch of its Content Safety API AI toolkit that can “proactively identify never-before-seen CSAM imagery so it can be reviewed and, if confirmed as CSAM, removed and reported as quickly as possible.” It uses the tool for its own services and, along with a video-targeting CSAI Match hash matching solution developed by YouTube engineers, offers it for use by others as well. »
↑ « Unfortunate Truths about Child Pornography and the Internet [Feature] », 7 décembre 2012
↑ Reinhard Eher, Leam A. Craig, Michael H. Miner et Friedemann Pfäfflin, International Perspectives on the Assessment and Treatment of Sexual Offenders: Theory, Practice and Research, John Wiley & Sons, 2011 (ISBN 978-1119996200, lire en ligne), p. 514
↑ Marcia Lattanzi-Licht et Kenneth Doka, Living with Grief: Coping with Public Tragedy, Routledge, 2004 (ISBN 1135941513, lire en ligne), p. 317
↑ Charles Arthur, « Twitter to introduce PhotoDNA system to block child abuse images », The Guardian,‎ 22 juillet 2013 (lire en ligne, consulté le 22 juillet 2013)
↑ Catharine Smith, « Facebook Adopts Microsoft PhotoDNA To Remove Child Pornography », Huffington Post,‎ 2 mai 2011 (lire en ligne, consulté le 22 juillet 2013)
↑ (en) « Adobe & PhotoDNA », www.adobe.com (consulté le 27 août 2021)
↑ « Reddit use PhotoDNA to prevent child pornography », 19 mars 2020
↑ (en) « Discord Transparency Report: July — Dec 2020 », Discord Blog, 2 avril 2021 (consulté le 8 mai 2022)
↑ « Microsoft tip led police to arrest man over child abuse images », The Guardian, 7 août 2014
↑ (en) Anthony Salcito, « Microsoft donates PhotoDNA technology to make the Internet safer for kids », 17 décembre 2009 (consulté le 22 juillet 2013)

Voir aussi modifier

Articles connexes modifier

Lien externe modifier

(en) Site officiel

[1] (en) Matthijs Douze, Giorgos Tolias, Ed Pizzi, Zoë Papakipos, Lowik Chanussot, Filip Radenovic, Tomas Jenicek, Maxim Maximov, Laura Leal-Taixé, Ismail Elezi, Ondřej Chum et Cristian Canton Ferrer, « The 2021 Image Similarity Dataset and Challenge », 21 février 2022 (arXiv 2106.09672) : « ILes empreintes digitales d'image, telles que PhotoDNA de Microsoft, sont utilisées dans l'ensemble de l'industrie pour identifier les images qui dépeignent l'exploitation et la maltraitance des enfants. »

[Knight2020-2] {a b c et d} « The Rise of Content Cartels », knightcolumbia.org, 11 février 2020 (consulté le 21 août 2022)

[NYT2022-3] {a et b} (en-US) Kashmir Hill, « A Dad Took Photos of His Naked Toddler for the Doctor. Google Flagged Him as a Criminal. », The New York Times,‎ 21 août 2022 (ISSN 0362-4331, lire en ligne, consulté le 11 janvier 2023)

[DNAGlance-4] {a et b} « New Technology Fights Child Porn by Tracking Its "PhotoDNA" », Microsoft.com, Microsoft Corporation, 15 décembre 2009 (consulté le 9 septembre 2016)

[5] « Photo DNA: Step by step » [archive du 21 septembre 2013], Microsoft (consulté le 11 février 2014)

[6] « How PhotoDNA for Video is being used to fight online child exploitation », 12 septembre 2018

[news.microsoft.com-7] {a et b} « How PhotoDNA for Video is being used to fight online child exploitation », news.microsoft.com, 12 septembre 2018

[8] William Jackson, « Improved image analysis tools speed exploited children cases », GCN, 27 août 2014

[wiredabuse-9] {a et b} Liat Clark, « Child abuse-tracking tech donated to the world », Wired UK,‎ 30 avril 2014 (lire en ligne)

[EC-10] {a et b} « Microsoft's response to the consultation on the European Commission Communication on the Rights of the Child (2011–2014) » [archive du 24 octobre 2017], European Commission

[bbccloud-11] Mark Ward, « Cloud-based archive tool to help catch child abusers », BBC News, 23 mars 2014

[PDNACS-12] « PhotoDNA Cloud Service », Microsoft.com, Microsoft Corporation (consulté le 19 février 2015)

[Allan2018-13] {a et b} (en) Richard Allan, « Hearing at 11:14 », 18 juin 2018 in « The EU's horizontal regulatory framework for illegal content removal in the DSM »

[14] Thu, Feb 10th 2022 03:30pm-Berin Szoka et Ari Cohn, « The Top Ten Mistakes Senators Made During Today's EARN IT Markup », Techdirt, 10 février 2022 (consulté le 21 août 2022)

[15] Christoph Schmon, « The EU Commission's Refusal to Let Go of Filters », Electronic Frontier Foundation, 3 juin 2021 (consulté le 21 août 2022)

[16] « Upload filters: a danger to free internet content? », IONOS Digitalguide (consulté le 21 août 2022)

[17] « Fighting illegal online hate speech: first assessment of the new code of conduct », ec.europa.eu, 6 décembre 2016 (consulté le 21 août 2022)

[18] « The EU Code of conduct on countering illegal hate speech online | European Commission », Ec.europa.eu (consulté le 29 août 2022)

[19] « Code of Practice on Disinformation | Shaping Europe's digital future »

[20] « The 2022 Code of Practice on Disinformation | Shaping Europe's digital future »

[21] « Procedure File: 2014/2256(INI) | Legislative Observatory | European Parliament »

[22] « Terrorist content online »

[23] Markus Reuter, Tomas Rudl, Franziska Rau et Holly Hildebr, « Why chat control is so dangerous », European Digital Rights (EDRi) (consulté le 21 août 2022)

[24] Kaveh Waddell, « A Tool to Delete Beheading Videos Before They Even Appear Online », The Atlantic,‎ 22 juin 2016 (lire en ligne, consulté le 10 septembre 2016)

[25] (en) « Partnering to Help Curb Spread of Online Terrorist Content | Facebook Newsroom » (consulté le 6 décembre 2016)

[26] (en) Auteur inconnu, « Bugs in our Pockets: The Risks of Client-Side Scanning », 14 octobre 2021.
erreur modèle {{Lien arXiv}} : renseignez un paramètre « |eprint »

[27] « A Dad Took Photos of His Naked Toddler for the Doctor. Google Flagged Him as a Criminal. », The New York Times,‎ 21 août 2022 (lire en ligne, consulté le 21 août 2022)

[28] « Google Flagged Parents' Photos of Sick Children as Sexual Abuse », Gizmodo, 22 août 2022 (consulté le 28 août 2022) : « According to Google, those incident reports come from multiple sources, not limited to the automated PhotoDNA tool. »

[29] Emma Roth, « Google AI flagged parents' accounts for potential abuse over nude photos of their sick kids », The Verge, 21 août 2022 (consulté le 28 août 2022) : « Google has used hash matching with Microsoft’s PhotoDNA for scanning uploaded images to detect matches with known CSAM. [...] In 2018, Google announced the launch of its Content Safety API AI toolkit that can “proactively identify never-before-seen CSAM imagery so it can be reviewed and, if confirmed as CSAM, removed and reported as quickly as possible.” It uses the tool for its own services and, along with a video-targeting CSAI Match hash matching solution developed by YouTube engineers, offers it for use by others as well. »

[30] « Unfortunate Truths about Child Pornography and the Internet [Feature] », 7 décembre 2012

[perspectives-31] Reinhard Eher, Leam A. Craig, Michael H. Miner et Friedemann Pfäfflin, International Perspectives on the Assessment and Treatment of Sexual Offenders: Theory, Practice and Research, John Wiley & Sons, 2011 (ISBN 978-1119996200, lire en ligne), p. 514

[32] Marcia Lattanzi-Licht et Kenneth Doka, Living with Grief: Coping with Public Tragedy, Routledge, 2004 (ISBN 1135941513, lire en ligne), p. 317

[33] Charles Arthur, « Twitter to introduce PhotoDNA system to block child abuse images », The Guardian,‎ 22 juillet 2013 (lire en ligne, consulté le 22 juillet 2013)

[34] Catharine Smith, « Facebook Adopts Microsoft PhotoDNA To Remove Child Pornography », Huffington Post,‎ 2 mai 2011 (lire en ligne, consulté le 22 juillet 2013)

[35] (en) « Adobe & PhotoDNA », www.adobe.com (consulté le 27 août 2021)

[36] « Reddit use PhotoDNA to prevent child pornography », 19 mars 2020

[37] (en) « Discord Transparency Report: July — Dec 2020 », Discord Blog, 2 avril 2021 (consulté le 8 mai 2022)

[The_Guardian-38] « Microsoft tip led police to arrest man over child abuse images », The Guardian, 7 août 2014

[39] (en) Anthony Salcito, « Microsoft donates PhotoDNA technology to make the Internet safer for kids », 17 décembre 2009 (consulté le 22 juillet 2013)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]