LAION (acronyme de Large-scale Artificial Intelligence Open Network) est une organisation à but non lucratif allemande qui crée et diffuse des modèles et des jeux de données d'intelligence artificielle en open source, pour entrainer des modèles d'apprentissage automatique capables notamment de générer des images numériques photoréalistes à partir de demandes exprimées en langage naturel[1].

LAION
Logo de LAION.
Cadre
Type
ONG à but non lucratif
Domaines d'activité
Organisation
Fondateur
Christoph Schuhmann,
Jenia Jitsev,
Richard Vencu,
Robert Kaczmarczyk,
Theo Coombes,
Mehdi Cherti,
Aarush Katta,
Jan Ebert
Produit
Open Assistant (en)Voir et modifier les données sur Wikidata
Site web
(en) laion.aiVoir et modifier les données sur Wikidata

Historique modifier

LAION s'est surtout et d'abord fait connaître pour avoir publié un certain nombre de grands jeux de données d'images et de légendes extraits du Web, lesquels ont été utilisés pour entraîner plusieurs « modèles de génération d'images à partir de texte» très médiatisés, comme Stable Diffusion et Imagen[2],[3].

Le , LAION et ses contributeurs ont rendu public un assistant personnel de type chatbot, basé sur l'intelligence artificielle en open source : OpenAssistant[4].

Jeux de données d'images modifier

LAION a mis à disposition de tous plusieurs grands jeux de données de type « paires image-légende », qui ont été largement utilisés par les chercheurs en intelligence artificielle.

Ces données sont dérivées du Common Crawl, un jeu de données de pages web extraites du Web.

Les développeurs ont recherché et trouvé dans le Web (html) des images avec des balises <img>, et ils ont traité leurs attributs alt comme des légendes. Et ils ont utilisé CLIP pour identifier et éliminer les images dont le contenu ne semblait pas correspondre à leurs légendes[5].

LAION n'héberge pas le contenu des images en question, mais les jeux de données contiennent les URL pointant vers les images (images que les chercheurs intéressés doivent télécharger eux-mêmes)[6].

Histoire modifier

Le premier jeu de données de ce type, baptisé LAION-400M, a été publié en août 2021 ; il comprenait 400 millions de paires image-légende. Ces paires avaient été extraites d'un sous-ensemble aléatoire de pages web extraites par Common Crawl entre 2014 et 2021[5]. Il s'agissait d'une tentative de reproduire le processus utilisé par OpenAI pour collecter les 400 millions de paires image-légende qu'ils ont utilisées pour entraîner le modèle CLIP — la société avait choisi d'ouvrir le code et les poids du modèle, mais pas son jeu de données d'entraînement[7].

Imagen, un modèle de génération d'images à partir de texte, annoncé par Google Brain en 2022, a, lui, été entraîné sur LAION-400M en combinaison avec des jeux de données internes privés[8].

Un successeur de plus de 5 milliards de paires, LAION-5B, a été publié en mars 2022. Au moment de sa publication, il s'agissait du plus grand jeu de données disponible gratuitement de paires image-légende existant[9]. Sa création a été financée par Doodlebot.

Aspects juridiques modifier

En février 2023, LAION a été citée dans le procès intenté par Getty Images contre Stable Diffusion en tant que tierce partie[10].

En avril 2023, LAION a été directement poursuivie par un photographe allemand qui voulait faire retirer ses images du jeu de données d'entraînement[11].

Notes et références modifier

  1. (en) « about », sur laion.ai (consulté le ).
  2. (en-US) Benj Edwards, « Have AI image generators assimilated your art? New tool lets you check », sur Ars Technica, (consulté le ).
  3. (en) « The Future of AI Relies on a High School Teacher’s Free Database », sur Bloomberg.com, (consulté le ).
  4. « Open Assistant », sur open-assistant.io (consulté le ).
  5. a et b (en) Stefan Larson, Navtej Singh, Saarthak Maheshwari et Shanti Stewart, « Exploring Out-of-Distribution Generalization in Text Classifiers Trained on Tobacco-3482 and RVL-CDIP », ICDAR 2021 Workshops (conférence),‎ (DOI 10.48550/arXiv.2108.02684, lire en ligne, consulté le ).
  6. (en) Dataset Description and Download Instructions - LAION/LAION-400M: A Large-Scale Web Image Dataset with Textual Pairs for Text-to-Image Generation and Image Retrieval Tasks (github.com) ; https://github.com/LAION/LAION-400M#dataset-description-and-download-instructions ; consulté le 1er juin 2023.
  7. (en) Tom Simonite, « OpenAI Shares the Magic—and the Risks—of Its Visionary AI », Wired, (consulté le ).
  8. (en) Chitwan Saharia, William Chan, Saurabh Saxena et Lala Li, « Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding », Neural Information Processing Systems (conférence),‎ (DOI 10.48550/arXiv.2205.11487, lire en ligne, consulté le ).
  9. (en) Kyle Wiggers, « Stability AI launches Stable Diffusion, a text-to-image model trained on a new open source dataset », VentureBeat, (consulté le ).
  10. (en) James Vincent, « Getty Images sues Stability AI over text-to-image model that used its photos », The Verge, (consulté le ).
  11. (en) Kai Dambach, « German photographer sues LAION over image dataset », DW, (consulté le ).

Voir aussi modifier

Bibliographie modifier

Articles connexes modifier

Liens externes modifier