Kaggle

plateforme organisant des compétitions de data-sciences

Kaggle est une plateforme web interactive qui propose des compétitions d'apprentissage automatique en science des données. La plateforme fournit des jeux de données, des notebooks et des didacticiels gratuits dont les scientifiques de données ont besoin pour réaliser leurs projets d'apprentissage automatique[1].

Kaggle
logo de Kaggle

Création Voir et modifier les données sur Wikidata
Fondateurs Anthony Goldbloom (en)Voir et modifier les données sur Wikidata
Slogan "The Home of Data Science"
Siège social San Francisco
Drapeau des États-Unis États-Unis
Direction Anthony Goldbloom (en)Voir et modifier les données sur Wikidata
Président Max LevchinVoir et modifier les données sur Wikidata
Actionnaires Alphabet Inc.Voir et modifier les données sur Wikidata
Activité Science des donnéesVoir et modifier les données sur Wikidata
Société mère Google
(2017–présent)
Site web www.kaggle.comVoir et modifier les données sur Wikidata

Historique

modifier

Kaggle a été fondée en 2010 par Anthony Goldbloom (en)[2] et Google a acquis la société en 2017.

Types de compétitions

modifier
  • Les compétitions standard : elles sont adaptées pour les nouveaux utilisateurs avec des données facilement interprétables. Ils n’offrent pas de prix.
  • Les compétitions de recherche : elles impliquent des problèmes expérimentaux orientées recherche. Ils n’offrent pas de prix en raison de leur nature expérimentale.
  • Les compétitions de recrutement : elles sont organisés par des entreprises pour créer des modèles d’apprentissage automatique. Le prix est un entretien de recrutement dans l’entreprise qui organise la compétition.
  • Les compétitions de code : elles sont sponsorisées par des entreprises pour créer des modèles d’apprentissage automatique avec des problèmes de prédiction difficiles. Ils offrent de gros prix.[source secondaire souhaitée].

Fonctionnement des compétitions Kaggle

modifier
  • L’animateur de la compétition prépare les données ainsi qu'une description du problème. Kaggle propose un service de conseil, encadre le concours et anonymise les données…
  • Les participants expérimentent avec différentes techniques et s'affrontent pour produire le meilleur modèle. Dans la plupart des compétitions, les observations sont notées immédiatement (la note se base sur leur valeur prédictive par rapport à un fichier de solution cachée) qui donne un classement en direct.
  • À la fin de la compétition, l’animateur distribue le lot (argent, proposition de poste) en échange de "a worldwide, perpetual, irrevocable and royalty free license [...] to use the winning Entry", c'est-à-dire le droit d'utiliser gratuitement et sans limite de temps l'algorithme et le logiciel élaborés, de façon "non exclusive sauf indication contraire".

Aux côtés de ses concours publics, l'entreprise propose également des concours privés limités aux meilleurs participants de Kaggle et pour des groupes universitaires.

Notes et références

modifier
  1. DataScientest, « Kaggle : Tout ce qu'il faut savoir sur cette plateforme », sur DataScientest.com, (consulté le ).
  2. Mathilde Damgé, « Kaggle, le site qui transforme le « big data » en or », [[Le Monde|Le Monde]],‎ (lire en ligne).