Base de données MNIST

jeu de données de chiffres écrits à la main, très utilisé en apprentissage automatiqu
Base de données MNIST
Typologie
Sujet principal
Scripte (en), chiffres arabesVoir et modifier les données sur Wikidata
Diffusion
Site web

La base de données MNIST pour Modified ou Mixed National Institute of Standards and Technology, est une base de données de chiffres écrits à la main. C'est un jeu de données très utilisé en apprentissage automatique[1].

Un ensemble de 160 chiffres, comprenant 16 exemplaires de chaque chiffre alignés horizontalement.
Un exemple de chiffres de la base MNIST.

La reconnaissance de l'écriture manuscrite est un problème difficile, et un bon test pour les algorithmes d'apprentissage. La base MNIST est devenue un test standard[1]. Elle regroupe 60000 images d'apprentissage et 10000 images de test, issues d'une base de données antérieure, appelée simplement NIST[1]. Ce sont des images en noir et blanc, normalisées centrées de 28 pixels de côté[1].

Historique modifier

En 2018 un groupe de chercheurs annonce un taux d'erreur de 0,18%, améliorant le meilleur résultat précédent, en utilisant Random Multimodel Deep Learning (RMDL)[2].

Articles connexes modifier

Notes et références modifier

  1. a b c et d L. Deng, « The MNIST Database of Handwritten Digit Images for Machine Learning Research (Best of the Web) », IEEE Signal Processing Magazine, vol. 29, no 6,‎ , p. 141-142 (ISSN 1053-5888, DOI 10.1109/MSP.2012.2211477)
  2. Kamran Kowsari, Mojtaba Heidarysafa, Donald E. Brown, Kiana Jafari Meimandi et Laura E. Barnes, « RMDL: Random Multimodel Deep Learning for Classification », sur arXiv.org e-Print archive, (arXiv 1805.01890, consulté le )

Liens externes modifier