MLOps

ensemble de pratiques qui vise à déployer et maintenir des modèles d'apprentissage automatique en production de manière fiable et efficace

MLOps ou ML Ops est un ensemble de pratiques qui vise à déployer et maintenir des modèles d'apprentissage automatique en production de manière fiable et efficace[1]. Ce terme est composé du terme machine learning, ou « apprentissage automatique » et de la pratique de développement continu de devops dans le domaine des logiciels. Les modèles d'apprentissage automatique sont testés et développés dans des systèmes expérimentaux isolés. Lorsqu'un algorithme est prêt à être lancé, le MLOps est pratiqué entre les scientifiques des données, les devops et les ingénieurs en apprentissage automatique pour faire passer l'algorithme aux systèmes de production[2]. Semblable aux approches devops ou DataOps, MLOps cherche à accroître l'automatisation et à améliorer la qualité des modèles de production, tout en se concentrant sur les exigences commerciales et réglementaires. Alors que MLOps a commencé comme un ensemble de bonnes pratiques, il évolue lentement vers une approche indépendante de la gestion du cycle de vie du ML. Le MLOps s'applique à l'ensemble du cycle de vie - de l'intégration avec la génération de modèles (cycle de vie du développement logiciel, intégration continue/livraison continue), l'orchestration et le déploiement, à la santé, aux diagnostics, à la gouvernance et à l'entreprise métrique. Selon Gartner, MLOps est un sous-ensemble de ModelOps (en). MLOps se concentre sur l'opérationnalisation des modèles ML, tandis que ModelOps couvre l'opérationnalisation de tous les types de modèles d'IA[3].

MLOps est l'ensemble des pratiques à l'intersection de l'apprentissage automatique, du DevOps et de l'ingénierie des données[1]

Histoire modifier

Les défis de l'utilisation continue de l'apprentissage automatique dans les applications ont été mis en évidence dans un article de 2015[4].

La croissance prévue de l'apprentissage automatique incluait un doublement estimé des pilotes et des implémentations de ML de 2017 à 2018, puis de 2018 à 2020[5].

Le projet open source Kubeflow a été créé en 2018 par Jeremy Lewi et David Aronchick de Google pour faciliter les MLOps sur Kubernetes.

Les rapports montrent qu'une majorité (jusqu'à 88 %) des initiatives d'IA des entreprises ont du mal à dépasser les étapes de test[citation nécessaire]. Cependant, les organisations qui ont réellement mis l'IA et l'apprentissage automatique en production ont vu leur marge bénéficiaire augmenter de 3 à 15 %[6].

Le marché des MLOps était estimé à 23,2 milliards de dollars en 2019 et devrait atteindre 126 milliards de dollars d'ici 2025 en raison de son adoption rapide[7].

Architecture modifier

Les systèmes d'apprentissage automatique peuvent être classés en huit catégories différentes : collecte de données, traitement des données, ingénierie des fonctionnalités, étiquetage des données, conception de modèles, formation et optimisation de modèles, déploiement et surveillance des terminaux. Chaque étape du cycle de vie de l'apprentissage automatique est intégrée dans son propre système, mais nécessite une interconnexion. Ce sont les systèmes minimaux dont les entreprises ont besoin pour faire évoluer l'apprentissage automatique au sein de leur organisation.

Objectifs modifier

Les entreprises souhaitent atteindre un certain nombre d'objectifs grâce aux systèmes MLOps mettant en œuvre avec succès le ML dans toute l'entreprise, notamment[8] :

  • Déploiement et automatisation[9]
  • Reproductibilité des modèles et des prédictions[10]
  • Diagnostics[10]
  • Gouvernance et conformité réglementaire[11]
  • Évolutivité[12]
  • Collaboration[13]
  • L'entreprise utilise[14]
  • Surveillance et gestion[15]

Une pratique standard, telle que MLOps, prend en compte chacun des domaines susmentionnés, ce qui peut aider les entreprises à optimiser les flux de travail et à éviter les problèmes lors de la mise en œuvre.

Une architecture commune d'un système MLOps comprendrait des plates-formes de science des données où les modèles sont construits et les moteurs analytiques où les calculs sont effectués, l'outil MLOps orchestrant le mouvement des modèles d'apprentissage automatique, des données et des résultats entre les systèmes[8]. Le MLOps pour les grands modèles linguistiques a évolué rapidement, avec l'émergence de nouvelles techniques pour améliorer la qualité des modèles tout en gérant les coûts de calcul croissants[16].

Voir aussi modifier

  • ModelOps (en), selon Gartner, MLOps est un sous-ensemble de ModelOps (en). MLOps se concentre sur l'opérationnalisation des modèles ML, tandis que ModelOps couvre l'opérationnalisation de tous les types de modèles d'IA[3].
  • AIOps, un concept du même nom, mais différent - utilisant l'IA (ML) dans l'informatique et les opérations.
  • Consultez les meilleurs référentiels MLOps de GitHub pour suivre les tendances et les ressources pédagogiques.

Références modifier

  1. a et b (en) Cristiano Breuel, « ML Ops : Apprentissage automatique en tant que discipline d'ingénierie », sur Towards Data Science (consulté le ).
  2. Nisha Talagala, « Why MLOps (et pas seulement ML) est la nouvelle frontière concurrentielle de votre entreprise », sur AITrends, AITrends (consulté le ).
  3. a et b Shubhangi Vashisth, Erick Brethenoux, Farhan Choudhary et Jim Hare, « Utilisez le framework MLOps en 3 étapes de Gartner pour opérationnaliser avec succès des projets d'apprentissage automatique », sur Gartner, Gartner (consulté le )
  4. D. Sculley, Gary Holt, Daniel Golovin, Eugene Davydov, Todd Phillips, Dietmar Ebner, Vinay Chaudhary, Michael Young, Jean-François Crespo et Dan Dennison, « Dette technique cachée dans les systèmes d'apprentissage automatique », NIPS Proceedings, no 2015,‎ (lire en ligne, consulté le )
  5. Paul Sallomi et Paul Lee, « Deloitte Technology, Media and Telecommunications Predictions 2018 », sur Deloitte, Deloitte (consulté le )
  6. Jacques Bughin, Eric Hazan, Sree Ramaswamy, Michael Chui, Tera Allas, Peter Dahlström, Nicolas Henke et Monica Trench, « Intelligence Artificielle Prochaine frontière numérique ? », sur McKinsey, McKinsey Global Institute (consulté le )
  7. « 2021 MLOps Platforms Vendor Analysis Report », sur Neu.ro (consulté le )
  8. a et b Nick Walsh, « The Rise of Quant -Oriented Devs & Le besoin de MLOps standardisés », sur Slides, Nick Walsh (consulté le )
  9. « Encodez l'apprentissage machine prêt pour la production en 4 étapes », sur DAGsHub Blog, (consulté le )
  10. a et b Pete Warden, « The Machine Learning Reproductibility Crisis », sur Blog de Pete Warden, Pete Warden (consulté le )
  11. Jack Vaughan, « Les algorithmes d'apprentissage automatique rencontrent la gouvernance des données », sur SearchDataManagement, TechTarget (consulté le )
  12. Ben Lorica, « Comment former et déployer l'apprentissage en profondeur à grande échelle », sur O'Reilly, O'Reilly (consulté le )
  13. Natalie Garda, « IoT et Machine Learning : pourquoi la collaboration est essentielle », sur IoT Tech Expo, Encore Media Group (consulté le )
  14. James Manyika, « Quelles sont les nouveautés en matière d'analyse, d'IA et d'automatisation », sur McKinsey, McKinsey Global Institute (consulté le )
  15. Yaron Haviv, « MLOps Challenges, Solutions and Future Trends », sur Iguazio, Iguazio (consulté le )
  16. (en) « Qu'est-ce que LLMOps? — Klu », sur klu.ai, (consulté le )