Modèle génératif

classe de modèles statistiques

En classement automatique un modèle génératif est un modèle statistique défini par opposition à un modèle discriminatif. Étant donné une variable X à laquelle il doit associer une autre variable Y, le modèle génératif cherchera à décrire la probabilité conditionnelle ainsi que la probabilité puis d'utiliser la formule de Bayes pour calculer la probabilité [1].

Schéma représentant la différence entre un modèle discriminatif et un modèle génératif.

Autrement dit le modèle génératif cherche à décrire chaque classe et à en déduire à quel point une donnée présente les caractéristiques de cette classe.

Avantages et inconvénients modifier

Les avantages d'un modèle génératif sont les suivants :

  • Un modèle génératif permet d'estimer la confiance d'une prédiction et donc de formuler un rejet d'une prédiction, ce qui est impossible dans un modèle discriminatif.
  • La connaissance de   permet également de générer des nouvelles données [2].
  • Des nouvelles classes peuvent facilement être ajoutées en additionnant leurs densités de probabilité à celles qui ont déjà été calculées. On peut également combiner différents modèles avec des combinaisons linéaires de leurs prédictions, un modèle génératif permet donc une accumulation continue des connaissances.

Un modèle génératif présente cependant un certain nombre d'inconvénients :

  • Le calcul de   est très coûteux, d'autant plus que la dimension de   est grande[3].

Formalisme modifier

Soit deux variables aléatoires   et  , appelées respectivement la donnée et la classe, un modèle génératif est une loi de probabilité jointe sur   qui s'écrit  . En particulier le modèle est défini par les distributions   et  , ce dernier terme étant appelé a priori bayésien sur la classe  . La probabilité   que la classe soit   pour une donnée   est donc déduite par l'inférence bayésienne suivante :

  où la valeur de   est déduite par la loi des probabilités totales :   pour l'ensemble des classes   existantes.

Exemples de modèles génératifs modifier

Les modèles génératifs couramment utilisés en classification automatique sont les suivants :

Notes et références modifier

  1. (en) Siwei Xu, « Generative vs Discriminative Probabilistic Graphical Models », sur Medium, (consulté le )
  2. (en) Prakash Pandey, « Deep Generative Models », sur Medium, (consulté le )
  3. Rahul G. Krishnan, Dawen Liang et Matthew Hoffman, « On the challenges of learning with inference networks on sparse, high-dimensional data », arXiv:1710.06085 [cs, stat],‎ (lire en ligne, consulté le )