Champ aléatoire conditionnel

Les champs aléatoires conditionnels (conditional random fields ou CRFs) sont une classe de modèles statistiques utilisés en reconnaissance des formes et plus généralement en apprentissage statistique. Les CRFs permettent de prendre en compte l'interaction de variables « voisines ». Ils sont souvent utilisés pour des données séquentielles (langage naturel, séquences biologiques, vision par ordinateur).

Les CRFs sont un exemple de réseau probabiliste non orienté. Il s'agit d'une version de type modèle discriminant des champs aléatoires de Markov généralement présentés comme des modèles discriminatifs, c'est-à-dire que l'on cherche à modéliser la probabilité conditionnelle , étant les observations et les variables à estimer, au lieu de .

Description modifier

Un CRF est défini par Lafferty, McCallum et Pereira[1] comme suit.

Soit   un graphe.   est indexé par les nœuds (  pour vertices) de   :  . On dit que   est un champ aléatoire conditionnel si les variables aléatoires   conditionnées à   obéissent à la propriété de Markov :

 , où   signifie que   et   sont des voisins dans  .

Ici la propriété de Markov signifie que la probabilité de chaque variable   ne dépend que des valeurs en les voisins de  .

Références modifier

  1. Conditional random fields: Probabilistic models for segmenting and labeling sequence data, Lafferty, J., McCallum, A., Pereira, F., Proc. 18th International Conf. on Machine Learning, Morgan Kaufmann, p. 282–289, 2001