Ouvrir le menu principal

Coefficient de détermination

indicateur de la qualité dans un modèle linéaire

En statistique, le coefficient de détermination, noté R2 ou r2, est une mesure de la qualité de la prédiction d'une régression linéaire.

Il est défini par :

n est le nombre de mesures, la valeur de la mesure no i, la valeur prédite correspondante et la moyenne des mesures.

Dans le cas d'une régression linéaire univariée (une seule variable prédictive), on montre que la variance (totale) SST est la somme de la variance expliquée par la régression SSR et de la moyenne des carrés des résidus SSE, de sorte que :

c'est-à-dire que le coefficient de détermination est alors le rapport de la variance expliquée par la régression SSR sur la variance totale SST.

Le coefficient de détermination est le carré du coefficient de corrélation linéaire R entre les valeurs prédites et les mesures  :

Dans le cas univarié, on montre que c'est aussi le carré du coefficient de corrélation entre les valeurs de la variable prédictive et les mesures . C'est une conséquence immédiate de la relation : démontrée ici et ici.

La propriété précédente permet de voir le coefficient de détermination comme une généralisation du coefficient de corrélation au cas d'une régression linéaire multivariée.

Voir aussiModifier

BibliographieModifier

  • Pierre Bailly et Christine Carrère, Statistiques descriptives : Théorie et applications, PUG, coll. « Libres cours économie », (lire en ligne), p. 165-167.

Article connexeModifier