Racine de l'erreur quadratique moyenne

erreur quadratique moyenne

La racine de l'erreur quadratique moyenne (REQM) ou racine de l'écart quadratique moyen (en anglais, root-mean-square error ou RMSE, et root-mean-square deviation ou RMSD) est une mesure fréquemment utilisée des différences entre les valeurs (valeurs d'échantillon ou de population) prédites par un modèle ou estimateur et les valeurs observées (ou vraies valeurs). La REQM représente la racine carrée du deuxième moment d'échantillonnage des différences entre les valeurs prédites et les valeurs observées. Ces écarts sont appelés résidus lorsque les calculs sont effectués sur l'échantillon de données qui a été utilisé pour l'estimation ou ils sont appelés erreurs (ou erreurs de prédiction) lorsqu'ils sont calculés sur des données hors de l'échantillon d'estimation. La REQM agrège les erreurs de prédiction de différents points de données en une seule mesure de puissance prédictive accrue. La REQM est une mesure de précision, qui sert à comparer les erreurs de différents modèles prédictifs pour un ensemble de données particulier et non entre différents ensembles de données, car elle dépend de l'échelle[1].

La REQM est toujours positive et une valeur de 0 (presque jamais atteinte en pratique) indiquerait un ajustement parfait aux données. En général, une valeur de REQM plus petite indique une meilleure précision qu'une valeur de REQM plus élevée. Cependant, les comparaisons entre différents jeux de données ne seraient pas valides car la mesure dépend de l'échelle relative des nombres utilisés.

La REQM est la racine carrée de la moyenne des erreurs quadratiques. L'effet de chacune des erreurs sur la REQM est proportionnel à la taille de l'erreur quadratique; ainsi, des erreurs plus importantes ont un effet disproportionné sur la REQM. Par conséquent, la REQM est sensible aux valeurs aberrantes ou anomalies[2],[3].

Formule modifier

La REQM d'un estimateur   par rapport à un paramètre estimé   est définie comme la racine carrée de l'erreur quadratique moyenne :

 

Pour un estimateur sans biais, la REQM est la racine carrée de la variance, aussi appelée l'écart type.

La REQM des valeurs prédites   pour les instants t de la variable dépendante   d'une régression, avec des variables observées T fois, est calculée pour T différentes prédictions comme la racine carrée de la moyenne des carrés des écarts:

 

(Pour les régressions sur des données transversales, l'indice t est remplacé par i et T est remplacé par n . )

Dans certaines disciplines, la REQM est utilisée pour comparer les différences entre deux quantités qui peuvent varier, dont aucune n'est acceptée comme "norme". Par exemple, lors de la mesure de la différence moyenne entre deux séries chronologiques   et  , la formule devient

 

Normalisation modifier

La normalisation de la REQM facilite la comparaison entre des ensembles de données ou des modèles à différentes échelles. Bien qu'il n'y ait pas de moyen consistant de normalisation dans la littérature, les choix courants sont la moyenne ou l'étendue (définie comme la valeur maximale moins la valeur minimale) des données mesurées[4]:

  ou   .

Cette valeur est communément appelée racine de l'écart quadratique moyen normalisée ou racine de l'erreur quadratique moyenne normalisée (REQMN), et souvent exprimée en pourcentage, où des valeurs plus petites indiquent une variance résiduelle moindre. Dans de nombreux cas, en particulier pour les échantillons plus petits, la plage d'échantillonnage est susceptible d'être affectée par la taille de l'échantillon, ce qui nuirait aux comparaisons.

Une autre méthode possible pour faire de la REQM une mesure de comparaison plus utile consiste à diviser la REQM par l’écart interquartile (aussi appelé étendue interquartile). Lors de la division du REQM par l'EI, la valeur normalisée devient moins sensible aux valeurs extrêmes de la variable cible.

  

avec   et   où Q est la fonction quantile.

Lors de la normalisation par la valeur moyenne des mesures, le terme coefficient de variation du REQM, CV(REQM) peut être utilisé pour éviter toute ambiguïté[5]. Ceci est analogue au coefficient de variation, le REQM prenant la place de l'écart type.

 

Mesures connexes modifier

Certains chercheurs ont recommandé l'utilisation de l'erreur absolue moyenne (EAM) au lieu de la racine de l'erreur quadratique moyenne. L'EAM possède des avantages d'interprétabilité par rapport à REQM. L'EAM est la moyenne des valeurs absolues des erreurs. L'EAM est fondamentalement plus facile à comprendre que la racine carrée de la moyenne des erreurs quadratiques. De plus, chaque erreur influence l'EAM directement proportionnellement à la valeur absolue de l'erreur, ce qui n'est pas le cas pour REQM[2].

Applications modifier

  • En météorologie, pour mesurer avec quelle efficacité un modèle mathématique prédit le comportement de l'atmosphère.
  • En bioinformatique, la déviation quadratique moyenne des positions atomiques est la mesure de la distance moyenne entre les atomes de protéines superposées.
  • Dans la conception de médicaments basée sur la structure, la REQM est une mesure de la différence entre une conformation de cristal du ligand de conformation et d' un amarrage prédictif.
  • En économie, la REQM est utilisé pour déterminer si un modèle économique correspond aux indicateurs économiques. Certains experts ont fait valoir que REQM est moins fiable que l'erreur absolue relative[6].
  • En psychologie expérimentale, la REQM est utilisé pour évaluer dans quelle mesure les modèles mathématiques ou informatiques de comportement expliquent le comportement observé empiriquement.
  • Dans le SIG, la REQM est une mesure utilisée pour évaluer la précision de l'analyse géospatiale et de la télédétection.
  • En hydrogéologie, la REQM et la REQMN sont utilisés pour évaluer l'étalonnage d'un modèle d'eau souterraine[7].
  • Dans la science de l'imagerie, la REQM fait partie du rapport signal / bruit de crête, une mesure utilisée pour évaluer les performances d'une méthode de reconstruction d'une image par rapport à l'image d'origine.
  • En neuroscience computationnelle, la REQM est utilisée pour évaluer dans quelle mesure un système apprend un modèle donné[8].
  • Dans la spectroscopie par résonance magnétique nucléaire des protéines, la REQM est utilisée comme mesure pour estimer la qualité de l'ensemble de structures obtenu.
  • Les soumissions pour le prix Netflix ont été évaluées en utilisant la REQM et les valeurs "vraies" non divulguées de l'ensemble de données de test.
  • Dans la simulation de la consommation d'énergie des bâtiments, la REQM et le CV(REQM) sont utilisés pour calibrer les modèles en fonction des performances mesurées du bâtiment[9].
  • En cristallographie aux rayons X, la REQM est utilisée pour mesurer l'écart entre les coordonnées internes moléculaires et des valeurs de références.

Voir également modifier

Notes et références modifier

  1. Hyndman et Koehler, « Another look at measures of forecast accuracy », International Journal of Forecasting, vol. 22, no 4,‎ , p. 679–688 (DOI 10.1016/j.ijforecast.2006.03.001).
  2. a et b Pontius, Thontteh et Chen, « Components of information for multiple resolution comparison between maps that share a real variable », Environmental Ecological Statistics, vol. 15, no 2,‎ , p. 111–142 (DOI 10.1007/s10651-007-0043-y).
  3. Willmott et Matsuura, « On the use of dimensioned measures of error to evaluate the performance of spatial interpolators », International Journal of Geographical Information Science, vol. 20,‎ , p. 89–102 (DOI 10.1080/13658810500286976).
  4. « Coastal Inlets Research Program (CIRP) Wiki - Statistics » (consulté le ).
  5. « FAQ: What is the coefficient of variation? » (consulté le ).
  6. Armstrong et Collopy, « Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons », International Journal of Forecasting, vol. 8, no 1,‎ , p. 69–80 (DOI 10.1016/0169-2070(92)90008-w, lire en ligne).
  7. M.P. Anderson et Woessner, W.W., Applied Groundwater Modeling: Simulation of Flow and Advective Transport, 2nd, .
  8. Ensemble Neural Network Model.
  9. ANSI/BPI-2400-S-2012: Standard Practice for Standardized Qualification of Whole-House Energy Savings Predictions by Calibration to Energy Use History.