Indicateur de tendance centrale

valeur résumant une série statistique

En statistique, un indicateur de tendance centrale est une valeur résumant une série statistique pour une variable quantitative ou ordinale. Les deux principaux sont la moyenne et la médiane, mais on trouve parfois aussi la valeur centrale (moyenne des valeurs minimale et maximale) ou le mode. Ce dernier n’étant pas nécessairement unique pour une série statistique, sa définition ne s’obtient pas directement comme une fonction des termes de la série.

Diagramme d'une loi binomiale avec des indicateurs de tendance centrale (comme la moyenne au centre).

Un indicateur de tendance centrale est toujours compris entre les valeurs maximale et minimale. Pour une variable numérique, il s’agit en général d’une fonction linéaire des valeurs.

Exemples d'indicateurs

modifier

Les indicateurs suivants peuvent s'appliquer à des données unidimensionnelles. Selon les circonstances, il peut être approprié de transformer les données avant de calculer une tendance centrale, comme prendre les carrés ou les logarithmes des valeurs. Le choix de la transformation dépend fortement des données elles-mêmes.

On considère un échantillon de n valeurs  , et sa version ordonnée  

Espérance mathématique
la moyenne arithmétique de l'ensemble des données
 
Médiane
la valeur médiane qui sépare l'ensemble en deux, un ensemble où toutes les valeurs sont inférieures à la médiane et un deuxième où les valeurs lui sont supérieures. Avec le mode, la médiane sont les seules mesures de tendance centrale qui peuvent être utilisées pour des données ordonnées.
 
Mode
la valeur la plus fréquente du jeu de données. C'est le seul indicateur de tendance centrale qui peut être utilisée sur des données nominales
Moyenne généralisée
Une généralisation des moyennes pythagoriciennes, caractérisées par un exposant.
 
Moyenne géométrique
la racine n-ième du produit des données, pour un ensemble de n valeurs. Cette mesure ne fonctionne que si les données sont positives.
 
Moyenne harmonique
l'inverse de la moyenne arithmétique des inverses des données. Cette mesure n'est valide que pour des valeurs strictement positives.
 
Moyenne arithmétique pondérée
une moyenne arithmétique où chaque valeur se voit associer un poids.
 
Moyenne tronquée
la moyenne arithmétique de données dont une partie des données les plus faibles et les plus hautes ont été ignorées.
 
Moyenne interquartile
une moyenne tronquée sur les données contenues dans l'intervalle interquartile.
Milieu de gamme
la moyenne arithmétique du minimum et du maximum des valeurs.
 
Midhinge (en)
la moyenne arithmétique des premier et troisième quartiles
 
Moyenne quasi-arithmétique
Une généralisation de la moyenne généralisée, caractérisée par une fonction continue injective.
 
Trimoyenne de Tukey
la moyenne arithmétique pondérée de la médiane et des deux quartiles.
 
Moyenne winsorisée
une moyenne arithmétique dans laquelle les valeurs extrêmes sont remplacées par des valeurs plus proches de la médiane.

Ces indicateurs peuvent être appliquées à des données multi-dimensionnelles, mais les résultats peuvent ne pas être invariantes par rotation.

Médiane géométrique
le point minimisant la somme des distances à un ensemble de points. C'est un équivalent de la médiane pour des données unidimensionnelles mais n'est pas la médiane de chaque dimension indépendamment. Elle n'est pas invariante aux changements d'échelle selon les dimensions.
Moyenne quadratique
utile en ingénierie, mais peu en statistiques, car l'indicateur n'est pas efficace en cas de présence de données négatives.
 
Profondeur simpliciale (en)
la probabilité qu'un simplexe choisi aléatoirement pour une distribution donnée contienne le centre donné
Médiane de Tukey
un point ayant la propriété que tout demi-espace le contenant contienne aussi de nombreux points

Voir aussi

modifier

Notes et références

modifier