Indicateur de tendance centrale
En statistique, un indicateur de tendance centrale est une valeur résumant une série statistique pour une variable quantitative ou ordinale. Les deux principaux sont la moyenne et la médiane, mais on trouve parfois aussi la valeur centrale (moyenne des valeurs minimale et maximale) ou le mode. Ce dernier n’étant pas nécessairement unique pour une série statistique, sa définition ne s’obtient pas directement comme une fonction des termes de la série.
Un indicateur de tendance centrale est toujours compris entre les valeurs maximale et minimale. Pour une variable numérique, il s’agit en général d’une fonction linéaire des valeurs.
Exemples d'indicateurs
modifierLes indicateurs suivants peuvent s'appliquer à des données unidimensionnelles. Selon les circonstances, il peut être approprié de transformer les données avant de calculer une tendance centrale, comme prendre les carrés ou les logarithmes des valeurs. Le choix de la transformation dépend fortement des données elles-mêmes.
On considère un échantillon de n valeurs , et sa version ordonnée
- Espérance mathématique
- la moyenne arithmétique de l'ensemble des données
- Médiane
- la valeur médiane qui sépare l'ensemble en deux, un ensemble où toutes les valeurs sont inférieures à la médiane et un deuxième où les valeurs lui sont supérieures. Avec le mode, la médiane sont les seules mesures de tendance centrale qui peuvent être utilisées pour des données ordonnées.
- Mode
- la valeur la plus fréquente du jeu de données. C'est le seul indicateur de tendance centrale qui peut être utilisée sur des données nominales
- Moyenne généralisée
- Une généralisation des moyennes pythagoriciennes, caractérisées par un exposant.
- Moyenne géométrique
- la racine n-ième du produit des données, pour un ensemble de n valeurs. Cette mesure ne fonctionne que si les données sont positives.
- Moyenne harmonique
- l'inverse de la moyenne arithmétique des inverses des données. Cette mesure n'est valide que pour des valeurs strictement positives.
- Moyenne arithmétique pondérée
- une moyenne arithmétique où chaque valeur se voit associer un poids.
- Moyenne tronquée
- la moyenne arithmétique de données dont une partie des données les plus faibles et les plus hautes ont été ignorées.
- Moyenne interquartile
- une moyenne tronquée sur les données contenues dans l'intervalle interquartile.
- Milieu de gamme
- la moyenne arithmétique du minimum et du maximum des valeurs.
- Midhinge (en)
- la moyenne arithmétique des premier et troisième quartiles
- Moyenne quasi-arithmétique
- Une généralisation de la moyenne généralisée, caractérisée par une fonction continue injective.
- Trimoyenne de Tukey
- la moyenne arithmétique pondérée de la médiane et des deux quartiles.
- Moyenne winsorisée
- une moyenne arithmétique dans laquelle les valeurs extrêmes sont remplacées par des valeurs plus proches de la médiane.
Ces indicateurs peuvent être appliquées à des données multi-dimensionnelles, mais les résultats peuvent ne pas être invariantes par rotation.
- Médiane géométrique
- le point minimisant la somme des distances à un ensemble de points. C'est un équivalent de la médiane pour des données unidimensionnelles mais n'est pas la médiane de chaque dimension indépendamment. Elle n'est pas invariante aux changements d'échelle selon les dimensions.
- Moyenne quadratique
- utile en ingénierie, mais peu en statistiques, car l'indicateur n'est pas efficace en cas de présence de données négatives.
- Profondeur simpliciale (en)
- la probabilité qu'un simplexe choisi aléatoirement pour une distribution donnée contienne le centre donné
- Médiane de Tukey
- un point ayant la propriété que tout demi-espace le contenant contienne aussi de nombreux points
Voir aussi
modifierNotes et références
modifier- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Central tendency » (voir la liste des auteurs).