Moyenne

mathématiques

En mathématiques, la moyenne est un outil de calcul permettant de résumer une liste de valeurs numériques en un seul nombre réel, indépendamment de l’ordre dans lequel la liste est donnée. Par défaut, il s’agit de la moyenne arithmétique, qui se calcule comme la somme des termes de la liste, divisée par le nombre de termes[1]. D’autres moyennes peuvent être plus adaptées selon les contextes.

La moyenne est un des premiers indicateurs statistiques pour une série de nombres. Lorsque ces nombres représentent une quantité partagée entre des individus, la moyenne exprime la valeur qu’aurait chacun si le partage était équitable.

La notion de moyenne s’étend aux fonctions avec la valeur moyenne, en géométrie classique avec le barycentre et en théorie des probabilités avec l’espérance d’une variable aléatoire.

MotivationModifier

Valeur intermédiaireModifier

La notion de moyenne est historiquement reliée à celle de valeur intermédiaire, appelée aussi médiété[2]. Étant donné deux nombres a et b, comment choisir une valeur c pour que a soit à c ce que c soit à b ? La réponse diffère selon l’opération choisie pour aller d’un nombre à l’autre.

Par exemple, pour aller de 2 à 18, on peut ajouter deux fois 8, avec une étape en 10, ou multiplier deux fois par 3, avec une étape en 6. Le premier cas décrit une moyenne arithmétique, qui s’obtient par la fraction  . Le second cas est une moyenne géométrique, qui s’obtient avec la racine carrée  .

Les identités remarquables usuelles permettent de montrer rapidement que la moyenne géométrique de deux nombres positifs est toujours inférieure à leur moyenne arithmétique.

ÉgalisationModifier

Une autre manière de définir ces moyennes est de cumuler les nombres choisis puis de chercher comment on peut obtenir le même résultat en cumulant plusieurs fois la même valeur. Tout dépend alors de la procédure de cumul. Avec une addition, on trouve 2+18=20, qu’on aurait pu obtenir en posant 10+10=20. Avec une multiplication, on trouve 2×18=36, qu’on aurait pu obtenir avec 6×6=36.

D’autres procédures de cumul sur deux nombres a et b permettent de définir la moyenne harmonique   et la moyenne quadratique  .

Cette approche permet de définir les moyennes pour des listes de plus de deux nombres.

Position d'équilibreModifier

La moyenne peut aussi être concrétisée par le point d'équilibre d’un ensemble fini de masses ponctuelles positionnées le long de la droite numérique, comme sur un mobile.

Cette approche permet d’introduire naturellement la notion de moyenne pondérée. Par exemple, on peut souhaiter que la moyenne soit trois fois plus proche de la première valeur que de la deuxième. Entre 7 et 19, le nombre 10 est bien trois fois plus proche de 7 (avec un écart de 3) que de 19 (avec un écart de 9). On dit alors que 10 est la moyenne pondérée des nombres 7 et 19 avec les coefficients 3 et 1. On le trouve en calculant la somme pondérée que l’on divise par la somme des coefficients  .

FormulationsModifier

Moyenne arithmétiqueModifier

Pour toute liste (x1, ..., xn) de réels, on définit sa moyenne arithmétique par la formule  , qui ne dépend pas de l’ordre des termes et est toujours comprise entre les valeurs minimale et maximale de la liste.

Cette moyenne est linéaire, c’est-à-dire que l’addition ou la multiplication par une constante sur les valeurs de la liste se traduit par la même opération sur la moyenne.

Pour calculer une moyenne sur une liste dans laquelle beaucoup de valeurs sont répétées, on peut noter (x1, ..., xk) la liste des valeurs (sans répétition) et (n1, ..., nk) la liste des effectifs (le nombre de fois qu’apparait chaque valeur dans la liste initiale). La moyenne s’écrit alors  .

On retrouve la notion de moyenne pondérée, dans laquelle les facteurs ni ne représentent pas nécessairement des effectifs, mais des coefficients appelés poids, par exemple pour calculer la moyenne de notes sur un bulletin scolaire dans lequel on souhaite accorder plus d’importance à certaines disciplines ou à certains devoirs, en leur attribuant un coefficient plus grand que les autres.

La moyenne arithmétique est aussi cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés.

Moyennes généraliséesModifier

Étant donnée une liste (x1, ..., xn) de réels positifs (voire strictement positifs pour la moyenne harmonique), avec éventuellement une liste (w1, ..., wn) de poids associés, positifs et non tous nuls, on définit les moyennes usuelles suivantes.

Expressions des moyennes usuelles
Nom Moyenne brute Moyenne pondérée
moyenne arithmétique    
moyenne harmonique    
moyenne géométrique    
moyenne quadratique    

Ces moyennes reprennent certaines propriétés de la moyenne arithmétique :

  • la moyenne ne dépend pas de l’ordre des termes ;
  • la moyenne est toujours comprise entre la valeur minimale et la valeur maximale de la liste ;
  • la moyenne est homogène, c’est-à-dire que si toutes les valeurs de la liste sont multipliées par un même facteur, la moyenne est multipliée par ce même facteur ;
  • la moyenne est cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés.

En outre, ces moyennes sont toujours ordonnées par les inégalités suivantes qui prolongent l’inégalité arithmético-géométrique :

 

Toutes ces moyennes s’obtiennent sous la forme   ou comme limite d’expressions sous cette forme, et rentrent dans la définition de moyenne généralisée. Plus précisément, on retrouve :

  • pour m = 1, la moyenne arithmétique ;
  • pour m = 2, la moyenne quadratique ;
  • pour m = –1, la moyenne harmonique ;
  • lorsque m → 0, la limite de xm est la moyenne géométrique ;
  • lorsque m → +∞, la limite de xm est le maximum de la série ;
  • lorsque m → –∞, la limite de xm est le minimum de la série.

Moyennes quasi-arithmétiquesModifier

On peut définir la moyenne énergétique de la manière suivante :

 

C'est la moyenne de valeurs données en décibels, utilisées par exemple en acoustique.

Cette moyenne n’est pas homogène, mais elle reste cumulative, encadrée par le maximum et le minimum. Elle fait partie de la famille des moyennes quasi-arithmétiques qui s’écrivent sous la forme  , où f est une fonction réelle continue et strictement croissante sur un intervalle contenant les valeurs de la liste, et f −1 est sa fonction réciproque. On retrouve en particulier les moyennes homogènes avec les fonctions puissances ou avec la fonction logarithme. La moyenne énergétique s’obtient avec la fonction  .

Moyenne arithmético-géométriqueModifier

À partir de deux nombres a et b, la moyenne arithmétique et la moyenne géométrique fournissant deux nouveaux nombres, et l’on peut itérer le processus pour obtenir deux suites adjacentes qui convergent vers un réel intermédiaire (parfois noté M(a,b)) appelé moyenne arithmético-géométrique et qui est relié à la longueur d’une ellipse.

Cette définition n’est cependant pas cumulative, et ne s’étend donc pas à plus de deux valeurs.

Moyenne de MuirheadModifier

Étant donné une liste (a1, … , an) de réels et une liste (x1, … , xn) de réels strictement positifs, la a-moyenne de x est égale à la moyenne arithmétique des monômes de la forme x1aσ(1) × ⋯ × xnaσ(n) lorsque σ décrit l’ensemble des permutations de ⟦1, n.

Cette moyenne est homogène lorsque la somme des exposants ai est égale à 1, et appelée dans ce cas moyenne de Muirhead.

Dans le cas particulier n = 2, cette moyenne est appelée moyenne de Heinz.

UtilisationsModifier

Évaluation globaleModifier

La moyenne est beaucoup utilisée en évaluation scolaire. Dans de nombreux systèmes scolaires, une partie de l'évaluation des élèves débouche sur une note chiffrée, par exemple

  • en France, en Tunisie, Algérie et au Maroc : de 0 à 10 ou de 0 à 20 (0 étant la plus mauvaise note, 10 ou 20 la meilleure) ;
  • en Suisse : de 1 à 6 (1 étant la plus mauvaise note, 6 la meilleure) ;
  • en Allemagne : de 6 à 1 (6 étant la plus mauvaise note, 1 la meilleure) ;
  • au Canada : de 0 à 100 (0 étant la plus mauvaise note, 100 la meilleure) ;
  • au Danemark : de -3 à 12 (-3 étant la plus mauvaise note, 12 la meilleure).

On peut alors calculer la moyenne des notes d'une classe dans une matière, ou la moyenne des notes d'un élève dans une matière. Ces moyennes ont des sens différents :

  • la moyenne de la classe est censée représenter un « niveau global », si tant est que cela ait un sens ;
  • dans le cas d'un examen de grande ampleur, comme le baccalauréat en France, où de nombreux élèves passent la même épreuve mais sont corrigés par différents professeurs, la différence des moyennes entre les groupes peut indiquer une différence de correction selon le professeur (certains étant plus sévères, d'autres plus tolérants), et l'on peut par exemple effectuer une correction de notes, une « mise en adéquation », afin que les groupes aient tous la même moyenne ; par exemple, si m1, m2… sont les moyennes des groupes et M la moyenne globale, alors les notes du groupe i seront multipliées par M/mi ;
  • dans le cas d'un élève : la moyenne des notes sur une matière permet de niveler les résultats ; ainsi, si les résultats sont fluctuants, les faiblesses d'un moment sont rattrapées par les réussites d'un autre moment ;
  • la moyenne des notes d'un élève dans plusieurs matières est une autre manière de niveler les résultats, non plus dans le temps mais selon la matière : les points forts rattrapent les points faibles ; la moyenne est alors un critère de sélection, sachant que ce que l'on demande d'un élève, ce n'est pas qu'il soit bon partout, mais qu'il ait des qualités permettant de rattraper ses défauts ; lorsque certaines matières sont plus importantes que d'autres, on applique des coefficients de pondération (cf. infra).

Dans ces exemples, la moyenne est un lissage des valeurs. On peut bien sûr se demander si la moyenne est un critère pertinent de sélection (voir Évaluation sommative) ; en général, ce n'est pas le seul critère qui entre en compte, à l'exception de certains examens et concours.

StatistiqueModifier

La moyenne est la valeur unique que devraient avoir tous les individus d'une population (ou d'un échantillon) pour que leur total soit inchangé. C'est un critère de position.

Dans la plupart des cas, le total formé par les individus d'une population est la somme de leurs valeurs. La moyenne est alors la moyenne arithmétique. Mais si le total représenté par une population ou un échantillon n'est pas la somme de leurs valeurs, la moyenne pertinente ne sera plus la moyenne arithmétique.

Si, par exemple, le total d'un ensemble d'individus est le produit de leurs valeurs, il convient de calculer leur moyenne géométrique.

La moyenne ne peut donc se concevoir que pour une variable quantitative. On ne peut pas faire le total des valeurs d'une variable qualitative. Quand la variable est ordinale, on lui préférera la médiane.

GéométrieModifier

Le barycentre d’un ensemble fini de points du plan ou de l’espace affine (éventuellement munis de poids positifs ou négatifs) est défini par une relation vectorielle et correspond essentiellement à la notion physique de centre de masse.

Les coordonnées cartésiennes de ce barycentre dans un repère sont alors données par la moyenne arithmétique pondérée des coordonnées des différents points.

AnalyseModifier

Le lemme de Cesàro assure que pour toute suite u convergente, la suite des moyennes partielles   converge également vers la même limite.

Ce résultat permet d’étendre la notion de limite à des suites divergentes mais pour lesquelles la suite des moyennes partielles converge, comme par exemple la suite ((−1)n)n⩾0, dont les moyennes partielles tendent vers 0, ou la série associée, appelée série de Grandi, à laquelle on attribue alors la limite 1/2.

Ce procédé est utilisé par exemple dans la définition de somme de Fejér.

ProbabilitésModifier

La moyenne empirique d’un échantillon de variables aléatoires réelles (X1, … , Xn) est simplement la moyenne arithmétique de ces variables, notée   ou  . C’est une variable qui a la même espérance que les variables Xi mais une variance divisée par n (sous condition d’existence). Elle sert notamment comme estimateur (statistique) de l’espérance.

PhysiqueModifier

Les règles de conservation sur les différentes grandeurs physiques mènent à l’usage de moyennes différentes.

Ainsi, la capacité électrique moyenne de condensateurs en série est la moyenne harmonique de leurs capacités, comme la résistance (électricité) moyenne de conducteurs ohmiques en parallèle.

L’énergie cinétique dépendant linéairement du carré de la vitesse, la vitesse moyenne d’un ensemble de particules en agitation thermique est la moyenne quadratique des vitesses individuelles.

Extensions de la notion de moyenneModifier

Au-delà des définitions précédentes de moyenne, il existe d'autres approches plus étendues pour cette notion :

Moyenne glissante (ou « mobile »)Modifier

La moyenne glissante est une notion statistique, où la moyenne au lieu d'être calculée sur n valeurs fixes, est calculée sur n valeurs consécutives « glissantes ».

Ce type de calcul est aussi utilisé en informatique pour minimiser la taille mémoire nécessaire au stockage des valeurs intermédiaires. Différentes formules de moyennes glissantes existent, par exemple pour une moyenne glissante de période n :

  (une moyenne glissante de période 0 ne prend qu'un terme)
  (formule de récurrence)

Moyenne tronquée (ou « réduite »)Modifier

Une moyenne tronquée est un calcul de moyenne arithmétique qui est appliqué après avoir ignoré les valeurs les plus extrêmes des données. L'idée de la troncation, opération dont le résultat s'appelle une troncature de l'ensemble des données, est de ne pas tenir compte des valeurs les plus éloignées, considérées alors comme aberrantes, et ainsi, dans le cas de la moyenne dite tronquée, de ne la calculer que sur un sous-ensemble « central » des données, la troncature. Notons que cette procédure est généralisable à d'autres estimateurs centraux.

Les statistiques tronquées, en anglais trimmed estimators (en), ont été inventées pour pallier la sensibilité des statistiques aux valeurs aberrantes, ce qu'on appelle la robustesse statistique. Leur avantage sur la médiane et sur la moyenne arithmétique est d'allier la robustesse de la médiane, à la définition « collective » de la moyenne arithmétique, la formule de calcul ressemblant fort à celle de cette moyenne arithmétique, lui conférant un avantage psychologique sur la médiane dont le défaut majeur (!) est de ne pas s'écrire avec une formule simplement arithmétique.

Historiquement, cette technique a eu son heure de gloire dans la première moitié du XXe siècle comme méthode de « correction » des valeurs aberrantes, et avec l'apparition des premiers calculateurs, notamment, jusqu'aux travaux plus récents pour mieux cerner la notion de robustesse (Peter Rousseeuw (en)).

Moyenne pondéréeModifier

La moyenne pondérée est utilisée, en géométrie pour localiser le barycentre d'un polygone, en physique pour déterminer le centre de gravité ou en statistique et probabilité pour calculer une espérance. On la calcule ainsi :

 

Dans le cas général le poids wi représente l'influence de l'élément xi par rapport aux autres.

À noter qu'il s'agit ici de la moyenne pondérée arithmétique. Il existe aussi des versions pondérées des autres moyennes, comme la moyenne géométrique pondérée et la moyenne harmonique pondérée.

Valeur moyenne d'une fonctionModifier

Pour toute fonction f continue sur un segment [a, b] non dégénéré (i. e. b > a) ou plus généralement intégrable sur ]a, b[, la valeur moyenne de f sur [a, b] est le réel défini par :

 .

L’inégalité de la moyenne permet d’encadrer cette valeur moyenne par des bornes de la fonction. Si la fonction est continue, le théorème de la moyenne assure même l’existence d’un réel c ∈ ]a, b[ tel que m = f(c).

Cette notion généralise celle de moyenne d'un nombre fini de réels en l'appliquant à un nombre infini de valeurs prises par une fonction intégrable. Elle sert par exemple dans la décomposition en série de Fourier d'une fonction périodique : c'est la composante constante. En traitement du signal, pour les signaux périodiques, il s'agit de la composante continue (offset).

On peut aussi, par analogie avec les moyennes pondérées d'un nombre fini de réels, affecter « à chacune des valeurs prises par la fonction » un coefficient strictement positif. On utilise alors ce que l'on appelle une fonction poids

 

(w pour l'initiale de weight, « poids » en anglais) :

 .

Ce procédé peut aussi s'utiliser sur un intervalle ouvert ou semi-ouvert mais borné (i. e. aucune de ses bornes n'est infinie) où la fonction ƒ×w est intégrable. On peut citer l'exemple classique servant à montrer l'orthogonalité de la famille des polynômes de Tchebychev :

 

où la fonction Tn×Tp est continue sur le fermé [0,1] et où la fonction poids est

 

est intégrable sur [0,1[, et dont l'intégrale vaut  .

Nota : Lorsque la fonction est périodique de période T, elle a la même valeur moyenne sur toute période [a, a + T]. Cette valeur commune est appelée valeur moyenne de la fonction. Ainsi la fonction cosinus est de moyenne nulle, son carré de moyenne 1/2.

Notes et référencesModifier

  1. (fr)Fabrice Mazerolle, « Moyenne Arithmétique », (consulté le 13 février 2012)
  2. Stella Baruk, « Moyenne », Dictionnaire de mathématiques élémentaires, Éditions du Seuil, 1995.

Voir aussiModifier

Sur les autres projets Wikimedia :

BibliographieModifier

Articles connexesModifier