Régression quantile

modèle statistique

Les régressions quantiles sont des outils statistiques dont l’objet est de décrire l’impact de variables explicatives sur une variable d’intérêt. Elles permettent une description plus riche que les régressions linéaires classiques, puisqu’elles s’intéressent à l’ensemble de la distribution conditionnelle de la variable d’intérêt et non seulement à la moyenne de celle-ci. En outre, elles peuvent être plus adaptées pour certains types de données (variables censurées ou tronquées, présence de valeurs extrêmes, modèles non linéaires...)[1]

Régression quantile
Type
Inventeur
Formule
Voir et modifier les données sur Wikidata

Historique

modifier

Roger Koenker et George Bassett ont développé le modèle de régression quantile en 1978. Dans leur approche, ils font l'hypothèse que les quantiles conditionnels ont une forme linéaire[2],[3].

En 1986, James Powell généralise la régression quantile aux variables censurées[4],[5],[Note 1].

Applications

modifier

En économie, Moshe Buchinsky utilise les régressions quantiles pour étudier l'évolution des inégalités salariales aux États-Unis[6].

Le modèle

modifier

On définit la fonction quantile conditionnelle de la variable aléatoire y conditionnellement au vecteur de variables explicatives x pour le quantile τ comme

la plus petite valeur de y telle que la fonction de distribution de y conditionnellement à x soit au moins égale à τ.

Formellement, on adopte la notation suivante[7] :

 

Si on se restreint au cas où les quantiles conditionnels sont des fonctions linéaires du vecteur de variables explicatives x, on définit[8] :

 

avec[Note 2]

 


L'estimateur des paramètres de la régression quantile est alors obtenu en minimisant l'équivalent empirique de la fonction objectif[9] :

 

Notes et références

modifier
(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Quantile regression » (voir la liste des auteurs).
  1. En statistiques et en économétrie, une variable censurée est une variable pour laquelle on n'observe pas les valeurs en dessous ou au-dessus d'un certain seuil. Par exemple, dans certaines enquêtes pour des raisons de confidentialité, on ne demande pas aux individus gagnant plus d'un certain seuil de revenu le montant exact de leur revenu. Dans ce cas, la variable obtenue est une variable censurée : on a la valeur du revenu pour tous les individus gagnant moins que le seuil et pour les autres, on sait simplement que leur revenu est supérieur à ce seuil (Buchinsky 1998).
  2. On note   la fonction indicatrice qui vaut 1 ou 0 selon que l'expression à l'intérieur des parenthèses est vraie ou fausse

Références

modifier
  1. Pauline Givord, Xavier D’Haultfœuille, « La régression quantile en pratique »
  2. (en) Roger Koenker et G. Bassett, « Regression quantiles », Econometrica,‎ , p. 33-50
  3. Angrist et Pischke 2008, p. 272
  4. (en) James Powell, « Censored quantile regression », Journal of Econometrics, vol. 32, no 1,‎ , p. 143-155 (lire en ligne, consulté le )
  5. (en) Moshe Buchinsky, « Recent Advances in Quantile Regression Models : A Practical Guideline for Empirical Research », The Journal of Human Resources, vol. 33, no 1,‎ , p. 88-126 (lire en ligne, consulté le )
  6. (en) Moshe Buchinsky, « Changes in the U.S. Wage Structure 1963-1987: Application of Quantile Regression », Econometrica, vol. 62, no 2,‎ , p. 405-458 (lire en ligne, consulté le )
  7. (en) Joshua Angrist et Jörn-Steffen Pischke, Mostly Harmless Econometrics : An Empiricist's Companion, Princeton University Press, , 1re éd., 392 p. (ISBN 978-0-691-12035-5), p. 270
  8. Angrist et Pischke 2008, p. 271, équation 7.1.2
  9. Angrist et Pischke 2008, p. 271-272

Voir aussi

modifier

Bibliographie

modifier

Articles connexes

modifier

Liens externes

modifier