Discussion:Statistique

Dernier commentaire : il y a 1 an par 2A01:CB00:796:3C00:C94A:E98B:D697:6049 dans le sujet Étymologie
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons


Refonte de l'article modifier

cela vaudrait sans doute le coup, qu'en pensez-vous? Lehalle(discussion) 24 juin 2006 à 17:33 (CEST)Répondre

Bon c'est moi, qui ai invité Lehalle au grand nettoyage. En effet, je trouve que cet article part dans tous les sens.
  • Il me semble qu'il faudrait une intro style en:Statistics
  • Il faudrait un éclairage historique
  • Il faudrait savoir ce que chacun met derrière les mots : statistique mathématique, statistique descriptive, statistique inférentielle,
  • Il me semble que le développement des statistiques descriptives n'a rien à faire ici. Seul un résumé pour en indiquer l'esprit et un renvoi sur la page adhoc (complétée par le contenu de cet article) me semble convenir.
  • Le paragraphe sur le metier de statisticien me semble à sa place
  • Celui sur régression linéaire doit être déplacé dans l'article régression linéaire

...

Je propose que chacunes des 18 sections soient étudiées dans 18 sections de la page de discussions ou moins s'il y a concensus de nettoyage. HB 24 juin 2006 à 17:58 (CEST)Répondre

oui ! c'est le bazar !! Tes propositions me conviennent. Je rajoute qu'il y a souvent confusion entre les techniques de stats elles mêmes et leurs applications... Sylenius 24 juin 2006 à 22:20 (CEST)Répondre

Propositions modifier

Bon, j'ai mis en ligne un proposition d'introduction et un article historique, je pense développer un chapitre sur les champs d'application.

C'est sur la partie théorique que la réorganisation s'impose je verrai bien un grand chapitre

  • démarche statistique
    • recueil des données
    • analyse des données (résumé renvoyant sur statistique descriptive)
    • interprétation des données (résumé renvoyant sur ???? parlant d'estimateur, de test d'hypothèse et d'étude de corrélation

Mais c'est encre bien vague...HB 25 juin 2006 à 13:15 (CEST)Répondre

Refonte effectuée modifier

Bon, j'ai essayé de répartir les considérations sur les statistique descriptive dans l'article adhoc, de déplacer et d'incorporer dans l'article corrélation (mathématiques) toutes les considérations (en doublon) figurant dans l'ancien article., de regrouper les autres informations dans 4 branches recueil des données, traitement des données, statistique inférentielle, statistique mathématique.

Je crains cependant qu'il soit difficile de faire une répartition claire entre ce qui concerne les statistique inférentielles et et les statistiques mathématiques.

Il me semble nécessaire de créer un article sur estimateur (statistique) Dans la refonte, je n'ai pas su où mettre les informations suivantes, déposées de manière provisoire ici

  • Statistiques sur plusieurs variables

Lorsque l'on collecte des mesures de deux grandeurs X et Y, on obtient une série de couples de valeurs (xi,yi). Le modèle mathématique correspondant est celui de deux grandeurs X et Y. Dans cas, les valeurs xi sont des réalisations de la grandeur X, et les valeurs yi des réalisations de Y. On dit que X et Y sont dépendantes s'il existe un lien entre les valeurs prises par X et par Y (et on peut alors espérer, connaissant la valeur de X, prédire la valeur de Y). Concrètement, cela peut vouloir dire que l'une des deux grandeurs X ou Y influence l'autre, ou encore que X et Y sont influencées simultanément par un autre phénomène.

  • Classification

Classifier des données, c'est regrouper automatiquement des individus en groupes (des classes) homogènes (dont les membres se ressemblent beaucoup). L'idéal est que la dispertion des caractéristiques au sein d'un même groupe soient très proches, et que l'écart entre les membres de deux groupes différents soit grands.

- qualitative : exprimée par la une description naturelle du langage (ex: une couleur)

- quantitative : exprimée par des nombres (ex: une taille)

  • Séries temporelles
Fichier:Temperatures.png
Les variations de la température globale de la terre au cours des années constituent une série temporelle

Faire des statistiques sur une courbe constituée des réalisations successives d'une même variable au cours du temps, est une discipline qui a ses spécificités.

Un exemple: les variations de températures au cours du temps.

  • Compression statistique

Compresser des données, c'est trouver un ensemble de variables   qui contiennent presque autant d'information que les variables   (avec   beaucoup plus petit que  ). On utilise aussi le terme de réduction de la dimension.

Il s'agit de compression statistique lorsque la façon de quantifier l'information que l'on veut conserver, et la méthodologie de compression proviennent des statistiques.

L'Analyse en composantes principales est une méthode de compression, au même titre que l'Analyse en composantes indépendantes.

Ne pas hésiter à apporter des précisions et des corrections à cette refonte qui ne doit pas être l'oeuvre d'une seule personne. HB 6 juillet 2006 à 11:21 (CEST)Répondre

Un point de vue modifier

Point de vue de celui qui prend le train en marche, après pas mal de boulot de fait ! Je trouve la première partie de l'article pas mal, simplement la notion de statistique mathématique est difficile à justifier. Actuellement, les statistiques ou la statistique sont une branche des mathématiques appliquées. Que l'on fasse de l'inférentiel ou de la description, on passe par les mathématiques. Par exemple, l'analyse de données est essentiellement descriptive et l'analyse de variance surtout inférentielle mais elles reposent toutes les deux sur le modèle linéaire c'est à dire sur la géométrie des espaces vectoriels et l'algèbre. Cela se ressent particulièrement dans la partie 4 ou le §4.4 est finalement assez redondant avec les précédents. On pourrait le supprimer. Dans l'historique, faut pas oublier Fisher et Kolmogorov s'il n'y a que deux noms à rajouter. Si on veut charger d'avantage, on peut ajouter Rao et chez les anciens Spearman, Pearson et Galton. Dans les développements récents on pourrait indiquer le modèle linéaire généralisé, les GAM et les méthodes de régression non paramétrique (splines de lissages, régression locale,...) mais ce sera long de rédiger les articles... Pour mon édification personnelle, je croyais que les bayésiens et néobayésiens étaient résolument subjectivistes. Je me trompe ? Au total, je trouve l'article plutôt agréable à lire et qu'il donne une idée assez juste de la discipline. --Jspierre 1 septembre 2006 à 17:54 (CEST)Répondre

Bon article, proposition d'amélioration modifier

Bonjour,

Je trouve que l'article est bien, mais plutôt pour décrire les "statistiques mathématiques" et par ailleurs il s'insère parmi un certain nombre d'articles parfois ambigus parfois incomplets. Je m'explique.

Tout d'abord, le sens le plus commun du mot statistiques, c'est à dire "ensemble de données chiffrées ou plus généralement quantifiées", (c'est un essai je ne dis pas que c'est ce qu'il faut mettre), est absent de cet article ce qui ne me semble pas normal.

Ensuite, il y a, comme souvent, un problème de vocabulaire, mais il me semble qu'il est plus aigu qu'ailleurs parce que le mot "statistiques" signifie des choses différentes, mais cependant proches :

  • pour commencer le problème du pluriel.. et de l'article devant le mot: si "les statistiques" peuvent avoir a peu près tous les sens ci-dessous, ce n'est pas le cas de "des statistiques ou "la statistique" ou "une statistique"
  • "statistique(s)" me semble avoir au moins trois sens :
  1. le sens courant d'ensemble de chiffres
  2. le sens de la discipline mathématique
  3. dans la discipline mathématique, une fonction mesurable dans un modèle statistique

Je crois que ces différents sens peuvent faire l'objet d'un article d'homonymie.

Par ailleurs certains articles dans lesquels s'insère cet article posent problème :

  • l'ébauche de l'article "statistique" (au singulier) ne prend pas clairement le sens 3,et fait référence à l'article population
  • l'article "population" commence par le sens statistique au lieu du sens courant qui pourtant occupe tout le reste de l'article
  • l'ébauche de "statistique mathématique" n'oppose pas clairement, comme ça devrait l'être, statistique descriptive et statistique inférentielle, fait un retour sur les fonctions de répartition (qui appartiennent aux probabilités "pures"), passe du sens 2 au sens 3, ...
  • l'ébauche de "inférence statistique" peine à définir son objet.

Enfin l'article lui-même comporte des défauts, par exemple il ne me semble pas qu'un statisticien ait pour tâche de "surveiller d'autres travailleurs", ou encore l'approche du mot modèle devrait être plus complet.

La critique est facile, et je sais que je devrais essayer d'améliorer ça de mon côté, cependant une discussion préalable me semble une bonne idée. Voici mes propositions :

  • écrire un article (court) qui donne le sens courant de "statistiques"
  • écrire un article "modèle probabiliste", en tant que modèle mathématique aléatoire
  • compléter l'ébauche "inférence statistique" et y fondre les parties de "statistiques mathématiques" qui ne posent pas de problème. Appuyer fortement cet article sur "modèle probabiliste"
  • renommer "statistiques" en "statistique(s)_mathématique(s)" (en effet, selon moi les statistiques descriptives font partie des statistiques mathématiques)
  • créer une page d'homonymie où le problème du pluriel est évoqué.

Merci de vos suggestions et critiques. Bertrand 24 septembre 2007

Statistiques confirmatoires ? modifier

Désolé si la question semble bizarre, mais je n'ai jamais eu l'occasion d'étudier le sujet dans une autre langue que l'anglais. Parle t-on vraiment de statistiques confirmatoires ? Ne devrait-on pas plutôt parler de statistiques confirmatives ? --Sixsous  9 octobre 2007 à 16:48 (CEST)Répondre

Fusion Utilisation des statistiques en sciences sociales et Statistiques modifier

Bandeaux sur un des articles sans entrée ici. Jerome66|me parler 20 novembre 2007 à 13:35 (CET)Répondre

je demande la fusion car des stats ça reste des stats. l,article spécifique aux sciences sociales ne dit pas grand chose... La bibliographie n,a rien a voir avec le texte de l'article ... POur l'instant il me semble plus instructif de fusionner les 2 articles, Ainsi on retrouverait sous statistiques, l'usage en sc. sociales. Et peut- etre, quelqu'un daignera en faire un paragraphe utile ... Comme ca , les gens peuvent au moins comprendre ce que sont les stats--Idéalités (d) 24 novembre 2007 à 15:33 (CET)Répondre
  Jerome66|me parler 29 novembre 2007 à 21:08 (CET)Répondre

Fusion abandonnée entre Statistique et Statistiques modifier

Relance de la discussion

Bonjour à tous, je voudrais relancer cette discussion. Je voulais signaler que j'ai utiliser la page Interconnexions entre la théorie des probabilités et la statistique pour en faire une page d’homonymie et expliquer les différents termes. Sauf que je ne m'entend pas avec un utilisateur et que je me lasse des explications.

Pour moi il existe 4 noms communs : 1)une statistique, 2)des statistiques, 3)la statistique, 4) les statistiques (avec potentiellement des majuscules). A force de regarder des livres sur le sujet et les autres définitions sur les encyclopédies, j'en conclue que:

  1. une statistique = ensemble de données d'observation,
  2. des statistiques = le meme que 1) mais au pluriel,
  3. la statistique = meme que 1) mais avec de article défini ou l'activité qui consiste dans leur recueil, leur traitement et leur interprétation,
  4. les statistiques = meme que 1) mais au pluriel ou meme que 3) par abus de langage.

(voici quelques ouvrages ou references : [1],[2],[3],[4],[5],[6]). Je rajoute des liens vers des dictionnaires et encyclopédies : [p479 (non présente sur googlebook)]; "les probabilités et la statistique" Dress, p165 ;

Je suis donc pour garder Statistique pour la donnée statistique mais, il ne me parait pas possible d'utiliser Statistiques pour le domaine mathématique puisque ce terme me semble ne pas être le terme officiel. Je propose de le changer en "Statistique(mathématiques)" ou "Statistique(domaine)" ou "Statistique(science)" et toute autre proposition.

Je m'explique un tout petit peu plus pourquoi : des utilisateurs remplace (aveuglément) les liens vers le domaine scientifique par le nom de la page wiki (statistiques), de plus il est plus courant de parler des données statistiques que d'une statistique, du coup il n'apparait plus qu'un seul lien : "statistiques" sans distinction entre la science et la donnée.

J'espère que mes arguments vous suffisent pour une discussion. Cordialement. Ipipipourax (d) 17 janvier 2012 à 18:35 (CET)Répondre

Une discussion est en cours ici et est (j'espère bientôt) résolue. Donnez vos avis. Ipipipourax (d) 8 février 2012 à 20:00 (CET)Répondre
Je te lis avec du retard, et ai besoin d'éclaircissements : je ne comprends tout simplement pas la phrase suivante : « des utilisateurs remplacent (aveuglément) les liens vers le domaine scientifique par le nom de la page wiki (statistiques) ». Peux-tu l'éclaircir par un diff vers un tel remplacement si c'est pas trop difficile à retrouver ou un exemple fictif si tu te souviens d'en quoi ça consiste sans te souvenir d'où ça se trouve dans la jungle des historiques. Touriste (d) 5 mars 2012 à 14:41 (CET)Répondre
En fait c'est issu d'un conflit d'édition avec une IP ([7] par exemple), cette IP a effectué ce genre de changement pour plein d'articles. Elle a été bloquée 1 fois pour ca et bloquée depuis pour d'autres choses. Mais je trouve que la situation n'est pas claire sur wikipedia entre les deux termes statistiques et statistique, c'est pour ca que je relance l'ancienne discussion.

Renommages modifier

Pour résumer les différentes discussions à propos de deux renommages : cette page de domaine des mathématiques et la page une statistique en tant qu'outil.

  1. Une première discussion à été faite en 2008 (voir juste au dessus dan le menu déroulant),
  2. Discussion également en 2008 sur la pdd de statistique,
  3. Une autre discussion principalement entre Ambigraphe et Ipipipourax (moi-meme) sur le thé en 2012,
  4. Également une discussion sur la pdd de la palette proba stat,
  5. En parallèle en 2012, il y a eu cette petite discussion : ici.

Tout ceci pour se mettre d'accord sur les deux renommages :

  • Statistique pour le domaine des mathématiques (actuellement Statistiques),
  • Statistique (mesure) pour l'outil une statistique (actuellement Statistique).

Approuvé par Ipipipourax, Jackverr, PST, (pour l'instant). Ipipipourax (d) 2 mars 2012 à 14:51 (CET)Répondre

Corrections à faire ? modifier

Je ne suis pas d'accord avec la distinction qui est faite dans l'article entre "traitement des données" et "interprétation des données" et encore moins avec l'association "traitement" = "stat descriptives" et "interprétation" = "stat inférentielles" :

  • la démarche logique qui consiste à traiter les données puis les interpréter ne se retrouve pas entre stat descriptives et inférentielles. Les stat inférentielles ne sont pas systématiquement précédés de stat desctiptives, en particulier avec certaines approches de data mining (que certain assimile comme techniques stat, c'est un autre débat...) ou des approches non paramétriques.
  • Chacune de ces approche (descriptives et inférentielles) nécessite de partir des données brutes, de les traiter puis d'interpréter les résultats.


Je propose de modifier la structure en suivant la description des stat faite dans l'introduction du SAPORTA, c'est à dire une classification basée sur les questions que se proposent de répondre chaque approche :

  • Statistique exploratoire (ou descriptive) = "résumer l'information contenue dans les données"
  • Statistique inférentielle = "étendre les propriétés constatées sur l'échantillon à la population et de valider des hypothèses"
  • Modèles prédictifs = "prédire le comportement d'une variable en fonction de variables connues"
Ce programme me plait. J'avais proposé, sans succès, quelque chose d'analogue bien que beaucoup plus sommaire (voir Discussion_Portail:Probabilités et Statistiques#Critiques_generales). Il me semblait essentiel de distinguer clairement statistique descriptive et statistique mathématique (terme qui a correspondu à ce qu'on appelle aujourd'hui plutôt statistique inférentielle). J'ai été à l'origine de Statistique mathématique (voir la version archivée du 5 juillet 2005 à 10:06) qui présentait d'une manière qui se voulait simple et cohérente les notions d'échantillonnage, estimation, intervalles de confiance, tests d'hypothèse. Aujourd'hui je ne comprends plus de quoi cet article parle. Ma contribution sur ce sujet se réduit maintenant au paragraphe encore plus élémentaire Statistique descriptive et statistique mathématique du présent article qui, pour une raison incompréhensible, n'a pas été remanié.

En détaillant les différentes méthodes utilisées dans chaque approches :

  • Statistique exploratoire
    • Description variable par variable
    • Description par couple de variables
    • Description multidimensionnel
      • Classification : regrouper les individus en groupes homogènes
      • Méthodes factorielles : réduire le nombre de variables (analyse en composantes principales = combinaison linéaire de variables continues, analyse des correspondances = variables discrètes, analyse canonique = lien entre groupe de variables)
  • Statistique inférentielle
    • Estimation
    • Test statistique
    • Distribution d'échantillonnage
  • Modèles prédictifs
    • Régression = variable expliquée continue
      • Régression linéaire : variables explicatives continues
      • Modèle linéaire général : variables explicatives discrètes
    • Discrimination = variable expliquée discrète. Matrice de confusion. Sensibilité, spécificité, valeurs prédictives.
      • Apprentissage supervisé (apprentissage bayesien, arbre de décision...)
      • Apprentissage non supervisé


Quelques autres petits détails :

  • Les stat descriptives et mathématiques sont abordées dans les chapitres 3 "Statistique descriptive et statistique mathématique" et dans les chapitres 5.4 "Statistique mathématique" et 5.2 "Traitement des données"
  • C'est quoi les stat mathématiques ? l'introduction de l'article Statistique mathématique décrit les stat en général et la définition donnée dans l'article statistiques me semble pas claire : les stat mathématiques sont une branche des math, comme les stat. C'est quoi la différence entre les 2 ? Quels sont leurs domaines d'application ? A quelles questions répondent-elles ?
  • Il faudrait renommer le chapitre 5 "Les outils" ou "Les méthodes des statistiques" au lieu de "La démarche statistique. Et transférer le chapitre 5.5 "Statistique en sciences sociales" dans le chapite 2 "Domaines d'application" et le chapite 5.4 "Statistique mathématique" soit dans le chapitre 2 si c'est une application des stats (et le laisser dans le chapitre 5 si c'est bien un outil des stats)
  • La distinction est faites entre "la" statistique et "une" statistique mais pas entre "les" ou "la" statistique(s). Peut être ajouter un précision sur ce point (par exemple en introduction : "La statistique (ou les statistiques, les deux terminologies sont utilisé indifféremment) est l'ensemble des instruments et de recherches mathématiques permettant..."). De plus, il faudrait homogénéiser l'article en utilisant systématiquement l'une ou l'autre des terminologies.
  • La définition me semble incorrecte et incomplète. Incorrecte parce que ce ne sont pas forcement des "caractéristiques" qui l'on extrait des données, mais des informations représentant les données (je chipote un peu sur les termes :) ). Incomplet parce que les stats ont aussi pour objectif de prédire (stat inférentielles, modèles prédictifs) et de valider les modèles. J'aime bien la définition donnée en 4ème de couverture du SAPORTA : "(...) valider ou non des modèles préétablis, (...) extraire des connaissances à partir des données et une élément essentiel pour la prise de décision"

J'attends les commentaires avant de modifier l'article. Gbdivers (d) 10 mars 2009 à 10:22 (CET)Répondre

Ce programme me plait. J'avais proposé, sans succès, quelque chose d'analogue bien que beaucoup plus sommaire (voir Discussion_Portail:Probabilités et Statistiques#Critiques_generales). Il me semblait essentiel de distinguer clairement statistique descriptive et statistique mathématique (terme qui a correspondu à ce qu'on appelle aujourd'hui plutôt statistique inférentielle). J'ai été à l'origine de Statistique mathématique (voir la version archivée du 5 juillet 2005 à 10:06) qui présentait d'une manière qui se voulait simple et cohérente les notions d'échantillonnage, estimation, intervalles de confiance, tests d'hypothèse. Aujourd'hui je ne comprends plus de quoi cet article parle, particulièrement l'introduction. Ma contribution sur ce sujet se réduit maintenant au paragraphe encore plus élémentaire Statistique descriptive et statistique mathématique du présent article qui, lui, n'a pas été remanié. Jct (d) 11 mars 2009 à 14:51 (CET)Répondre
Je viens de survoler les articles sur WP:EN... A priori, si j'ai bien compris, sur WP:EN stat mathématique et stat inférentielle ne sont pas identique.
La stat mathématique ("mathematical statistics") est définit comme étant la "branche" théorique des stat ("which is concerned with the theoretical basis of the subject"), aussi appelé "stat exact" ("exact statistics") et s'oppose donc à aux stat appliqués ("applied statistics"). Elle peut s'appliquer au stat descriptive comme comme aux stat inférentiel (voir en:mathematical statistics).
La stat inférentielle, descriptive et prédictive forment des branches des stat et peuvent se recouper avec stat math et stat appliquée. Parfois, les stat prédictives sont regroupées avec les stat inférentielles (WP:EN n'a pas par exemple d'article "stat predictif" ou "modèle prédictif").
Personnellement, je préfère le terme "modèle prédictif" plutot que "stat prédictif" : nombreux algorithme d'apprentissage n'ont pas encore de modèle théorique stat comme base.
Pour completer la définition des stats : "Les statistiques (ou la statistique, les deux terminologies sont utilisées indifféremment) est l'ensemble des instruments et de recherches mathématiques permettant de collecter des données, de les modéliser et représenter, de valider ces modèles , d'étendre leurs propriétés sur la population générale et de prédire".
Gbdivers (d) 11 mars 2009 à 17:13 (CET)Répondre
Attention, il y a des méthodes dites exactes en statistiques qui n'ont rien à voir avec une distinction application/théorie : voir par exemple le test exact de Fisher et de façon générales les tests exacts. Nochnix (d) 5 mars 2012 à 10:06 (CET)Répondre

Statistique descriptive et statistique inférentielle modifier

J'ai viré l'association aberrante collecte = statistique descriptive et interprétation = statistique inférentielle. Les concepts à gauche et à droite de = n'ont rien à voir dans les deux cas. La collecte et l'interprétation sont deux étapes du travail du statisticien, la stat desc et la stat inf deux approches, avec un fond mathématique, et avec toutes deux la possibilité d'interpréter des résultats. Par exemple, l'ACP, méthode tout ce qu'il y a de descriptive, s'interprète évidemment. Nochnix (d) 5 mars 2012 à 10:03 (CET)Répondre

Doute sur une modif' modifier

J'ai un doute sur cette modif' :

https://fr.wikipedia.org/w/index.php?title=Statistique&diff=115046116&oldid=114173920

mal mise en page. et signée de surcroit...  

Je voulais corriger la mise en page, mais comme je n'ai aucune compétence pour juger de la pertinence du contenu, je préfère faire appel à un connaisseur du sujet pour qu'il puisse donner son avis.

Merci.

--Thierry613 (discuter) 16 mai 2015 à 10:56 (CEST)Répondre

 Merci de l'alerte. J'ai supprimé le hors sujet. Il existe un article (mode (statistiques)) qui détaille la notion. HB (discuter) 16 mai 2015 à 13:39 (CEST)Répondre

Étymologie modifier

Selon le CNRTL, le mot vient de l'allemand Statistik, dérivé de l'italien Statista, homme d’État. Mais selon https://de.wiktionary.org/wiki/Statistik#de, sourcé par https://portal.dnb.de/opac.htm?method=simpleSearch&cqlMode=true&query=idn%3D965096742, le mot viendrait du français Statistique au XVIIe siècle... 2A01:CB00:796:3C00:C94A:E98B:D697:6049 (discuter) 24 octobre 2022 à 13:29 (CEST)Répondre

Revenir à la page « Statistique ».