Ouvrir le menu principal

Donnée (statistique)

information codifiée, figée et accessible
Page d'aide sur l'homonymie Pour les articles homonymes, voir Donnée.

Une donnée statistique est une information codifiée, figée et transmissible [1]

Sommaire

TypologieModifier

Une donnée statistique peut être une donnée à caractère quantitatif ou qualitatif.

Données quantitativesModifier

Les données quantitatives sont des données qui peuvent être mesurées (taille, poids…) ou repérées (température…)[2]
Exemples de propriétés physiques quantitatives : Le point de fusion, (par exemple, le fer fond à une température de 1 535 °C), le point d'ébullition, la masse volumique, la viscosité, la solubilité, la conductivité électrique, la conductivité thermique

Caractère mesurable et caractère repérableModifier

Lorsque le caractère d'une entité est mesurable, il est fait choix d'une unité de mesure appropriée. Chaque entité est alors définie par le nombre d'unités qu'elle contient. Exemple: Pour une population étudiée du point de vue de sa taille, si une personne mesure 1,75 m et si l'on choisit le centimètre pour unité de mesure, alors la valeur de sa taille est 175.

Lorsque le caractère est seulement repérable, des conventions déterminent une échelle numérique dans laquelle chaque entité a une position également définie par un nombre. Exemple: Si l'on étudie la répartition des températures dans une région selon l'échelle thermométrique centésimale, une ville dont la température est de 17 °C est repérée par le nombre 17.

Caractère discret et caractère continuModifier

Les caractères quantitatifs se subdivisent eux-mêmes en deux espèces :

Certains caractères ne peuvent prendre que des valeurs entières, par exemple le nombre des enfants d'une famille, le nombre de pièces d'un logement. Un tel caractère est qualifié de «discret».
La valeur d'autres caractères peut varier d'aussi peu que l'on voudra dans un intervalle fini ou infini, par exemple la taille d'une personne, le poids d'un enfant. Un tel caractère est dit «continu».

Données qualitativesModifier

Les données qualitatives sont des données auxquelles on ne peut pas attribuer une valeur ou une caractéristique.
Exemples de propriétés physiques qualitatives : La couleur, la texture, le goût, l'odeur, l'état et la ductilité.
Certains considèrent que toute donnée qui ne peut être qualifiée de quantitative est par défaut une donnée qualitative.

Données connues et données utilesModifier

Les données qui intéressent un statisticien correspondent à des objets ou des événements qui apparaissent, se transforment, représentent le présent puis le passé. De plus apparaissent de façon plus ou moins cachée et évidente de nouveaux éléments dont la connaissance serait nécessaire.
De ce fait, des données existantes et connues peuvent cesser d'apporter une information utile, tandis que des informations ont pu émerger qui représentent un caractère utile voire primordial, mais ne sont pas encore appréhendées et donc « connues » par l'analyste statistique. Le stock de données à disposition doit souvent être renouvelé de façon dynamique[3].

ProductionModifier

Problématique de la collecteModifier

Collecte directe : comptage et inventaireModifier

Collecte indirecte : enquête et échantillonnageModifier

Problématique de la mesureModifier

Article détaillé : Métrologie.

Problématique de la notationModifier

Article détaillé : Docimologie.

Problématique de l'évaluation et de l'estimationModifier

Problématique du traitementModifier

Les données brutes collectées peuvent faire l'objet de traitements utiles à des fins de représentation, d'analyse, ou d'interprétation. Les transformations opérées peuvent être de plusieurs ordres[4]

  1. Le regroupement des données, en cas de dispersion ou de ventilation trop importante : ainsi des données ventilées par Catégories socio-professionnelles détaillées (80 postes) peuvent être regroupées via des tables de conversion en 8 classes principales.
  2. Des changements dans la formulation des données : Dans un fichier listant une population d'individus, la date de naissance peut être convertie en âge courant.
  3. Les données brutes provenant de sources différentes peuvent être codifiées de manière différentes : ainsi le statut marital (marié, célibataire, veuf, divorcé, vie maritale) doit faire l'objet d'une recodification commune pour autoriser un traitement consolidé.
  4. Création de nouvelles données : Il s'agit de balayer les données brutes en les filtrant puis en les fusionnant et/ou en les regroupant selon des critères pertinents. Ceci pour donner lieu à la création de nouvelles données, propres à alimenter d'autres traitements, analyses ou représentations. Ainsi des données concernant l'historique journalier des ventes de tous les produits vers tous les clients peuvent être traitées pour établir un ensemble de données caractérisant les achats annuels de chacun des clients.

ReprésentationModifier

Notes et référencesModifier

  1. Jean-Dominique Warnier, L'organisation des données d'un système, Paris, Éditions d'organisation, coll. « Précis de logique informatique », , 138 p. (ISBN 978-2-708-10229-3, OCLC 1070641086)
  2. Albert Monjallon, Introduction à la méthode statistique, Paris, Vuibert, , 7e éd., 278 p. (ISBN 978-2-711-72009-5, OCLC 889260542)
  3. Jean-Dominique Warnier 1974.
  4. Andrea Micheaux, Marketing de bases de données, Paris, Ed. d'organisation, coll. « Pratique du marketing direct », , 282 p. (ISBN 978-2-708-12078-5, OCLC 633360462)

Voir aussiModifier