Projet:Les sans pagEs/Veille Fossé des Genres

Initiatives sur la diversité des contenus modifier

Projet:Les sans pagEs/Diversité dans 100 articles vitaux

Projet:Les sans pagEs/Diversité géographique des articles wikipédia consacrés à une femme

Diversité dans les professions modifier

https://public.paws.wmcloud.org/User:TomT0m/Categories%20metiers.ipynb

La question de l’évolution chronologique du nombre de bios de femmes sur les différentes versions linguistiques de wikipedia revient souvent sur le tapis. Asaf Bartov vient de publier des chiffres entre 2016 et 2020 : https://meta.wikimedia.org/wiki/User:Ijon/Content_gap#Data_as_of_February_2020

Dans wikipédia en français, on trouvait 481537 biographies d’hommes et 106250 biographies de femmes (18,08%), l'évolution depuis 2016 est de +2.48%. Pour quelques autres langues :

Texte de la légende
langue évolution (%)
Anglais 1.93
Catalan 4.20
Italien 1.10
Allemand 0.83
Espagnol 3.46
Français 2.48

Articles, sites et ressources modifier

Pourcentage de femmes parmi les articles biographiques modifier

Posté sur le bistrot du 23 février 2020 ici Wikipédia:Le Bistro/23 février 2020#Pourcentage de femmes parmi les articles biographiques

Voir aussi

On a tous entendu les accusations de sexisme concernant wikipédia, disant en gros “seulement 16% des articles biographiques concernent des femmes, c’est vraiment un boy’s club”. On a aussi tous entendu la réponse comme quoi wp ne fait que suivre les sources donc c’est pas “notre” faute. Pour essayer de mettre un peu de données objectives dans le débat, j’ai voulu voir comment ça évoluait selon les époques. J’ai donc, par le biais d’un script python et de la bibliothèque qwikidata, procédé à l’étude suivante.

 
Résultats globaux

D’abord, voici l’évolution du pourcentage de femmes dans les articles de wikipedia-fr (fr seulement), selon l’année de naissances des personnes. Par exemple ce graphe montre qu’on a des articles sur environ 2500 personnes nées en 1900 (figure du bas) et que 15% de ces personnes sont des femmes (figures du haut). On voit donc que le taux est d’environ 9% jusque 1850 puis commence a augmenter, et augmente plus nettement à partir des années 30. J’insiste sur le fait que c’est les années de naissance; Ca ne reflète donc la notoriété des personnes qu'avec un décallage. Les gens célèbres nés en 1930 sont devenus célèbres entre 1945 et 1990 (mettons, en gros). Le taux augmente de façon extreme après 2000, mais ce n’est pas un résultat significatif vu la faiblesse de l’effectif.

Il y a un biais possible concernant les années récentes, c'est que les personnalités de différentes catégories n'atteignent pas leur notoriété au même âge. Les athlètes nés en 1990 ont déjà un article sur wp (ou n'en auront jamais), car un athlète atteint le sommet de sa carrière vers 25 ans. Par contre, il y a sans doute plein de politiques nés en 1990 qui n'ont pas encore d'article, mais en auront un dans le futur. A 30 ans, un politique, c'est un gamin.

Justement, maintenant on va regarder par métier. Je regarde donc les catégories suivantes : auteur, scientifique, artiste, officier, athlète, personnalité politique. La requête wikidata est faite pour inclure les sous catégories (par exemple, “scientifique” inclut les biologistes, les chimistes, etc).

Sans grande surprise, c’est parmi les officiers qu‘il y a le moins de femmes, et parmis les auteurs qu’il y en a le plus. A noté qu’il y a très très peu d’athlètes sur wpfr nés avant 1860 environ. Les effectifs des athlètes décollent vers 1870… C’est sans doute à relier au fait que les premiers JO modernes ont eu lieu en 1896. Avant ça, très peu de sportifs devenaient des célébrités.

Deuxième série de mesure : voici les mêmes graphes mais par pays - pour dix pays. Attention ce ne sont pas les pays de naissance, mais "de nationalité". Une même personne peut donc avoir deux nationalités : Marie Curie est comprise dans mes stats pour la France, mais si j'avais fait le graphe pour la Pologne, elle y serait également. La requete est faite pour absorber les changements de régimes politiques de certains pays. Ainsi, dans les stats pour la Chine, sont inclus des citoyens de la dynastie Qing, de la République de Chine, et la République populaire de Chine.

Bisous Le fourbe et cruel Raminagrobis Miauler 23 février 2020 à 19:05 (CET)[répondre]

Le vrai indicateur est le % des bio féminines (d'africains etc..) par rapport au % de ces bios disponibles dans les sources notables. Très difficile à calculer, mais il y a toute raison de penser qu'il est au moins égal. Ce qui me fait dire cela c'est que à chaque fois que je tombe sur une bio féminine dans une source, je regarde si elle est dans WP, et je n'ai constaté aucun manque. --Jean-Christophe BENOIST (discuter) 23 février 2020 à 20:06 (CET)[répondre]
Ces remarquables graphiques m’appellent deux remarques : les sportifs sont de loin les personnalités les plus chroniquées. C’est donc dans ce domaine qu’il faut agir pour augmenter la proportion de biographies féminines. Il ne sert à rien de s’échiner à créer des biographies de femmes politiques ou de scientifiques si l’objectif est de faire monter la proportion globale car au final, ces domaines sont peu représentés, et le resteront. Je suis surpris par la faible proportion d’artistes femmes nées vers la fin du XIXe siècle car intuitivement, il me semble qu’il y a plus de chanteuses ou d’actrices notables que leurs collègues masculins dans la première moitié du XXe siècle, en France au moins. Cordialement MelAntipam (discuter) 23 février 2020 à 22:58 (CET)[répondre]

Merci pour ces informations et ce travail. Les données objectives on les connait elles sont repertoriées ici et . Ce qu'il nous manque c'est un outil mesurant l'évolution historique du gender gap depuis la création des différentes versions linguistiques de Wikipédia (donc l'évolution du pourcentage de biographies de femmes au cours des années depuis la création de Wikipedia et ce pour les différentes versions linguistiques car il y a des différences entre les langues). Là les chercheurs et chercheuses seraient vraiment utiles pour nous fournir les analyses chiffrées. Cela ne suffit pas, il nous faut pour le français des analyses plus fines sur le type d'articles produit par thèmes et la façon dont les articles sont reliés entre eux, de même que des analyses sur la visibilité et l'impact des articles produits, et des analyses sémantiques du langage utilisé.

Biais féministe ? modifier

 
Les courbes montrent toutes un profil à trois régimes :
(1) une montée en fréquence et en pourcentage jusqu'à un « âge canonique » ;
(2) une décroissance en fréquence et une montée en pourcentage entre cet âge canonique et la disparition des statistiques ;
(3) un âge au-dessous duquel le nombre d'articles par année de naissance n'est plus significatif (et les pourcentages non plus).
=> Pourquoi les femmes sont-elles systématiquement sur-représentées dans la deuxième tranche?
Réponse :Peut-être pour la raison indiquée par l'auteur ses stats : « Le taux augmente de façon extreme après 2000, mais ce n’est pas un résultat significatif vu la faiblesse de l’effectif. » ?

Les statistiques de Raminagrobis montrent un biais évident : pour toutes les courbes, le nombre d'articles fonction de l'année de naissance passe par un maximum puis s'effondre quand on dépasse l'âge minimal où ça a un sens d'être notoire ; et pour toutes les courbes, le pourcentage de femmes qui était plutôt croissant avec l'année (reflet d'un rééquilibrage croissant des rôles dans les jeunes générations) s'envole après ce maximum numérique  . Une première réaction de statisticien sera de dire qu'avant l'âge « canonique » (quel qu'il soit) les données sont nécessairement non représentatives par rapport au phénomène étudié, et donc qu'il faut les supprimer de la présentation, parce qu'elles reflètent alors quelque chose d'une autre nature. Mais en soi, ce quelque chose d'une autre nature est intéressant, la surreprésentation féminine veut dire en clair que avant l'âge minimum un personnage est intéressant non pas parce qu'il est dans cette catégorie, mais parce que c'est une jeune femme dans cette catégorie  . Ca, c'est du sexisme pur jus. Les statistiques de Raminagrobis montrent un biais évident en « faveur » des femmes, et c'est pas glorieux : ne sont elles que des bêtes de foire?   Michelet-密是力 (discuter) 24 février 2020 à 08:24 (CET)[répondre]

Bof bof. Pour les personnes très jeunes, on voit que la part des femmes oscille entre 100 % et 0 %, sur des échantillons très faibles (de 1 à 5 articles). Donc le phénomène est aussi vrai pour les hommes. Si un vrai statisticien est capable d'en déduire quoi que ce soit de sensé, je lui tire mon chapeau. --Pa2chant.bis (discuter) 24 février 2020 à 08:41 (CET)[répondre]
Bof bof bof. C'est vrai quand le nombre d'articles est quasi-nul, on voit la courbe des pourcentages hachurer l'espace et toucher le zéro. Mais avant ce seuil évident de « non significatif », la courbe de pourcentage monte abruptement et sans toucher le zéro, c'est bien une sur-représentation des femmes dans ce secteur « avant l'âge canonique mais déjà en nombre significatif ». Michelet-密是力 (discuter) 24 février 2020 à 10:30 (CET)[répondre]
Sans le moindre rapport avec le féminisme, il existe de nombreux sports où les femmes arrivent à haut niveau à un plus jeune âge que les hommes. Cela peut être un élément d'explication, ou pas (je n'ai pas du tout cherché à vérifier le ratio sportives/sportifs par âge dans WP). Marc Mongenet (discuter) 24 février 2020 à 11:04 (CET)[répondre]
PS : Après avoir regardé les graphes ci-dessus (oui, c'est mal de poster avant de tout lire, ça m'apprendra), il semble effectivement que mon intuition était bonne et que les athlètes expliquent tout. Marc Mongenet (discuter) 24 février 2020 à 11:08 (CET)[répondre]
Sans compter les actrices porno, dont on n'a pas les stats…--Pa2chant.bis (discuter) 24 février 2020 à 11:17 (CET)[répondre]
Y'a aussi un petit nombre de personnes qui ont un article dès leur naissance, sans rien avoir fait de particulier, et quelque soit leur genre : comme lui, lui, elle, lui, ou encore elle... Pour les années postérieures à 2010, on n'a que des princes et princesses. Le fourbe et cruel Raminagrobis Miauler 24 février 2020 à 11:26 (CET)[répondre]

Biais contenu modifier

Nombre de liens renvoyant à des femmes dans les article modifier

Bandeau indiquant un biais de genre modifier

voir et Modèle:Biais de genre. Projet:Les sans pagEs/Annonces automatiques#Biais de genre

Quantification modifier

Contexte modifier

Sujet:W1wi8b13cj6zxmmh et Sujet:Wn1jb5a35rru7nkd fin 2021

Pages de projets modifier

https://www.wikidata.org/wiki/User:PAC2/Gender_diversity

Outils modifier

voir https://observablehq.com/@pac02/explore-gender-diversity-in-a-single-wikipedia-article

Nombre de contributrices modifier

Le biais dans les contenus et le biais dans le nombre de contributrices sont des phénomènes différents - même si de toute évidence il y a des liens de causalité - de fait parmi les gros contributeurs seuls 5% sont des femmes (cf discussions ici et la différence en terme de rendu a été démontrée récemment par le fait que les rares contributrices ont voté différemment lors du sondage sur l'écriture inclusive (source : bilan du sondage ici ): Les contributeurs de Wikipédia ont la possibilité mais pas l'obligation, et beaucoup ne le font pas de déclarer un genre dans leur « préférences utilisateur ». Les résultats du sondage ont été analysés en fonction de ce paramètre.

Question 1 : utilisation de termes englobants modifier

Vote des 38 contributrices autodéclarées :

P T C

Vote des 159 contributeurs masculins autodéclarés :

P T C N

Vote de l'ensemble des 374 contributeurs, tout genre confondu :

P T C N

Question 2 : double flexion modifier

Vote des 37 contributrices autodéclarées :

P T C

Vote des 146 contributeurs masculins autodéclarés :

P T C N

Rappel du vote de l'ensemble des 332 contributeurs, tout genre confondu :

P T C N

Question 3 : féminisation rarement usitée des métiers et fonctions modifier

Vote des 41 contributrices autodéclarées :

P T C

Vote des 147 contributeurs masculins autodéclarés :

P T C N

Rappel du vote de l'ensemble des 349 contributeurs, tout genre confondu :

P T C N

Question 4 : accord de proximité modifier

Vote des 34 contributrices autodéclarées :

P T C

Vote des 139 contributeurs masculins autodéclarés :

P T C N

Rappel du vote de l'ensemble des 310 contributeurs, tout genre confondu :

P T C N

Question 5 : mots valises masculins-féminins modifier

Vote des 33 contributrices autodéclarées :

P T C N

Vote des 149 contributeurs masculins autodéclarés :

P T C N

Rappel du vote de l'ensemble des 330 contributeurs, tout genre confondu :

P T C N

Question 6 : formulations non binaires modifier

Vote des 39 contributrices autodéclarées :

P T C N

Vote des 139 contributeurs masculins autodéclarés :

P T C N

Rappel du vote de l'ensemble des 316 contributeurs, tout genre confondu :

P T C N

Articles modifier

Mentions sur le bistrot et ailleurs (marronier) modifier

*[[Wikipédia:Le Bistro/5 mars 2020#[Billet de blog] Biais de genre : Wikipédia aussi imparfaite que la société]]