Utilisateur:El Caro/Amélioration d'articles

Étude statistique de quelques articles "améliorés" en mathématiques, ou tout du moins répondant davantage aux besoins des lecteurs.

Statistiques issues de http://stats.grok.se/

La méthode modifier

Elle consiste à essayer d'analyser l'influence de l'amélioration d'articles sur leur affluence. On part du principe que, si un article est "amélioré" (dans le sens : "répond aux demandes de son public"), son affluence s'accroît.

La grandeur utilisée est la médiane mensuelle, déterminée en ne tenant pas compte des journées à 0 visite. La médiane permet d'éviter certains biais (pic journalier sur 13 un vendredi 13) et de comparer les mois quel que soit leur nombre de jours.

Comparaison fr/en modifier

On peut comparer l'affluence d'un article par rapport aux autres WP. Des statistiques globales se trouvent ici : http://stats.wikimedia.org/FR/Sitemap.htm

Ainsi, on voit qu'un article sur WP:fr est vu en moyenne 0,684 fois par heure (soit 16,416 fois par jour). En anglais, les stats sont de 2,599 par heure, 62,376 par jour. En moyenne, un article en anglais est vu 3,8 fois plus qu'en français.

Quelques articles modifier

Périmètre modifier

Périmètre était une ébauche courant décembre 2008. J'ai essayé de l'améliorer en montrant la profondeur du concept tout en restant accessible : fin décembre 2008, l'article restant bref.

Voici l'évolution des visites de l'article, comparé à Superficie, concept similaire qui est resté à l'état d'ébauche :

mois périmètre superficie ratio pér./sup.
mars 2008 3090 13752 4,45
septembre 2008 2785 11908 4,28
octobre 2008 3154 12544 3,98
novembre 2008 3453 13120 3,8
décembre 2008 2487 10037 4,04
janvier 2009 5943 14969 2,52
février 2009 4765 12959 2,72
mars 2009 6470 15758 2,43
avril 2009 (au 18) 3297 8238 2,5
novembre 2010[1] 9475 10621 1,12

L'effet semble radical. Sauf hasard (à vérifier sur d'autres articles), il semble qu'améliorer les articles "de base", même légèrement, peut apporter beaucoup aux lecteurs.

La progression de mars 2008 à mars 2009 est de 109,4 % (la fréquentation a donc un peu plus que doublé), pendant que Superficie progressait de 14,6%.

Par comparaison, les statistiques de WP:en en mars 2009 étaient 19150 en:Perimeter et 82274 pour en:Area, soit un ratio de 4,3. Le ratio entre Périmètre et en:Perimeter était de 2,96. Les articles en anglais étant des ébauches, celui sur l'aire plus développé que celui sur le périmètre.

JLW : Tu es exactement dans les stats établis ici. Sans rien faire, un article qui s'adresse au premier cycle gagne 10% à 20%. Un bon travail sur l'article permet (si son benchmark initial est aux alentours de 100) de faire entre fois deux et fois trois (c'est néanmoins difficile à dépasser). On se rapproche alors de la performance allemande, pour l'attendre, il faut des articles connexes favorables.

Pour éviter certains biais, mieux vaut étudier la médiane. Le tableau est le suivant :

mois Périmètre Superficie Ratio Superficie/Périmètre
02 2008 81.0 466.0 5.75308641975
03 2008 113.0 517.0 4.57522123894
04 2008 84.0 486.0 5.78571428571
05 2008 97.0 439.5 4.53092783505
06 2008 66.0 343.0 5.19696969697
07 2008 34.0 222.0 6.52941176471
08 2008 37.5 229.0 6.10666666667
09 2008 94.0 402.0 4.27659574468
10 2008 107.5 440.5 4.0976744186
11 2008 114.0 438.0 3.84210526316
12 2008 85.0 318.5 3.74705882353
01 2009 166.0 463.0 2.78915662651
02 2009 181.0 469.0 2.59116022099
03 2009 218.0 521.0 2.38990825688
04 2009 211.0 480.0 2.27488151659
05 2009 238.0 558.0 2.34453781513
Comparaison des médianes
Évolution de périmètre :
02 2008
  81,0
03 2008
  113,0
04 2008
  84,0
05 2008
  97,0
06 2008
  66,0
07 2008
  34,0
08 2008
  37,5
09 2008
  94,0
10 2008
  107,5
11 2008
  114,0
12 2008
  85,0
01 2009
  166,0
02 2009
  181,0
03 2009
  218,0
04 2009
  211,0
05 2009
  183,5
Évolution de superficie :
02 2008
  466,0
03 2008
  517,0
04 2008
  486,0
05 2008
  439,5
06 2008
  343,0
07 2008
  222,0
08 2008
  229,0
09 2008
  402,0
10 2008
  440,5
11 2008
  438,0
12 2008
  318,5
01 2009
  463,0
02 2009
  469,0
03 2009
  521,0
04 2009
  480,0
05 2009
  414

Les ordres de grandeurs sont les mêmes, mais on remarque une évolution plus régulière, ce qui peut laisser penser que cette dernière méthode est meilleure : moins d'à-coups dus à des journées aberrantes.

  1. L'article superficie ayant été grandement modifié (notamment vis-à-vis de de aire (géométrie), la comparaison n'est plus pertinente.

Équation modifier

Équation était en ébauche jusqu'à mi-novembre 2008 (fruit d'un travail collectif, de nombreuses discussions avec Utilisateur:Jean-Luc W comme contributeur principal). Elle a été considérablement étoffée jusqu'à devenir un AdQ.

mars 2008 5332
septembre 2008 6552
octobre 2008 5679
novembre 2008 5879
décembre 2008 4282
janvier 2009 7265
février 2009 7109
mars 2009 7848

On constate une nette amélioration des statistiques à partir de janvier 2009, avec une augmentation de 47,2 % entre mars 2008 et mars 2009. En mars 2009, l'ébauche anglaise en:Equation a reçu 24141 visites, soit un ratio de 3,07 par rapport à l'AdQ français.

L'amélioration du contenu est indéniable, celle de la fréquentation aussi, mais moindre que pour périmètre, car l'article est de plus haut niveau et sans doute plus difficile à lire pour les collégiens/lycéens qui semblent constituer le gros des lecteurs de WP. Un article sur la résolution des équations dans R est sans doute à écrire.

L'affaire est plus difficile ici. L'article ne touche pas les lycéens, mais plutôt les universitaires du premier voir second cycle. Les lycéens étudient équation du second degré, ou encore zéro d'une fonction, mais pas l'équation dans sa globalité. La progression de WP est beaucoup plus chère, en moyenne elle est à 8% sur ce segment et à 36% pour celui des lycéens. En comptant le public de équation (mathématiques), on arrive à un 8..636. Faire beaucoup plus me semble difficile. Les allemands ne sont d'ailleurs pas beaucoup plus avancés, avec 10.347 Jean-Luc W (d) 19 avril 2009 à 21:20 (CEST)

Identités remarquables modifier

mois identités_remarquables identité_remarquable Médiane identités_remarquables+identité_remarquable
03 2008 52 10 62.0
04 2008 24 9 33.0
05 2008 18.5 6.5 25.0
06 2008 18.0 6.0 24.0
07 2008 9.0 4.0 13.0
08 2008 12.0 4 16.0
09 2008 49 104 153.0
10 2008 43.5 104.5 148.0
11 2008 38 100 138.0
12 2008 24.5 65.5 90.0
01 2009 39.5 75.5 115.0
02 2009 134 11 145.0
03 2009 143.0 12.0 155.0
04 2009 262.5 12.5 275.0

Factorisation modifier

à faire

Nombres complexes modifier

Données brutes à étudier pour cet article fondamental :

mois Nombre_complexe Nombres_complexes Médiane Nombre_complexe+Nombres_complexes
02 2008 379.0 19.0 398.0
03 2008 367.0 16.0 383.0
04 2008 321.0 19.0 340.0
05 2008 330.0 13.5 343.5
06 2008 303.5 15.0 318.5
07 2008 191.5 10.0 201.5
08 2008 159.0 8.0 167.0
09 2008 607.0 28.0 635.0
10 2008 547.5 21.5 569.0
11 2008 527.0 20.0 547.0
12 2008 441.0 15.5 456.5
01 2009 498.0 19.0 517.0
02 2009 447.0 18.0 465.0
03 2009 424.0 19.0 443.0
04 2009 256.0 85.0 341.0

Les écarts de juillet à septembre montrent un public scolaire : creux des vacances puis pic à la rentrée.

On constate une stagnation, voire une baisse. En comparant les données sur un an (février 2008 -> février 2009 et mars). L'ajout d'une "Approche vulgarisée des nombres complexes", qui est la principale modification depuis un an, n'a sans doute pas atteint son objectif.

Nombres réels modifier

mois Nombre_réel Nombres_réels Médiane Nombre_réel+Nombres_réels
02 2008 117.0 5.0 122.0
03 2008 124.0 5.0 129.0
04 2008 113.0 6.0 119.0
05 2008 97.0 5.0 102.0
06 2008 92.0 5.0 97.0
07 2008 65.5 3.0 68.5
08 2008 68.5 4.0 72.5
09 2008 318.0 10.0 328.0
10 2008 224.5 5.5 230.0
11 2008 191.0 5.0 196.0
12 2008 125.0 5.0 130.0
01 2009 156.5 5.0 161.5
02 2009 144.0 5.5 149.5
03 2009 147.0 7.0 154.0
04 2009 131.0 7.0 138.0

Exemple d'article de bonne tenue (AdQ) et peu modifié depuis le début des statistiques. Il peut servir d'étalon. Par exemple, comparons-le avec Nombre complexe (les articles au pluriel, peu significatifs, sont ignorés) :

mois Nombre_réel Nombre_complexe Ratio Nombre_réel/Nombre_complexe
02 2008 117.0 379.0 3.23931623932
03 2008 124.0 367.0 2.95967741935
04 2008 113.0 321.0 2.8407079646
05 2008 97.0 330.0 3.40206185567
06 2008 92.0 303.5 3.29891304348
07 2008 65.5 191.5 2.92366412214
08 2008 68.5 159.0 2.32116788321
09 2008 318.0 607.0 1.90880503145
10 2008 224.5 547.5 2.43875278396
11 2008 191.0 527.0 2.75916230366
12 2008 125.0 441.0 3.528
01 2009 156.5 498.0 3.1821086262
02 2009 144.0 447.0 3.10416666667
03 2009 147.0 424.0 2.8843537415
04 2009 131.0 256.0 1.95419847328

Groupe modifier

Sur l'article Groupe en anglais, passé "FA" (Article de qualité) début septembre 2008 :

mois Group_(mathematics) Group_(algebra) Médiane Group_(mathematics)+Group_(algebra)
02 2008 500.0 6.0 506.0
03 2008 472.0 6.0 478.0
04 2008 554.0 7.0 561.0
05 2008 550.5 7.0 557.5
06 2008 645.0 7.0 652.0
07 2008 480.0 6.0 486.0
08 2008 375.5 9.0 384.5
09 2008 574.0 12.0 586.0
10 2008 391.5 12.0 403.5
11 2008 584.0 10.0 594.0
12 2008 419.0 9.0 428.0
01 2009 445.0 9.5 454.5
02 2009 548.0 10.0 558.0
03 2009 524.5 10.0 534.5
04 2009 497.0 12.0 509.0

On ne constate pas d'amélioration de l'affluence. Voire même une baisse sur un an en comparant mars 2008/2009 et avril 2008/2009 !

Conclusion proposée : l'article, d'indéniable qualité, est trop touffu (suivant la théorie de Jean-Luc W). Il faudrait le recentrer sur la notion de groupe et évacuer la partie "théorie des groupes". Question : où commence la "théorie des groupes" quand on parle de groupes ?

En français (article traduit depuis l'anglais début 2009) :

mois Groupe_(mathématiques)
02 2008 72.0
03 2008 68.0
04 2008 61.0
05 2008 67.5
06 2008 61.0
07 2008 42.5
08 2008 46.5
09 2008 98.0
10 2008 94.0
11 2008 101.0
12 2008 77.5
01 2009 89.5
02 2009 86.0
03 2009 85.5
04 2009 90.0

Les statistiques (creux en juillet/août, pic septembre et après) semblent indiquer un public "scolaire". Le grand pic pourrait indiquer un public plus spécialement d'étudiants (période de partiels ?). Il y a une amélioration depuis la traduction, mais on aurait pu attendre mieux étant donné l'ébauche précédente. Le ratio entre article anglais/français est proche de 6, ce qui est dans la normale (pas étonnant, vu qu'il s'agit du même article seulement traduit).

Carré modifier

mois Carré
02 2008 134.0
03 2008 173.0
04 2008 159.0
05 2008 120.5
06 2008 108.0
07 2008 57.0
08 2008 67.5
09 2008 151.0
10 2008 166.0
11 2008 102.0
12 2008 134.5
01 2009 178.5
02 2009 185.0
03 2009 191.5
04 2009 170.0
05 2009 176.5
06 2009 197.0

Rectangle modifier

mois Rectangle
02 2008 87.0
03 2008 123.0
04 2008 106.0
05 2008 109.0
06 2008 63.0
07 2008 30.5
08 2008 33.5
09 2008 108.0
10 2008 111.5
11 2008 135.0
12 2008 87.0
01 2009 119.5
02 2009 126.0
03 2009 138.5
04 2009 123.0
05 2009 125.0