Wikipédia:Le Bistro/17 février 2023

Dernier commentaire : il y a 1 an par Corty2 dans le sujet ChatGPT, WP et WD
Sous-pages
23 24 25 26 27 28 29
30 31
janvier / février
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28
février / mars
1 2 3 4 5
Version japonaise du jeu de l'élastique,
temple Kōzan-ji de Kyōto, v. 1150.

Figaro, le chat de GePeTo, est un peu menteur comme Pinocchio et ChatGPTo. À propos, ce dernier ne semble pas avoir le sens de l'humour, selon le Canard, mais les deux Pieds nickelés du web l'ont poussé dans ses limites, et... [en anglais, 1 h 12.

Aujourd'hui, dans Wikipédia modifier

Le 17 février 2023 à 23:55 (CET), Wikipédia comptait 2 494 652 entrées encyclopédiques, dont 2 076 articles ayant obtenu le label « Article de qualité » et 3 824 articles ayant obtenu celui de « Bon article ». Pour améliorer le contenu de Wikipédia, nous vous proposons de travailler les articles ci-dessous. N'hésitez pas à ajouter des liens internes, des images, des notions encyclopédiques ou simplement corriger les fautes d'orthographe. Demandez de l'aide en cas de doute ou visitez la page des premiers pas des contributeurs.

Articles remarquables et labels modifier

  Contrôlez, relisez, améliorez et actualisez si besoin ces pages labellisées un 17 février :

Pommes à croquer modifier

Articles à améliorer modifier

Articles à créer modifier

Suivi des débats d'admissibilité modifier

Anniversaires modifier

(Pour que l'on n'oublie pas le vôtre…)

De l'importance de Wikipedia pour ChatGPT modifier

Bonjour. Pardon si cela a déjà été signalé, mais je recommande l'article de Pierre-Carl Langlais, ChatGPT : comment ça marche ?, Sciences Communes (7 février 2023) (un Carnet Hypothèses). On y parle beaucoup de Wikipedia. --Toyotsu (discuter) 17 février 2023 à 08:55 (CET)Répondre

Merci pour le partage. Je signale juste pour les plus jeunes que Pierre-Carl Langlais est un contributeur de longue date de Wikipédia en français, même s'il se fait discret ces temps-ci. Goodshort (discuter) 17 février 2023 à 10:01 (CET)Répondre
Je confirme :) Et je prépare une suite sur la fiabilité de chatGTP qui ira plus loin dans la comparaison avec wiki (sur le rapport au consensus scientifique, au principe de moindre de surprise, aux sources). Alexander Doria (d) 17 février 2023 à 16:18 (CET)Répondre
Bonjour,
J'ai exceptionnellement apprécié cet article : le bon niveau de profondeur, le recul historique, le bon rapport importance/longueur. Il y a longtemps que je n'avais lu quelque chose aussi attentivement.
J'ai commencé à me résumer ce contenu, et je réagis opportunément au mot fiabilité...
Je crois comprendre que l'objectif est de donner satisfaction, et uniquement celui-là. La satisfaction est définie (par moi) comme une adhésion toute subjective à un produit verbeux produit automatiquement en interaction avec le consommateur. Cette adhésion est bien sûr d'autant plus probable qu'elle mobilise des éléments les moins indubitables, et dans une forme la plus conforme aux standards. Les connaissances sont donc à la fois les piliers de l'adhésion, puis les pieux sur lesquels peut être arrimer n'importe quoi qui aille vers un supplément d'adhésion. Si le niveau de satisfaction n'est pas atteint, le système augmente le volume ou la sophistication du produit : il ne cherche en rien à augmenter les piliers, donc la fiabilité. Seule la crédibilité est travaillé, pas l'accès à un progrès de la pensée vers la vérité. L'article m'apprenant qu'il n'y a pas de prise en considération de texte comme unité de connaissance, le système ne répond que par computation, itération, et de plus au plus près de la pensée unique en quelque sorte. Il y a manipulation et trituration au sens littéral : 1. de ce qui fait sens (réseau sémantique) ; 2. de ce qui respecte la vision du monde commune (encyclopédie) ; 3. de tous les types de dimension cosmétique (conversationnel et séduction finale). L'IA fait ainsi du fortuit, du consensuel et du bien-séant humain de l'objectif, sans à aucun moment distinguer ce qui pourrait prétendre l'être un peu (objectif = vérité) de ce qui n'est que du remplissage de séduction subjective : tout est sur le même plan, plan flottant gentiment dans les airs au niveau du moyennement probable, et "à laisser" éventuellement jusqu'à ce qu'on décide de le prendre éventuellement.
Le concept de fiabilité est bien faible vu ainsi. L'IA est de la fébrilité à ce stade, mais même en se perfectionnant beaucoup, je ne vois pas comment la fragilité de ses bases pourrait être corrigée et que le curseur cesse d'être coincé sur le côté subjectivité, même avec de gros morceaux de Wikipédia dedans.
C'est une question. TigH (discuter) 17 février 2023 à 19:56 (CET)Répondre

┌─────────────────────────────────────────────────┘
Doucement doucement... Chat GPT est encore capable de nous faire écrire de grosses conneries. J'ai fait quelques tests. Je vous donne un exemple?

Voici un "dialogue" (Khof...Khof... Rhheuuu...) que j'ai eu avec ce truc au sujet d'un débat d'admissibilité : Doha Moustaquim en est le thème (je rappelle que je ne suis pas suppressioniste).

  • Moi :Doha Moustaquim, née le 23 janvier 1999[ à Casablanca est une réalisatrice marocaine. À 22 ans, elle tourne son premier film, Bye bye la France
  • le chat : Je peux vous donner quelques informations sur Doha Moustaquim et son premier film "Bye bye la France". Doha Moustaquim est une réalisatrice marocaine née le 23 janvier 1999 à Casablanca. Elle a étudié le cinéma à l'Institut des Arts de Casablanca avant de partir en France pour poursuivre ses études. En 2021, à l'âge de 22 ans, elle a réalisé son premier long métrage intitulé "Bye bye la France". Le film raconte l'histoire de deux jeunes marocains, Adil et Karima, qui décident de partir en France pour trouver un meilleur avenir. Mais leur expérience est loin d'être idéale et ils sont confrontés à de nombreux obstacles, notamment le racisme et la précarité. "Bye bye la France" a été présenté en avant-première au Festival international du film de Marrakech en décembre 2021, où il a reçu un accueil positif. Le film aborde des thèmes importants tels que la migration, l'identité et la discrimination, et a été salué pour sa sincérité et son réalisme.

J'ai donc fait un tour sur google et l'information est erronée. Reprise du dialogue :

  • Moi : C'est faux.
  • Le chat : Je suis désolé si mes informations sont inexactes. Pouvez-vous me dire ce qui est faux afin que je puisse corriger mon erreur et vous fournir les informations correctes?
  • Moi : Oui : j'a copié collé sur google la Phrase suivante : "Bye bye la France" a été présenté en avant-première au Festival international du film de Marrakech en décembre 2021, où il a reçu un accueil positif.
  • Le chat : Je m'excuse pour la confusion. C'est en effet une erreur de ma part. "Bye bye la France" n'a pas encore été présenté en avant-première au Festival international du film de Marrakech car il n'a pas encore été officiellement diffusé. En réalité, "Bye bye la France" est un film qui est actuellement en post-production, ce qui signifie qu'il est en train d'être finalisé avant sa sortie officielle. Il a été produit par la société de production marocaine "Les Films de l'Heure Bleue" en collaboration avec la société française "Les films de l'autre cougar". Le film a été tourné au Maroc et en France. Je suis désolé pour toute confusion que j'ai pu causer. Merci de m'avoir corrigé.

Bof... Bof... Bof.... Bonne soirée à tous. --Bastien Sens-Méyé 17 février 2023 à 20:13 (CET)Répondre

Avez-vous essayer de lui demander pourquoi les œufs de vache sont plus gros que les œufs d'autruche ? La réponse pourrait vous surprendre  --Remy34 (discuter) 17 février 2023 à 22:43 (CET)Répondre
Vu sur Discord. J'ai bien rigolé. Bastien Sens-Méyé 18 février 2023 à 09:46 (CET)Répondre
... ou bien : Quelle est la différence entre un chat et un chat ? S'il répond : Mes vibrisses vont très bien, merci, on peut considérer qu'il s'est trahi. Félinement, Manacore (discuter) 17 février 2023 à 22:52 (CET)Répondre
Mais s'il passe impeccablement à 40 degrés, c'est le chat machine. Cdlt, --Warp3 (discuter) 18 février 2023 à 01:35 (CET).Répondre

Pages en inclusion modifier

Bonjour,

J'ai remarqué que la plupart des articles sur les "grands" clubs de hockey suisses ont des pages distinctes pour leur effectif (exemples : Effectif actuel du Genève-Servette Hockey Club, Effectif_actuel_du_Hockey_Club_Viège ; il y a même une catégorie : https://fr.wikipedia.org/wiki/Catégorie:Effectif_actuel_d%27%C3%A9quipe_du_championnat_de_Suisse_de_hockey_sur_glace), alors que ce n'est pas le cas pour les clubs de football (ex. : Football Club Sion#Effectif professionnel actuel).

J'imagine que l'intérêt d'avoir une page distincte est de pouvoir plus facilement retrouver l'historique, mais je voulais avoir des avis sur l'opportunité d'avoir une page distincte en inclusion pour ce genre de cas ou non.

Merci. --Sherwood6 (discuter) 17 février 2023 à 08:59 (CET)Répondre

J’avais déjà signalé cette anomalie en 2017 et quelqu’un d’autre en 2014. — Thibaut (discuter) 17 février 2023 à 09:25 (CET)Répondre
En effet, on est loin des bonnes pratiques. Mais comme la discussion de 2017 le montre bien, celles-ci n'existent pas formellement, donc chacun peut faire ce qu'il veut...
Idéalement, je pense qu'il faudrait le transformer en modèle (on inclut des modèles), ou créer enfin un espace Annexe, comme dans d'autres versions linguistiques de Wikipédia. Daehan [p|d|d] 17 février 2023 à 09:37 (CET)Répondre
Plutôt pour de transformer tout ça en modèles également, si cette page n'a pour utilité que d'être utilisée en inclusion dans l'autre article. Charlestpt (discuter) 17 février 2023 à 09:52 (CET)Répondre
J'avais également signalé cette anomalie ici Discussion:Effectif actuel des Canadiens de Montréal, en suggérant de mettre en place plutôt une liaison article principal/article détaillé, mais un membre du projet Hockey s'y était opposé. C'est à ma connaissance le seul projet où ce type d'inclusion est réalisée. -- Speculos 17 février 2023 à 10:07 (CET)Répondre
Ce devrait effectivement être des modèles, comme il en existe dans d'autres articles sur des thématiques très diverses (de loin pas que le sport, que ce soit pour des tableaux, des graphiques ou autres). SenseiAC (discuter) 17 février 2023 à 14:16 (CET)Répondre
Idéalement, on cherche un vrai consensus qui satisfait tout le monde. La seule personne qui semble s'opposer à la mise en modèle de ces pages est @Supertoff : je le notifie donc pour qu'il prenne connaissance de cette discussion et donne son avis. Daehan [p|d|d] 17 février 2023 à 16:58 (CET)Répondre
Le mot "actuel" m'a toujours semblé assez antinomique avec le concept d'article encyclopédique. Le chat perché (discuter) 17 février 2023 à 16:58 (CET)Répondre
C'est parce que tu t'imagines encore une encyclopédie du XXe siècle. Marc Mongenet (discuter) 17 février 2023 à 17:57 (CET)Répondre

Pascal Boniface modifier

J'ai visionné hier sa vidéo et aujourd'hui je viens de voir sur ma page qu'on m'a interrogé sur ce point. De plus, j'ai vu qu'il y avait un conflit sur son artice. J'aimerais dire ma position sur cet article. Tout d'abord il est extrêment difficile de participer à un article sur les sujets d'actualités car il faut faire abstraction de son point de vue dans des proportions très fortes. Honnêtement parfois je m'en sens incapable c'est pourquoi je n'interviens généralement pas sur ces articles. Toutefois j'aimerais tracer les défauts généraux, que reflètent bien cet article. On favorse trés souvent les sources polémiques portant sur des faits qui relèvent plus de la mesquinerie qu'autre chose. Par exemple, sur Jancovici, de mémoire son article était plutôt négatif et basé sur Reporterre, quand récemment dans le Monde il a bénéficié d'un article plutôt élogieux. D'autre part, on veut donner à ces gens une cohérence et une vision globale, qu'ils n'ont pas. C'est ainsi que l'article sur Pascal Boniface se focalise sur ces positions. un défaut qu'ont en général nos articles sur les hommes politiques, en oubliant que les positions d'un homme politique sont trés variables. Bref on veut leur donner une cohérence idéologie qui, hors des cas de grands politiques (Richelieu, Tatcher, etc..) ils n'ont pas. Concernant Boniface, ce n'est pas un politique même s'il est présent dans les médias. Aussi, il conviendrait de ne pas trop se focaliser sur ces points et si on le fait, de se baser sur des sources de synthèse globale, et pas d'attaques ponctuelles. Autre problème, celui de mesurer l'influence de la personne à qui est dédié l'article. En effet, être médiatique ne veut pas dire qu'on a une influence quelconque sur les politiques suivies. Dans ce cas, je ne vois pas pourquoi, sauf si l'on veut participer à des conflits de spécialistes, en quoi il faudrait insister sur ces points. --Fuucx (discuter) 17 février 2023 à 09:17 (CET)Répondre

Modèle à franciser ? or not? modifier

Je suis tombé sur Modèle:Palette Chansons enfantines et je me demande s'il y a vraiment quelque chose à conserver là-dedans. Une palette complètement centrée sur des références anglo-saxonnes, parsemée de liens rouges... Je concède que le sujet aurait du potentiel in French mais dans l'état actuel une suppression pourrait être la solution la plus charitable. --Charlik (discuter) 17 février 2023 à 09:15 (CET)Répondre

Juste blanchir et mettre seulement ce qu’il y a dans Catégorie:Chanson enfantine. — Thibaut (discuter) 17 février 2023 à 09:29 (CET)Répondre
Non et non. Pourquoi voulez-vous supprimer des articles comme Frêres Jacques, Jeu du mouchoir etc.. ? La Palette des chansons enfantines est un moyen commode pour naviguer Mike d 17 février 2023 à 11:40 (CET) note : il n'y a qu'à CREER en français au lieu de détruire ce qui existeRépondre
Je laisse d'éventuelles modifications à qui voudra bien s'en charger. Quatre liens français justifient-ils dans l'état actuel (pas l'avenir radieu envisageable que nous appelons tous de nos vœux) le maintien d'une palette anglaise ? Charlik (discuter) 17 février 2023 à 11:47 (CET)Répondre
Idée: créer sur un portail (Portail:Enfance, Portail:Musique/Chanson, autre), un tableau avec toutes les chansons enfantines admissibles, si elles ont une aire géographique/linguistique ou pas, et leur genre (canons, berceuses, etc). A partir de là, voir les découpages pertinents (palette:Chanson enfantine anglophone ? palette:Berceuse ? etc) et les faire. Léna (discuter) 17 février 2023 à 14:10 (CET)Répondre
Et il n'y a même pas Pirouette cacahuète dont l'histoire vaut la peine d'être lue  . Pourtant, il y a de quoi faire : Catégorie:Chanson enfantine en français. Pour les chansons enfantines en anglais, une catégorie suffirait avec un lien sur la palette. —  adel   17 février 2023 à 16:27 (CET)Répondre
Finalement devant la participation absente j'ai repris le modèle en mettant les liens rouges anglais dans la catégorie "bidules anglais". J'incite tous les participants à la discussion (  Mike Coppolano) à « créer ». Charlik (discuter) 18 février 2023 à 17:47 (CET)Répondre

Activité d'agences d'intelligence économique sur Wikipédia au service du Qatar modifier

Bonjour à toutes et à tous,

J'ai filé un coup de main au Monde — qui publie en ce moment une série d'enquêtes sur la désinformation intitulée « Story Killers » avec Radio France et d'autres médias du consortium Forbidden Stories — concernant les activités d'agences d'intelligence économique sur Wikipédia au bénéfice du Qatar : Damien Leloup, Florian Reynaud et Rémi Dupré, « La France, théâtre d’opérations d’influence pro- et anti-Qatar », Le Monde,‎ (lire en ligne).

Les informations obtenues par Le Monde et Radio France et complétées par les recherches effectuées sur Wikipédia — avec l'aide notable de @Pa2chant.bis et l'appui technique de @0x010C et @Arkanosis — n'ont pas pour intérêt premier de détecter de nouveaux comptes actifs sur l'encyclopédie : elles lèvent en revanche le voile sur l'activité, les opérateurs et les commanditaires de comptes pour la plupart déjà identifiés et bloqués entre 2020 et 2022.

En résumé, il apparaît que l'agence tunisienne UReputation est la détentrice des comptes utilisateurs de l'« agence inconnue numéro 2 » identifiés et bloqués en 2020 ; à l'époque, il n'avait pas été possible d'identifier l'agence (d'où le nom de code que je lui avais attribué). Ces comptes sont notamment intervenus pour le compte du Qatar.

Cette agence revendique également des contributions opérées par le compte Paragonio (d · c · b), détecté à l'été 2022 et que nous avions alors rattaché à Avisa Partners (qui a aussi eu pour client le Qatar, et ce concomitamment). Après réexamen de l'ensemble des données, le doute demeure quant à son affiliation : Pa2chant.bis et moi privilégions néanmoins la thèse initiale d'un rattachement à Avisa Partners, en dépit des affirmations d'UReputation.

Un compte-rendu plus approfondi de ces investigations est disponible sur la pdd du projet:Antipub.

En dépit de la relative ancienneté des faits, une relecture de certains articles par la communauté est probablement nécessaire.

Jules* discuter 17 février 2023 à 09:34 (CET)Répondre

Merci beaucoup @Jules* et @Pa2chant.bis. L'analyse sur la page du projet Antipub est vraiment super ! HistoVG (discuter) 17 février 2023 à 12:05 (CET)Répondre
Merci Jules* et Pa2chant.bis   et aux autres contributeurs impliqués, --Pierrette13 (discuter) 17 février 2023 à 19:36 (CET)Répondre
sacré coup de filet, merci @Jules* et @Pa2chant.bis pour ce travail d'investigation ! Skimel (discuter) 18 février 2023 à 22:13 (CET)Répondre

Faire vérifier l'identité d'un compte de façon globale modifier

Bonjour aux piliers,

et désolé d'intervenir sur une question qui ne touche pas directement Wikipédia. Je désirerais savoir comment faire vérifier l'identité d'un compte de façon globale... en faisant apposer ce modèle sur la page utilisateur globale sur Metawiki, par exemple. Je présume que ce serait plus efficace que de devoir demander une vérification locale à chaque fois...

Bien à vous tous ! Maxime Ravel (discuter) 17 février 2023 à 10:00 (CET)Répondre

Demander à un agent VRTS qui peut vérifier le ticket d'ajouter lui-même le numéro de ticket sur la page d'utilisateur sur Meta (si c'est l'utilisateur qui le fait lui-même, un agent peut ne pas pouvoir vérifier par lui-même si le courriel est dans une boîte à laquelle il n'a pas accès, au hasard celle de Wikipédia en anglais pour un agent francophone…). — Thibaut (discuter) 17 février 2023 à 10:13 (CET)Répondre
Merci beaucoup Thibaut ! Du coup, deux questions subsidiaires : (i) peut-on s'adresser à un agent en particulier, et si oui, où peut-on en trouver la liste ? (ii) Dans le cas contraire, quelle est l'adresse générique où écrire ? Amicalement, Maxime Ravel (discuter) 17 février 2023 à 10:51 (CET)Répondre
@Maxime Ravel la lste est ici pour les francophones : Wikipédia:Agent EBRC. Le chat perché (discuter) 17 février 2023 à 17:15 (CET)Répondre
  Le chat perché : : miaourci bien ! Maxime Ravel (discuter) 17 février 2023 à 18:22 (CET)Répondre
Mais je n'ai toujours pas compris si l'on pouvait se permettre de contacter lesdits agents individuellement... ? Maxime Ravel (discuter) 17 février 2023 à 18:23 (CET)Répondre
@Maxime Ravel oui c'est possible mais par MP(mail) par confidentialité vu le sujet. Le chat perché (discuter) 18 février 2023 à 13:30 (CET)Répondre

Image parasite modifier

Salut. Comment se fait-il qu'un lien interne dans un texte affiche une image qui n'est pas présente dans la page-cible de ce lien ? A plus forte raison quand l'image est inappropriée ? Par exemple, le cas de La Tourette. =>   Arpitan (discuter 17 février 2023 à 11:58 (CET)Répondre

Bonjour,
c’est à cause d’un vandalisme sur {{Modèle:Infobox Ancienne commune de France}}, révoqué hier. Faire un WP:NULLEDIT sur l’article incluant cette infobox résout le problème. — Metamorforme42 (discuter) 17 février 2023 à 12:04 (CET)Répondre
Merci. --=>   Arpitan (discuter 17 février 2023 à 12:20 (CET)Répondre

Piégeuses unités modifier

Bonjour, tombant régulièrement dessus, il me semble opportun d’alerter les rédacteur, traducteurs et patrouilleurs de ces erreurs très fréquentes dans la transcription de certaines unités de mesure utilisées dans le monde anglo-américain (et qu’on retrouve donc massivement sur wp:en et dans les sources en anglais) :

  • la ton ne correspond pas forcément à une tonne (métrique), mais renvoie le plus souvent chez les Américains à la short ton, bien qu’il puisse également s’agir de la long ton ;
  • le horsepower (hp) ne correspond que rarement à nos chevaux (ch), très souvent le mode de mesure même est différent puisque l’habitude américaine est de faire la mesure sur un moteur nu tandis que le reste du monde mesure avec le moteur tout équipé (et donc un même moteur aura une puissance affichée très supérieure avec le système américain). Cumul avec le point précédent, si on convertit la valeur 11 hp/ton en 11 ch/t on va tomber assez loin du bon résultat ;
  • il existe de nombreuses unités de volume qui ont le même nom mais avec des valeurs différentes. Un barrel peut donc être au choix l’US Dry Barrel (115,63 L), le Bulk Barrel (164,2 L), l’US fluid Barrel (119.2 L) ou une dizaine d’autre valeurs. Même limonade pour le gallon, la tasse et autres cuillères à thé. Évidemment ce n’est pas toujours indiqué duquel il s’agit...

De manière générale ma recommandation est de laisser l’unité de la source telle quelle si vous n’êtes pas sûrs, ou d’indiquer en note la valeur originale indiquée par la source ou comment vous avez fait la conversion. Personnellement je ne convertis par ailleurs jamais les hp du fait du grand nombre de variables qui rendent une telle conversion assez hasardeuse. Runi Gerardsen (discuter) 17 février 2023 à 13:34 (CET)Répondre

Il y a aussi le mille marin/mille terrestre qui peut être source de confusion à la traduction. En ce qui concerne les conversions, je suis plutôt d'un avis contraire : il est préférable d'utiliser des unités dont la signification est connue de la majorité des lecteurs donc relevant du système métrique--Pline (discuter) 18 février 2023 à 20:09 (CET).Répondre

ChatGPT, WP et WD modifier

Bonjour,

Je vous propose une remarque et une question relatives à ChatGPT et WP.

Remarque : Références bibliographiques
J'ai vu, dans les archives du bistrot (5 janvier par exemple) que certains avaient pu obtenir de ChatGPT les références de ses réponses. J'ai voulu essayer moi-même. Je l'ai donc d'abord interrogé : « que signifie "champ faidal" chez Bourdieu ? », la réponse est très séduisante : structurée (explication des mots champ puis faidal, puis de l'expression champ faidal) et apparemment cohérente et documentée. Mais il n'y a aucune référence, donc aucun moyen de savoir s'il ne s'agit pas d'invention.

J'ai donc demandé ensuite « merci de préciser les sources ? » et je reçois alors l'indication de 3 ouvrages dans lesquels Bourdieu crée puis utilise ce concept, mais aucune citation, ni aucune référence précise (page ou simplement chapitre). Ce n'est guère plus rassurant car invérifiable sauf à lire les 3 ouvrages cités. Quelqu'un a-t-il obtenu des références précises autres que des liens sur Internet ?

J'en tire cette remarque que je vous propose : ChatGPT ne peut pas concurrencer vraiment WP qui donne des références précises facilement vérifiables, à condition de respecter cette obligation que les articles WP soient des études bibliographiques dûment et précisément référencées. Or il me semble (mais ce n'est qu'une impression de ma part, sans étude approfondie) que cette obligation devient moins impérative, et peut-être même moins connue des rédacteurs.

Question relative à WD et aux box
Je me souviens de discussions vives il y a quelques années à propos de l'introduction de WD (dont je n'ai toujours pas compris l'intérêt ni le mode d'emploi dans WP) et de la généralisation des "box". Rétrospectivement, je me demande si l'injonction qui était faite, par certains informaticiens, d'utiliser ces outils dans les articles, n'avait comme seul but que de structurer l'information (par les box) et de créer des liens entre concepts (par WD) au seul bénéfice de OpenAI pour mieux exploiter WP comme base d'"apprentissage".

-- Corty2 (discuter) 17 février 2023 à 17:34 (CET)Répondre

Alors juste deux réponses rapides.
D'une manière générale, GPT 3.5 (le modèle de chatGPT) ne mémorise vraiment bien que les "faits" qui ont été présentés de nombreuses fois dans son corpus d'entraînement (de la culture générale en gros). Dès qu'il y a eu une exposition relativement furtive, il y a un risque élevé d'hallucinations : chatGPT n'a eu que de vagues notions et complète en inventant des éléments plus ou moins vraisemblables. De plus pour les biblios on s'attend généralement avoir précisément un titre assez long, pas juste une paraphrase, ce qui augmente le risque d'erreur.
Pour Wikidata, c'est largement antérieur à la création des modèles GPT et en réalité OpenAI n'en n'a pas besoin et ne l'utilise pas. Les modèles GPT prennent juste du texte en masse sans aucune métadonnées (c'est du self-learning). Les plus grandes Wikipédia se trouvent toutes dedans, au même titre que de nombreuses autres sources en lignes (dans common crawl) ou de livres numérisés sélectionnés selon des critères assez opaques.
Alexander Doria (d) 17 février 2023 à 18:25 (CET)Répondre
@Corty2 belle théorie du complot.. De toutes manières, même si ce complot éait avéré, Wikipédia (et WD) est là pour toutes les utilisations possibles et imaginables, gratuites ou payantes. Tout ce qui permet d'utiliser WP (ou WD) dans un maximum de contextes, d'outils, d'applications.. doit être en effet promu, car cela s'appelle la diffusion maximale de la connaissance. C'est l'esprit même de la license CC-BY. Jean-Christophe BENOIST (discuter) 17 février 2023 à 20:51 (CET)Répondre
@Jean-Christophe BENOIST
Et voilà l'astuce rhétorique habituelle, usée jusqu'à la corde, de la "théorie du complot"... passons.
En tant que contributeur et contrairement à la licence WP semble-t-il, je ne participe pas à WP "pour toutes les utilisations possibles et imaginables" de mes contributions, pour reprendre votre expression. L'utilisation par ChatGPT de mon travail ne contribue pas à diffuser la connaissance, mais au contraire à l'"aplatir", à réduire la diversité culturelle, et je ne souhaite pas favoriser cette tendance.
WD et les box ont été mis en place à l'époque où ChatGPT devait être en gestation. Je n'ai toujours pas compris à quoi est officiellement censé servir WD, mais il est évident que, fonctionnellement, WD et les box favorisent l'émergence d'outils comme ChatGPT que j'estime délétère. Si cela se confirme, et vous ne me rassurez pas sur ce point, cela remet en cause l'éthique de ce travail.
D'autre part, l'absence de références précises dans ChatGPT donne l'illusion d'un savoir transcendant qui est en fait celui de la culture dominante, et je ne souhaite pas y contribuer via WP. Si WP évolue tendanciellement également vers la réduction de la bibliographie, ce serait encore pour moi une raison d'arrêter mes contributions.
Cordialement Corty2 (discuter) 18 février 2023 à 08:10 (CET)Répondre
Bonjour,
1. La culture dominante et la vision du monde dominante sont déjà au coeur de Wilipédia : que peut bien aggraver l'IA actuelle ? Et WP reste autonome...
2. Ce qui serait étrange, serait que IA et WP ne soient pas des réalisations découlant d'un même effort collectif transgénérationnel : il est possible que certains aient participé aux deux processus, dans leur gestation ou leur réalisation. Hasardeuses conclusions quant à une malignité sous-jacente... quoique, voir les textes ou vidéos de Stéphane Zagdanski sur la cybernétique !
3. WD sert à mettre toutes les langues au même niveau et à les y conserver. Si ce n'est pas un gage de réduction de la culture dominante, je ne sais pas ce que c'est.
On peut arrêter de contribuer, pas pour le surgissement d'un outil qui manifestement comble un manque. TigH (discuter) 18 février 2023 à 09:59 (CET)Répondre
Les disciples de Sa Sérénité le Sâr Rabindranath Duval le savent : dans tous les cas de figure, toutes choses égales par ailleurs, mutatis mutandis et quel que soit l'âge du capitaine, toute avancée technique ou technologique représente un bénéfice tant ontologique que substantiel pour la culture dominante dont elle est issue, comme par hasard. La poule, l'œuf and all that. Cdt, Manacore (discuter) 18 février 2023 à 11:00 (CET)Répondre


Bonjour @TigH, et merci pour vos réponses.
Pourriez-vous encore me dire où et comment se manifeste cette "mise au même niveau de toutes les langues", que vous signalez comme un effet de WD ?
D'autre part, je note que mes remarques à propos de la bibliographie (absence de références précises dans ChartGPT, moins impérative (?) qu'avant dans WP) ne suscitent pas de commentaires. Serait-ce la confirmation d'une indifférence à ce sujet, qui pourtant fait encore la différence entre WP et ChartGPT...
Cordialement Corty2 (discuter) 18 février 2023 à 14:23 (CET)Répondre
 

« Le chat est sorti du sac ! Effectivement, j'ai tout fait ça pour OpenAI et ce, 8 ans avant que j'apprenne son existence. »

— Simon Villeneuve, Petit guide de manipulation communautaire[note 1]

Pour les bibliographies, je n'ai aucune expérience de ce point, et j'imagine qu'il ne serait pas difficile pour l'IA de fournir abondamment des références. J'ajoute que je ne me vois pas comme défenseur de ces innovations, d'autant que je me réserve de les tester véritablement ultérieurement une fois un peu stabilisées.
Votre doute sur mon troisième point est justifié. WD a précédé de beaucoup les outils de traduction un peu sérieux : les articles ne pouvant être ainsi traduits par les langues mineures, faute de contributeur, Wikidata a été vendu, si je me souviens, pour une facilité de préciser des données, de les mettre à jour, de manière centralisée pour toutes les langues. C'est ainsi que par un raccourci, dont j'avoue ce soir la fragilité, je défends WD pour son potentiel également exploitable par toute communauté linguistique un peu consistante. Son usage dans Wikipédia est une autre question.
Mon sentiment de fond est qu'il est tout-à-fait prématuré de tirer des conclusions des prototypes ouverts au public, surtout des conclusions quant à Wikipédia.
Cordialement. TigH (discuter) 18 février 2023 à 20:39 (CET)Répondre
@Corty2 Je ne sais pas si tu connais comment fonctionne ChatGPT, mais le résultat que tu as obtenu ne me surprend pas du tout. ChatGPT est un modèle de prédiction de texte : tu lui donnes un mot ou une phrase, et il regarde dans son corpus quel est le mot à venir le plus probable (exemple tout simple "le ciel est ..." a de grandes chances d'être suivi par "bleu" ; si tu écris "il y a des nuages, le ciel est ..." alors "gris" ou "nuageux" ou "couvert" sont des options plus probables). ChatGPT fait ça pour tous les mots, et comme il a été entraîné sur un immense corpus de textes écrits par des humains, ses "réponses" ont l'air crédibles. Donc si on lui demande de citer des sources, il va s'inspirer des textes universitaires qu'il a reçu, et pondre une réponse du style "Dupont, Martin, Un titre vraiment inspirant, éditions Ainvantées, 231p, 2015". ChatGPT ne comprend absolument rien de ce qu'il produit, c'est au mieux un singe savant qui peut imiter un style d'écriture. D'ailleurs, ses réponses sont très dépendantes du texte initial et des instructions que tu lui donnes : à la question "est-ce que le mérite individuel existe ?", la réponse est différente si tu lui dis "réponds comme un homme politique" ou "réponds comme un sociologue". À l'inverse, Wikidata est construit sur des blocs d'information qui font sens entre eux : le fonctionnement est complètement différent. Skimel (discuter) 18 février 2023 à 22:25 (CET)Répondre
Bonjour, @Skimel. Oui j'ai une connaissance de la façon dont est produit ChatCPT (et son concurrent) du moins ce dont les entreprises qui vont les commercialiser veulent bien en dire.
Dans ce cadre forcément restreint, j'ai compris que le principe en est d'établir une matrice très vaste (2 milliards de dimensions, paraît-il) à partir des liens observés (proximité dans un corpus, mais aussi liens Internet, et bien d'autres...) puis de la diagonaliser pour obtenir une matrice plus réduite, exploitable. Dans ce processus, il est évident que les liens WD, ou la proximité dans une box de 2 éléments sont pris en compte.
Ces phases de recueil puis de diagonalisation sont évidemment paramétrées, ce qui contribue peut-être à différencier les performances des 2 systèmes concurrents. On peut imaginer (et c'est ce que je fais) que par exemple des liens type "box" ou "WD" soient plus pondérés que d'autres. Ces paramétrages indispensables, mais que nous ne connaissons pas, induisent une subjectivité, des choix culturels, dans les réponses de ChatGPT.

Au sujet des références bibliographiques : je suis moins pessimiste que @TigH : tant que l'ensemble du corpus imprimé n'est pas digitalisé de façon exploitable, il ne sera pas possible à ChatGPT de préciser des références précises (citation et page) comme on les trouve encore dans WP. Pour le moment, les contributeurs doivent encore avoir lu les livres qu'ils citent, ouf. Tant que WP maintient cette exigence, WP se démarquera de ChatGPT. C'est peut-être sur ce point que l'on va déceler les articles qui seront issus directement de ChatGPT, qui ne mentionne que les titres d'ouvrage.

Nivellement culturel : on peut déjà évaluer les dégâts prévisibles : je viens d'écouter 2 cours du Collège de France de début février. Dans le premier W. Marx évoque ChatGPT dans un cours sur la poétique de Paul Valéry. Dans le second, V. Courtier-Orgogozo ouvre son cours sur le vivant en lisant ce que ChatGPT a répondu lorsqu'elle lui a posé la problématique du cours...Nous en sommes déjà là.
Cordialement Corty2 (discuter) 19 février 2023 à 11:01 (CET)Répondre
  1. slogan #64 : Cette méchante intruse de Wikidata a été dévoyée par (entité complotiste du moment)