À propos de ce flux de discussion

Cette page utilise les Discussions structurées, un nouveau système de discussion (ex-Flow). Les sujets les plus récents sont en haut. On peut suivre une page ou seulement un ou plusieurs sujets. Tous ceux qui participent déjà à une discussion seront notifiés automatiquement d'une réponse. Vous pouvez aussi mentionner des utilisateurs pour les alerter en particulier.

Consulter la version archivée de cette page En savoir plusFaire un retour ou rapporter un dysfonctionnementActiver les Discussions structurées sur votre page de discussion





Punx (discutercontributions)
D Cat laz (discutercontributions)

Salut, j'ai complètement mis ça de coter pendant la campagne présidentielle j'avoue mais je suis de retour et j'espère finir d'ici la fin du mois !

merci pour le rappel cependant !

Répondre à « Wikiconcours »
Dfeldmann (discutercontributions)

Ben oui et non : effectivement, en matière d'apprentissage visuel, c'est supervisé (enfin, ça dépend un peu de ce qu'on veut dire : l'utilisation d'un jeu de données initial sur lequel se fait l'apprentissage n'est pas exactement la même chose qu'une intervention humaine à certaines étapes clés de l'apprentissage). Mais dans le cas d'AlphaZero (ou de MuZero), où diable serait la "supervision" ?

D Cat laz (discutercontributions)

Hum, excellente remarque. Néanmoins, je n'ai aucune idée de la manière dont l'appeler car je ne connais pas la structure de l'algorithme. Le papier originel parle d'"apprentissage par renforcement" https://arxiv.org/abs/1712.01815, donc peut être que cette catégorie correspond mieux à AlphaZero et MuZero ?

D Cat laz (discutercontributions)
Dfeldmann (discutercontributions)

Ben si, enfin : voir n'importe quel article sur AlphaZero (ou plutôt sur AlphaGo Zero), celui-ci par exemple. Je dis une bêtise ?

D Cat laz (discutercontributions)

Alors j'ai appris un truc aujourd'hui, c'est que oui on peut parler de Réseau neuronal convolutif pour AlphaGO Zeo et Alpha Zero.

Mais avec ces programmes pour moi on est dans le cas bizarre où c'est tellement complexe (on a le MCTS, le reinforcement learning avec des partie évalué à +1 ou -1, le réseau de neurone amélioré avec la descente de gradient avec les résultats des parties précédentes) qu'on est à la fois dans de l'apprentissage par renforcement et apprentissage non-supervisé.

Toutefois sur pour revenir à l'entrainement de CNN, je pense que la majeur partie des applications ne peuvent pas utilisé cette aspect "self-train" et qu'il faudrait donc garder les CNN dans "apprentissage supervisé" quitte à mentionner dans l'article que quand dans le cas de ces jeux le résultat de la prédiction peut être utiliser pour créer un nouveau jeu de données pour entrainer le modèle ce qui combine à la fois apprentissage par renforcement et apprentissage non-supervisé.

Dfeldmann (discutercontributions)

Ok, donc on garde la palette comme au début (et comme tu l’as remise), et ou bien on revient à ta version (sans la petite phrase entre parenthèses), ou on complète en précisant (d’où d’ailleurs la différence faite chez WPen entre CNN et DNN)

D Cat laz (discutercontributions)

Je pense qu'il faut garder la palette comme au début.

Pourquoi ?

Les réseaux de neurones convolutifs restent très différents des algorithmes classiques non supervisé qui se basent plus sur des densités de cluster. Dans le cas de Alpha Zero, au final, les poids de l'algorithme sont mis à jour à partir de partie labellisé comme "gagnante" ou "perdante", de ce point de vue on pourrai dire que le réseau est bien entraîné sur un jeu de données labellisé (qu'il a certes généré lui même ((chapeau Smiley de Zorro, avec un masque et un chapeau noir)) ).

Pour la subtilité et mon avis sur ces sujets:

J'ai vue que Alpha zero était déjà mentionné dans l'article Apprentissage par renforcement, rien à dire de ce coté là donc. Pour ce qui est de l'article sur les Réseau neuronal convolutif, en parcourant les articles en français et en anglais je ne vois pas de partie pertinente où ajouter cette subtilité à part peut être dans la partie Histoire (au passage je trouve l'article français mieux construit).

Il me semble que Wikipédia français fait aussi la différence entre CNN Réseau neuronal convolutif et DNN Apprentissage profond (même si le second article pique les yeux ). MAIS je trouve l'article en:Deep learning extrêmement redondant avec en:Artificial neural network. La cause ? Le Deep Learning est un truc mal défini (des gros gros réseau de neurones) et donc c'est un concept pas très utile à part pour le buzz. Et donc pour moi on devrai fusionner ces articles dans les deux langues (mais bon je me calme, je me calme )

Bon voilà, tout ça pour dire que je trouve CNN à sa place dans Apprentissage supervisé et que des algorithmes comme AlphaGo Zero sont passionnant d'ingénieusité.

Répondre à « Réseaux de neurones »
Il n’y a aucun sujet plus ancien