Règle BCM

La théorie BCM, la modification synaptique BCM, ou la règle BCM, du nom d'Elie Bienenstock, Leon Cooper et Paul Munro, est une théorie décrivant les changements d'adaptation neuronale dans le cerveau ou dans un réseau de neurones pendant un processus d'apprentissage. Elle a initialement postulé pour l'apprentissage dans le cortex visuel en 1981. Le modèle BCM propose un seuil mobile pour l'induction de la potentialisation à long terme (LTP) ou de la dépression à long terme (LTD), et indique que la plasticité synaptique est stabilisée par une adaptation dynamique de l'activité post-synaptique moyennée dans le temps.

Selon le modèle BCM, lorsqu'un neurone pré-synaptique se déclenche, les neurones post-synaptiques auront tendance à subir une LTP s'il est dans un état de haute activité (par exemple, se déclenche à haute fréquence et/ou a des concentrations internes élevées en calcium ), ou LTD s'il est dans un état d'activité plus faible (par exemple, déclenchement à basse fréquence, faibles concentrations internes de calcium)^[1]. Cette théorie est souvent utilisée pour expliquer comment les neurones corticaux peuvent subir à la fois LTP ou LTD en fonction de différents protocoles de stimulation de conditionnement appliqués aux neurones pré-synaptiques (généralement stimulation haute fréquence, ou HFS, pour LTP, ou stimulation basse fréquence, LFS, pour LTD)^[2].

Développement modifier

En 1949, Donald Hebb a proposé un mécanisme de travail pour la mémoire et l'adaptation informatique dans le cerveau maintenant appelé Règle de Hebb résumé par la maxime les neurones qui s'excitent ensemble, se connectent ensemble^[3]. Cette notion est fondamentale dans la compréhension moderne du cerveau en tant que réseau de neurones et, bien qu'elle ne soit pas universellement vraie, reste une bonne première approximation étayée par des décennies de preuves^[3]^,^[4].

Cependant, la règle de Hebb possède plusieurs défaut :

elle n'a aucun mécanisme permettant aux connexions de s'affaiblir
et aucune limite supérieure pour la force qu'elles peuvent obtenir.

En d'autres termes, le modèle est instable, à la fois théoriquement et informatiquement.

Des modifications ultérieures ont progressivement amélioré la règle de Hebb, la normalisant et permettant la décomposition des synapses, où aucune activité ou activité non synchronisée entre les neurones n'entraîne une perte de force de connexion. De nouvelles preuves biologiques ont porté cette activité à son apogée dans les années 1970, où les théoriciens ont formalisé diverses approximations dans la théorie, telles que l'utilisation de la fréquence de déclenchement au lieu du potentiel pour déterminer l'excitation des neurones, et l'hypothèse d'une intégration synaptique idéale et, plus important encore, linéaire. de signaux. C'est-à-dire qu'il n'y a pas de comportement inattendu dans l'ajout de courants d'entrée pour déterminer si une cellule se déclenchera ou non.

Ces approximations ont abouti à la forme de base de BCM ci-dessous en 1979, mais l'étape finale a pris la forme d'une analyse mathématique pour prouver la stabilité et d'une analyse informatique pour prouver l'applicabilité, aboutissant à l'article de Bienenstock, Cooper et Munro en 1982.

Depuis lors, des expériences ont montré des preuves du comportement du BCM à la fois dans le cortex visuel et dans l'hippocampe, ce dernier jouant un rôle important dans la formation et le stockage des souvenirs. Ces deux zones sont bien étudiées expérimentalement, mais la théorie et l'expérience doivent encore établir un comportement synaptique concluant dans d'autres zones du cerveau. Il a été proposé que dans le cervelet, la fibre parallèle à la synapse des cellules de Purkinje suit une "règle BCM inverse", ce qui signifie qu'au moment de l'activation des fibres parallèles, une concentration élevée de calcium dans la cellule de Purkinje entraîne une LTD, tandis qu'une plus faible la concentration donne LTP^[2]. En outre, la mise en œuvre biologique de la plasticité synaptique dans le BCM n'a pas encore été établie^[5].

Théorie modifier

La règle BCM de base prend la forme

\,{\frac {dm_{j}(t)}{dt}}=\phi ({\textbf {c}}(t))d_{j}(t)-\epsilon m_{j}(t),

où:

$m_{j}$ est le poids synaptique du $j$ ème synapse,
$d_{j}$ est $j$ le courant d'entrée de la synapse,
$c(t)={\textbf {w}}(t){\textbf {d}}(t)=\sum _{j}w_{j}(t)d_{j}(t)$ est le produit interne des poids et des courants d'entrée (somme pondérée des entrées),
$\phi (c)$ est une fonction non linéaire. Cette fonction doit changer de signe à un certain seuil $\theta _{M}$ , C'est, $\phi (c)<0$ si et seulement si $c<\theta _{M}$ . Voir ci-dessous pour les détails et les propriétés.
et $\epsilon$ est la constante de temps (souvent négligeable) de la décroissance uniforme de toutes les synapses.

Ce modèle est une forme modifiée de la règle d'apprentissage Hebbian, ${\dot {w_{j}}}=cd_{j}$ , et nécessite un choix de fonction adapté $\phi$ pour éviter les problèmes hebbiens d'instabilité.

Bienenstock et al.^[6] réécrivirent $\phi (c)$ en tant que fonction $\phi (c,{\bar {c}})$ où ${\bar {c}}$ est la moyenne temporelle de $c$ . Avec cette modification et en écartant la décroissance uniforme, la règle prend la forme vectorielle :

{\dot {\mathbf {m} }}(t)=\phi (c(t),{\bar {c}}(t))\mathbf {d} (t)

Les conditions d'un apprentissage stable sont dérivées rigoureusement dans BCM en notant qu'avec $c(t)={\textbf {m}}(t)\cdot {\textbf {d}}(t)$ et avec l'approximation de la production moyenne ${\bar {c}}(t)\approx {\textbf {m}}(t){\bar {\mathbf {d} }}$ , il suffit que

\,\operatorname {sgn} \phi (c,{\bar {c}})=\operatorname {sgn} \left(c-\left({\frac {\bar {c}}{c_{0}}}\right)^{p}{\bar {c}}\right)~~{\textrm {for}}~c>0,~{\textrm {and}}

\,\phi (0,{\bar {c}})=0~~{\textrm {for}}~{\textrm {all}}~{\bar {c}},

ou de manière équivalente, que le seuil $\theta _{M}({\bar {c}})=({\bar {c}}/c_{0})^{p}{\bar {c}}$ , où $p$ et $c_{0}$ sont des constantes positives fixées^[6].

Lorsqu'elle est mise en œuvre, la théorie est souvent prise de telle sorte que

\,\phi (c,{\bar {c}})=c(c-\theta _{M})~~~{\textrm {and}}~~~\theta _{M}={\bar {c}}^{2}={\frac {1}{\tau }}\int _{-\infty }^{t}c^{2}(t^{\prime })e^{-(t-t^{\prime })/\tau }dt^{\prime },

où $\tau$ est une constante de temps de sélectivité.

Le modèle présente des inconvénients, car il nécessite à la fois une potentialisation à long terme et une dépression à long terme, ou des augmentations et des diminutions de la force synaptique, ce qui n'a pas été observé dans tous les systèmes corticaux. De plus, il nécessite un seuil d'activation variable et dépend fortement de la stabilité des points fixes sélectionnés. $c_{0}$ et $p$ . Cependant, la force du modèle est qu'il intègre toutes ces exigences à partir de règles de stabilité dérivées indépendamment, telles que la normalisabilité et une fonction de décroissance avec le temps proportionnel au carré de la sortie ^[7].

Exemple modifier

Cet exemple est un cas particulier de celui du chapitre "Résultats mathématiques" de Bienenstock et al.^[6] en supposant $p=2$ et $c_{0}=1$ . Avec ces valeurs $\theta _{M}=({\bar {c}}/c_{0})^{p}{\bar {c}}={\bar {c}}^{3}$ et nous décidons $\phi (c,{\bar {c}})=c(c-\theta _{M})$ remplissant les conditions de stabilité énoncées au chapitre précédent.

Supposons que deux neurones présynaptiques fournissent des entrées $d_{1}$ et $d_{2}$ , son activité un cycle répétitif avec la moitié du temps $\mathbf {d} =(d_{1},d_{2})=(0.9,0.1)$ et le temps restant $\mathbf {d} =(0.2,0.7)$ . ${\bar {c}}$ la moyenne temporelle sera la moyenne de $c$ valeur dans la première et la seconde moitié d'un cycle.

Soit la valeur initiale des poids $\mathbf {m} =(0.1,0.05)$ . Dans la première moitié du temps $\mathbf {d} =(0.9,0.1)$ et $\mathbf {m} =(0.1,0.05)$ , la somme pondérée $c$ est égal à 0,095 et nous utilisons la même valeur que la moyenne initiale ${\bar {c}}$ . Cela signifie $\theta _{M}=0.001$ , $\phi =0.009$ , ${\dot {m}}=(0.008,0.001)$ . En ajoutant 10% de la dérivée aux poids, nous en obtenons de nouveaux $\mathbf {m} =(0.101,0.051)$ .

Dans la prochaine moitié du temps, les entrées sont $\mathbf {d} =(0.2,0.7)$ et poids $\mathbf {m} =(0.101,0.051)$ . Cela signifie $c=0.055$ , ${\bar {c}}$ du cycle complet est de 0,075, $\theta _{M}=0.000$ , $\phi =0.003$ , ${\dot {m}}=(0.001,0.002)$ . En ajoutant 10% de la dérivée aux poids, nous en obtenons de nouveaux $\mathbf {m} =(0.110,0.055)$ .

En répétant le cycle précédent on obtient, après plusieurs centaines d'itérations, que la stabilité est atteinte avec $\mathbf {m} =(3.246,-0.927)$ , $c={\sqrt {8}}=2.828$ (première mi-temps) et $c=0.000$ (temps restant), ${\bar {c}}={\sqrt {8}}/2=1.414$ , $\theta _{M}={\sqrt {8}}=2.828$ , $\phi =0.000$ et ${\dot {m}}=(0.000,0.000)$ .

Notez comment, comme prévu, le vecteur de poids final $m$ est devenu orthogonal à l'un des modèles d'entrée, étant les valeurs finales de $c$ dans les deux intervalles zéros de la fonction $\phi$ .

Expérience modifier

La première confirmation expérimentale majeure de BCM est venue en 1992 en étudiant LTP et LTD dans l'hippocampe. Le travail expérimental de Serena Dudek a montré un accord qualitatif avec la forme finale de la fonction d'activation du BCM^[8]. Cette expérience a ensuite été reproduite dans le cortex visuel, que le BCM a été initialement conçu pour modéliser^[9]. Ce travail a fourni une preuve supplémentaire de la nécessité d'une fonction de seuil variable pour la stabilité dans l'apprentissage de type Hebbian (BCM ou autres).

Les preuves expérimentales n'étaient pas spécifiques au BCM jusqu'à ce que Rittenhouse et al. a confirmé la prédiction de BCM de la modification des synapses dans le cortex visuel lorsqu'un œil est sélectivement fermé. Spécifiquement,

\log \left({\frac {m_{\rm {closed}}(t)}{m_{\rm {closed}}(0)}}\right)\sim -{\overline {n^{2}}}t,

où ${\overline {n^{2}}}$ décrit la variance de l'activité spontanée ou du bruit dans l'œil fermé et $t$ est le temps écoulé depuis la fermeture. L'expérience a confirmé la forme générale de cette prédiction et a fourni une explication de la dynamique de la fermeture de l'œil monoculaire (privation monoculaire ) par rapport à la fermeture de l'œil binoculaire^[10]. Les résultats expérimentaux sont loin d'être concluants, mais jusqu'à présent ont favorisé le BCM par rapport aux théories concurrentes de la plasticité.

Applications modifier

Alors que l'algorithme de BCM est trop compliqué pour le traitement distribué parallèle à grande échelle, il a été utilisé dans les réseaux latéraux avec un certain succès^[11]. De plus, certains algorithmes d'apprentissage de réseau informatique existants ont été conçus pour correspondre à l'apprentissage BCM ^[12].

Références modifier

↑ Eugene M. Izhikevich et Niraj S. Desai, « Relating STDP to BCM », Neural Computation, vol. 15, n^o 7,‎ 1^er juillet 2003, p. 1511–1523 (ISSN 0899-7667, PMID 12816564, DOI 10.1162/089976603321891783)
↑ ^{a et b} Michiel Coesmans, John T. Weber, Chris I. De Zeeuw et Christian Hansel, « Bidirectional Parallel Fiber Plasticity in the Cerebellum under Climbing Fiber Control », Neuron, vol. 44, n^o 4,‎ 2004, p. 691–700 (PMID 15541316, DOI 10.1016/j.neuron.2004.10.031)
↑ ^{a et b} Principles of Neural Science, New York, 5th, 2013 (ISBN 978-0-07-139011-8, OCLC 795553723)
↑ (en) Henry Markram, Wulfram Gerstner et Per Jesper Sjöström, « Spike-Timing-Dependent Plasticity: A Comprehensive Overview », Frontiers in Synaptic Neuroscience, vol. 4,‎ 2012, p. 2 (ISSN 1663-3563, PMID 22807913, PMCID 3395004, DOI 10.3389/fnsyn.2012.00002)
↑ L.N. Cooper, « Memories and memory: A physicist's approach to the brain », International Journal of Modern Physics A, vol. 15, n^o 26,‎ 2000, p. 4069–4082 (DOI 10.1142/s0217751x0000272x, lire en ligne, consulté le 11 novembre 2007)
↑ ^{a b et c} Elie L. Bienenstock, Leon Cooper et Paul Munro, « Theory for the development of neuron selectivity: orientation specificity and binocular interaction in visual cortex », The Journal of Neuroscience, vol. 2, n^o 1,‎ janvier 1982, p. 32–48 (PMID 7054394, PMCID 6564292, DOI 10.1523/JNEUROSCI.02-01-00032.1982, lire en ligne, consulté le 11 novembre 2007)
↑ Nathan Intrator, « The BCM theory of synaptic plasticity », Neural Computation, School of Computer Science, Tel-Aviv University, 2006–2007 (consulté le 11 novembre 2007)
↑ Serena M. Dudek et Mark Bear, « Homosynaptic long-term depression in area CA1 of hippocampus and effects of N-methyl-D-aspartate receptor blockade », Proc. Natl. Acad. Sci., vol. 89, n^o 10,‎ 1992, p. 4363–4367 (PMID 1350090, PMCID 49082, DOI 10.1073/pnas.89.10.4363, Bibcode 1992PNAS...89.4363D, lire en ligne, consulté le 11 novembre 2007)
↑ Alfredo Kirkwood, Marc G. Rioult et Mark F. Bear, « Experience-dependent modification of synaptic plasticity in rat visual cortex », Nature, vol. 381, n^o 6582,‎ 1996, p. 526–528 (PMID 8632826, DOI 10.1038/381526a0, Bibcode 1996Natur.381..526K)
↑ Rittenhouse, Harel Z. Shouval, Michael A. Paradiso et Mark F. Bear, « Monocular deprivation induces homosynaptic long-term depression in visual cortex », Nature, vol. 397, n^o 6717,‎ 1999, p. 347–50 (PMID 9950426, DOI 10.1038/16922, Bibcode 1999Natur.397..347R)
↑ Nathan Intrator, « BCM Learning Rule, Comp Issues », Neural Computation, School of Computer Science, Tel-Aviv University, 2006–2007 (consulté le 11 novembre 2007)
↑ Dorit Baras et Ron Meir, « Reinforcement Learning, Spike-Time-Dependent Plasticity, and the BCM Rule », Neural Computation, vol. 19, n^o 8,‎ 2007, p. 2245–2279 (PMID 17571943, DOI 10.1162/neco.2007.19.8.2245, lire en ligne [archive du 21 juillet 2011], consulté le 11 novembre 2007)

Voir aussi modifier

Articles connexes modifier

Liens externes modifier

Article de Scholarpedia

[1] Eugene M. Izhikevich et Niraj S. Desai, « Relating STDP to BCM », Neural Computation, vol. 15, n^o 7,‎ 1^er juillet 2003, p. 1511–1523 (ISSN 0899-7667, PMID 12816564, DOI 10.1162/089976603321891783)

[:0-2] {a et b} Michiel Coesmans, John T. Weber, Chris I. De Zeeuw et Christian Hansel, « Bidirectional Parallel Fiber Plasticity in the Cerebellum under Climbing Fiber Control », Neuron, vol. 44, n^o 4,‎ 2004, p. 691–700 (PMID 15541316, DOI 10.1016/j.neuron.2004.10.031)

[:1-3] {a et b} Principles of Neural Science, New York, 5th, 2013 (ISBN 978-0-07-139011-8, OCLC 795553723)

[4] (en) Henry Markram, Wulfram Gerstner et Per Jesper Sjöström, « Spike-Timing-Dependent Plasticity: A Comprehensive Overview », Frontiers in Synaptic Neuroscience, vol. 4,‎ 2012, p. 2 (ISSN 1663-3563, PMID 22807913, PMCID 3395004, DOI 10.3389/fnsyn.2012.00002)

[5] L.N. Cooper, « Memories and memory: A physicist's approach to the brain », International Journal of Modern Physics A, vol. 15, n^o 26,‎ 2000, p. 4069–4082 (DOI 10.1142/s0217751x0000272x, lire en ligne, consulté le 11 novembre 2007)

[:2-6] {a b et c} Elie L. Bienenstock, Leon Cooper et Paul Munro, « Theory for the development of neuron selectivity: orientation specificity and binocular interaction in visual cortex », The Journal of Neuroscience, vol. 2, n^o 1,‎ janvier 1982, p. 32–48 (PMID 7054394, PMCID 6564292, DOI 10.1523/JNEUROSCI.02-01-00032.1982, lire en ligne, consulté le 11 novembre 2007)

[7] Nathan Intrator, « The BCM theory of synaptic plasticity », Neural Computation, School of Computer Science, Tel-Aviv University, 2006–2007 (consulté le 11 novembre 2007)

[8] Serena M. Dudek et Mark Bear, « Homosynaptic long-term depression in area CA1 of hippocampus and effects of N-methyl-D-aspartate receptor blockade », Proc. Natl. Acad. Sci., vol. 89, n^o 10,‎ 1992, p. 4363–4367 (PMID 1350090, PMCID 49082, DOI 10.1073/pnas.89.10.4363, Bibcode 1992PNAS...89.4363D, lire en ligne, consulté le 11 novembre 2007)

[9] Alfredo Kirkwood, Marc G. Rioult et Mark F. Bear, « Experience-dependent modification of synaptic plasticity in rat visual cortex », Nature, vol. 381, n^o 6582,‎ 1996, p. 526–528 (PMID 8632826, DOI 10.1038/381526a0, Bibcode 1996Natur.381..526K)

[10] Rittenhouse, Harel Z. Shouval, Michael A. Paradiso et Mark F. Bear, « Monocular deprivation induces homosynaptic long-term depression in visual cortex », Nature, vol. 397, n^o 6717,‎ 1999, p. 347–50 (PMID 9950426, DOI 10.1038/16922, Bibcode 1999Natur.397..347R)

[11] Nathan Intrator, « BCM Learning Rule, Comp Issues », Neural Computation, School of Computer Science, Tel-Aviv University, 2006–2007 (consulté le 11 novembre 2007)

[12] Dorit Baras et Ron Meir, « Reinforcement Learning, Spike-Time-Dependent Plasticity, and the BCM Rule », Neural Computation, vol. 19, n^o 8,‎ 2007, p. 2245–2279 (PMID 17571943, DOI 10.1162/neco.2007.19.8.2245, lire en ligne [archive du 21 juillet 2011], consulté le 11 novembre 2007)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]