Matrice hessienne

Matrice des dérivées partielles du second ordre d'une fonction vectorielle

En mathématiques, la matrice hessienne (ou simplement le hessien ou la hessienne) d'une fonction numérique est la matrice carrée, notée , de ses dérivées partielles secondes.

DéfinitionModifier

Etant donnée une fonction   à valeurs réelles

 

dont toutes les dérivées partielles secondes existent, le coefficient d'indice   de la matrice hessienne   vaut  .

Autrement dit,

  .

On appelle discriminant hessien (ou simplement hessien) le déterminant de cette matrice.

Le terme « hessien » a été introduit par James Joseph Sylvester, en hommage au mathématicien allemand Ludwig Otto Hesse.

Soit notamment   une fonction de classe   définie sur un ouvert   de l'espace  , à valeurs réelles. Sa matrice hessienne est bien définie et en vertu du théorème de Schwarz, elle est symétrique.

On appelle forme hessienne la forme quadratique associée à la matrice hessienne.

Application à l'étude des points critiquesModifier

 
Point col

On suppose   fonction de classe C2 sur un ouvert  . La matrice hessienne permet, dans de nombreux cas, de déterminer la nature des points critiques de la fonction  , c'est-à-dire des points d'annulation du gradient.

Condition nécessaire d'extremum localModifier

  • Si   est un point de minimum local de  , alors c'est un point critique et la hessienne en   est positive (c'est-à-dire que la forme hessienne est positive).
  • Si   est un point de maximum local de  , alors c'est un point critique et la hessienne en   est négative (c'est-à-dire que la forme hessienne est négative)[1].

En particulier, si la hessienne en un point critique admet au moins une valeur propre strictement positive et une valeur propre strictement négative, le point critique est un point col.

Condition suffisante d'extremum localModifier

Précisément, un point critique de   est dit dégénéré lorsque le discriminant hessien s'annule, autrement dit lorsque 0 est valeur propre de la hessienne. En un point critique non dégénéré, le signe des valeurs propres (toutes non nulles) détermine la nature de ce point (point d'extremum local ou point col) :

  • si la hessienne est définie positive, la fonction atteint un minimum local strict au point critique ;
  • si la hessienne est définie négative, la fonction atteint un maximum local strict au point critique ;
  • s'il y a des valeurs propres de chaque signe, le point critique est un point col (cf. supra).

Dans ce dernier cas, on définit l'indice du point critique comme la dimension maximale d'un sous-espace sur lequel la hessienne est définie négative. C'est aussi le nombre de valeurs propres négatives.

En dimension deux notamment, le discriminant hessien étant le produit des valeurs propres, son signe suffit à déterminer la nature d'un point critique non dégénéré.

Enfin pour un point critique dégénéré, aucune de ces implications n'est vraie. L'un des exemples les plus simples de point critique dégénéré est la selle de singe.

Courbe hessienneModifier

Si   est la courbe algébrique d'équation projective (homogène)  , on appelle courbe hessienne (ou simplement hessienne) de   la courbe dont l'équation projective est  , où   est le hessien (le déterminant de la matrice hessienne) de  . La hessienne de   a pour intersection avec   les points critiques et les points d'inflexion de  [2]. Si   est de degré  , sa hessienne est de degré   ; d'après le théorème de Bézout, le nombre des points d'inflexion d'une courbe régulière de degré   est donc  , ce qui est un cas particulier d'une des formules de Plücker.

Extension au cadre des variétés différentiellesModifier

Lorsque   est une variété différentielle et   une fonction numérique lisse sur  , il est possible de définir la différentielle   de   en tout point, mais pas la matrice hessienne, comme on le voit en écrivant une formule de changement de cartes. Cependant, lorsque   est un point critique pour la fonction  , la matrice hessienne de   en   peut effectivement être définie. On peut donc parler de point critique dégénéré ou non et définir l'indice d'un tel point.

Il est possible de fournir une définition de cette hessienne en un point critique  , sans recourir à des cartes locales. En effet, le point   admet pour image par   l'élément nul   de la fibre en   du fibré cotangent  . L'application linéaire tangente   arrive donc dans l'espace tangent en ce point, qui admet une décomposition canonique  . La hessienne s'obtient en ne considérant que le deuxième terme de cette décomposition (le premier est trivial)[3]. On peut donc la voir comme une application bilinéaire

 

Extension au cadre des variétés riemanniennesModifier

DéfinitionModifier

Lorsque   est une variété riemannienne et  , la connexion de Levi-Civita   de la métrique riemannienne   nous permet de définir le tenseur hessien

 

de   par :

 

En coordonnées locales  , le tenseur hessien s'exprime comme[4] :

 

où les   sont les symboles de Christoffel de la connexion  . Le tenseur hessien possède aussi les expressions suivantes :

 
 .

ApplicationsModifier

À l'aide du tenseur hessien, on peut étendre la notion de fonction convexe (ou strictement convexe) aux fonctions numériques sur les variétés riemanniennes : ce sont celles pour lesquelles le hessien est, en chaque point, une forme bilinéaire positive (ou définie positive)[5].

On peut aussi retrouver le fait que le hessien d'une fonction réelle lisse   sur une variété différentielle   est bien définie, indépendamment de tout choix de métrique, aux points critiques de  . En effet, il est toujours possible de munir   d'une métrique riemannienne particulière. Et si   est un point critique de  , l'expression en coordonnées locales du tenseur hessien en   est :

 

Les coefficients du tenseur hessien de   en un point critique   sont bien indépendants de la métrique riemannienne.

Lemme de MorseModifier

Le lemme de Morse[6] montre que le comportement d'une fonction régulière au voisinage d'un point critique non dégénéré est entièrement déterminé par la connaissance de l'indice du point critique.

Lemme de Morse — Soit   une fonction   sur une variété différentielle de dimension  . On considère un point critique non dégénéré   de la fonction  , et l'on note   son indice. Alors il existe un système de coordonnées locales   centré en   et tel que l'expression correspondante de   est

 .

On qualifie un tel système de coordonnées de Morse.

Il résulte notamment du lemme que les points critiques non dégénérés sont isolés.

Le lemme de Morse se généralise aux espaces de Hilbert sous le nom de lemme de Morse-Palais (en).

Théorie de MorseModifier

Une fonction dont tous les points critiques sont non dégénérés et toutes les valeurs critiques distinctes est appelée fonction de Morse. La théorie de Morse a pour objectif de relier l'étude de la topologie de la variété à celle des points critiques des fonctions qui peuvent y être définies.

Notes et référencesModifier

  1. Comme l'exemple des fonctions constantes le montre, la hessienne en un point de minimum local (resp. de maximum local) peut ne pas être définie positive (resp. définie négative).
  2. (en) G. Salmon, Higher Plane Curves, Stechert (1934)
  3. Patrick Massot, Topologie différentielle, p. 46
  4. (en) Jürgen Jost, Riemannian Geometry and Geometric Analysis, [détail des éditions], p. 139.
  5. (en) Jürgen Jost, Riemannian Geometry and Geometric Analysis, [détail des éditions], p. 140
  6. (en) John Milnor, Morse Theory, Princeton University Press, 1963. (ISBN 0-691-08008-9), p. 6.

Voir aussiModifier

Articles connexesModifier

Lien externeModifier

G. Vial, Mini-cours d’optimisation