Matrice hessienne

Matrice des dérivées partielles du second ordre d'une fonction vectorielle

En mathématiques, la matrice hessienne (ou simplement la hessienne) d'une fonction numérique est la matrice carrée, notée , de ses dérivées partielles secondes.

DéfinitionModifier

Etant donnée une fonction   à valeurs réelles

 

dont toutes les dérivées partielles secondes existent, le coefficient d'indice   de la matrice hessienne   vaut  .

Autrement dit,

  .

On appelle discriminant hessien (ou simplement hessien) le déterminant de cette matrice.

Le terme « hessien » a été introduit par James Joseph Sylvester, en hommage au mathématicien allemand Ludwig Otto Hesse.

Soit notamment   une fonction de classe   définie sur un ouvert   de l'espace  , à valeurs réelles. Sa matrice hessienne est bien définie et en vertu du théorème de Schwarz, elle est symétrique.

On appelle forme hessienne la forme quadratique associée à la matrice hessienne.

Application à l'étude des points critiquesModifier

 
Point col

On suppose   fonction de classe C2 sur un ouvert  . La matrice hessienne permet, dans de nombreux cas, de déterminer la nature des points critiques de la fonction  , c'est-à-dire des points d'annulation du gradient.

Condition nécessaire d'extremum localModifier

  • Si   est un point de minimum local de  , alors c'est un point critique et la hessienne en   est positive (c'est-à-dire que la forme hessienne est positive).
  • Si   est un point de maximum local de  , alors c'est un point critique et la hessienne en   est négative (c'est-à-dire que la forme hessienne est négative)[1].

En particulier, si la hessienne en un point critique admet au moins une valeur propre strictement positive et une valeur propre strictement négative, le point critique est un point col.

Condition suffisante d'extremum localModifier

Précisément, un point critique de   est dit dégénéré lorsque le discriminant hessien s'annule, autrement dit lorsque 0 est valeur propre de la hessienne. En un point critique non dégénéré, le signe des valeurs propres (toutes non nulles) détermine la nature de ce point (point d'extremum local ou point col) :

  • si la hessienne est définie positive, la fonction atteint un minimum local strict au point critique ;
  • si la hessienne est définie négative, la fonction atteint un maximum local strict au point critique ;
  • s'il y a des valeurs propres de chaque signe, le point critique est un point col (cf. supra).

Dans ce dernier cas, on définit l'indice du point critique comme la dimension maximale d'un sous-espace sur lequel la hessienne est définie négative. C'est aussi le nombre de valeurs propres négatives.

En dimension deux notamment, le discriminant hessien étant le produit des valeurs propres, son signe suffit à déterminer la nature d'un point critique non dégénéré.

Enfin pour un point critique dégénéré, aucune de ces implications n'est vraie. L'un des exemples les plus simples de point critique dégénéré est la selle de singe.

Courbe hessienneModifier

Si   est la courbe algébrique d'équation projective (homogène)  , on appelle courbe hessienne (ou simplement hessienne) de   la courbe dont l'équation projective est  , où   est le hessien (le déterminant de la matrice hessienne) de  . La hessienne de   a pour intersection avec   les points critiques et les points d'inflexion de  [2]. Si   est de degré  , sa hessienne est de degré   ; d'après le théorème de Bézout, le nombre des points d'inflexion d'une courbe régulière de degré   est donc  , ce qui est un cas particulier d'une des formules de Plücker.

Extension au cadre des variétés différentiellesModifier

Lorsque   est une variété différentielle et   une fonction numérique lisse sur  , il est possible de définir la différentielle   de   en tout point, mais pas la matrice hessienne, comme on le voit en écrivant une formule de changement de cartes. Cependant, lorsque   est un point critique pour la fonction  , la matrice hessienne de   en   peut effectivement être définie. On peut donc parler de point critique dégénéré ou non et prolonger les résultats du paragraphe précédent.

Extension au cadre des variétés riemanniennesModifier

Lorsque   est une variété riemannienne et  , la connexion de Levi-Civita   de la métrique riemannienne   nous permet de définir le tenseur hessien

 

de   par :

 

En coordonnées locales  , le tenseur hessien s'exprime comme :

 

où les   sont les symboles de Christoffel de la connexion  . Le tenseur hessien vérifie les deux propriétés suivantes :

 
 .

Remarque : Si   un point critique de  , l'expression en coordonnées locales du tenseur hessien en   est :

 

Les coefficients du tenseur hessien de   en un point critique   sont donc indépendants de la métrique riemannienne  . Puisque toute variété différentielle   admet une métrique riemannienne auxiliaire, ceci confirme l'affirmation de la dernière section selon laquelle la matrice hessienne d'une fonction réelle lisse   sur   est bien définie en les points critiques de  .


Lemme de MorseModifier

Le lemme de Morse[3] montre que le comportement d'une fonction régulière au voisinage d'un point critique non dégénéré est entièrement déterminé par la connaissance de l'indice du point critique.

Lemme de Morse — Soit f une fonction   sur une variété différentielle de dimension n. On considère un point critique non dégénéré m de la fonction f, et l'on note k son indice. Alors il existe un système de coordonnées locales   centré en m et tel que l'expression correspondante de f est

 .

On qualifie un tel système de coordonnées de Morse.

Il résulte notamment du lemme que les points critiques non dégénérés sont isolés.

Le lemme de Morse se généralise aux espaces de Hilbert sous le nom de lemme de Morse-Palais (en).

Théorie de MorseModifier

Une fonction dont tous les points critiques sont non dégénérés et toutes les valeurs critiques distinctes est appelée fonction de Morse. La théorie de Morse a pour objectif de relier l'étude de la topologie de la variété à celle des points critiques des fonctions qui peuvent y être définies.

Notes et référencesModifier

  1. Comme l'exemple des fonctions constantes le montre, la hessienne en un point de minimum local (resp. de maximum local) peut ne pas être définie positive (resp. définie négative).
  2. (en) G. Salmon, Higher Plane Curves, Stechert (1934)
  3. (en) John Milnor, Morse Theory, Princeton University Press, 1963. (ISBN 0-691-08008-9), p. 6.

Voir aussiModifier

Articles connexesModifier

Lien externeModifier

G. Vial, Mini-cours d’optimisation