Fonctionnelle de Minkowski

(Redirigé depuis Jauge d'un convexe)

En géométrie, la notion de jauge généralise celle de semi-norme. À toute partie C d'un -espace vectoriel E on associe sa jauge, ou fonctionnelle de Minkowski pC, qui est une application de E dans [0, +∞] mesurant, pour chaque vecteur, par quel rapport il faut dilater C pour englober ce vecteur. Dès que C contient l'origine, pC est positivement homogène ; si C est étoilée par rapport à 0, pC possède d'autres propriétés élémentaires. Si C est convexe — cas le plus souvent étudié — pC est même sous-linéaire, mais elle n'est pas nécessairement symétrique et elle peut prendre des valeurs infinies. Sous certaines hypothèses supplémentaires, pC est une semi-norme dont C est la boule unité.

Cette notion intervient en analyse fonctionnelle (démonstration de la forme analytique du théorème de Hahn-Banach), en optimisation (problème de recouvrement par jauge, optimisation conique), en apprentissage automatique, en géométrie des nombres (second théorème de Minkowski), etc.

Dans tout cet article, E désigne un espace vectoriel réel, qu'on supposera topologique chaque fois que nécessaire.

Jauge d'une partie quelconque

modifier

Définition — La « jauge, ou fonctionnelle de Minkowski[1] » d'une partie   de   est l'application   définie par :

 [2].
Exemple
Soient   et   tel que  . Pour tout  ,   et pour tout  ,  inf(∅) = +∞.
Premières remarques
  •  [note 1]. En particulier,   si  , et l'on a :

Condition suffisante de finitude —  Si   est absorbante alors   est à valeurs finies.

  •   est décroissante : pour toutes parties   et  ,
     .
  • Les ensembles de sous-niveau de   sont homothétiques :
     
    ou, ce qui est équivalent : pour tout vecteur  ,  .
  • Par conséquent,   est :
  •   (donc si   est symétrique par rapport à 0 alors  ).
  •  .
  • Si   alors   donc   est positivement homogène, c'est-à-dire que l'équation fonctionnelle précédente est vérifiée non seulement pour   mais aussi pour  [note 2] :

     .

    La section suivante montre que réciproquement, toute fonction positivement homogène de   dans   est une jauge (c'est-à-dire : est la jauge d'une partie de  [note 3]).

Jauge d'une partie étoilée

modifier

Avant d'affiner l'étude dans le cas particulier plus utile d'un convexe contenant 0, considérons[3] une partie étoilée (par rapport à 0, ce qui sera désormais implicite), c'est-à-dire une partie   contenant 0 et telle que

 .

Propriétés algébriques

modifier

On sait déjà que   et que   est positivement homogène. La nouvelle hypothèse permet de préciser la situation :

Caractérisation — La jauge d'une partie étoilée   vérifie :
 .

Réciproquement, pour toute fonction   positivement homogène (au sens défini ci-dessus), les parties étoilées de jauge   sont les ensembles compris entre   et  .

En outre :

  • pour toutes parties étoilées   et  ,   (ce qui est plus précis que la simple décroissance de  ) ;
  •  [note 4] donc  , ce qui fournit la première des deux équivalences ci-dessous ;
  • la condition suffisante de finitude trouvée précédemment pour une partie quelconque devient nécessaire (seconde équivalence).

Conditions nécessaires et suffisantes de non dégénérescence et de finitude — Soit   une partie étoilée.

  •   ne s'annule qu'en 0 si et seulement si   ne contient aucune demi-droite issue de l'origine.
  •   est à valeurs finies si et seulement si   est absorbante.

Ces deux conditions seront reformulées plus loin, dans le cas d'un convexe en dimension finie.

Propriétés topologiques

modifier

L'une des deux inclusions de la caractérisation ci-dessus est parfois une égalité :

  • si S est ouvert alors   ;
  • si S est fermé alors  .

Jauge d'un convexe

modifier

Si une jauge   nulle en 0 est convexe alors les deux ensembles   et   sont non seulement étoilés mais convexes, et   est la jauge de ces deux convexes. Les jauges de ce type sont caractérisées par la propriété suivante.

Une application   est dite sous-linéaire si elle est :

Toute application sous-linéaire est convexe et pour une jauge nulle en 0, ces deux notions sont équivalentes :

Jauge d'un convexe — Si une partie contenant 0 est convexe alors sa jauge est sous-linéaire[4].

La réciproque est fausse, comme le montre l'exemple suivant.

Exemple

modifier

La fonction sous-linéaire   sur   qui, en  , vaut   si   et   si  , est la jauge des deux convexes   et  , ainsi que de tous les ensembles intermédiaires (tous étoilés, mais pas tous convexes).

Jauges sous-linéaires ne prenant pas la valeur +∞

modifier

On a déjà remarqué que la jauge d'une partie étoilée   est à valeurs finies si et seulement si   est absorbante.

Tout voisinage de 0 est absorbant ; en dimension finie, on vérifie facilement que réciproquement, tout convexe absorbant C est un voisinage de 0 — on peut le faire assez élégamment en remarquant qu'en tant que fonction convexe à valeurs finies et définie partout,   est alors continue, et que l'ensemble   (contenant 0 et inclus dans C) est donc ouvert. En résumé :

Proposition — Soit C un convexe contenant 0 dans un espace de dimension finie. Alors, sa jauge est à valeurs finies si et seulement si 0 est intérieur à C.

Lorsque 0 est intérieur à C, on peut se faire une image mentale simple de la jauge via ses surfaces de niveau : l'ensemble des points où elle prend la valeur 1 est exactement la frontière du convexe ; les surfaces de niveau pour les autres valeurs strictement positives sont les homothétiques de cette frontière ; en les éventuels points restant non couverts par la réunion de ces surfaces de niveau, la jauge prend la valeur 0.

On peut enfin remarquer que (pour un espace vectoriel réel), si C est symétrique par rapport à 0 avec une jauge évitant la valeur +∞, la jauge est alors une semi-norme ; il en est de même pour un espace vectoriel complexe si l'on exige une version améliorée de la symétrie, à savoir l'invariance sous multiplication par n'importe quel complexe de module 1.

Jauges sous-linéaires ne s'annulant qu'en l'origine

modifier

On a déjà remarqué que la jauge d'une partie étoilée   ne s'annule qu'en l'origine si et seulement si   ne contient aucune demi-droite issue de l'origine.

Si   est bornée (dans un espace vectoriel normé ou plus généralement, dans un espace vectoriel topologique séparé) alors elle ne contient aucune telle demi-droite.

La réciproque est vraie pour un convexe fermé en dimension finie, et se démontrerait en exploitant la compacité de la sphère de rayon 1 (la seule hypothèse « convexe » ne suffit pas ici : cf. § « Exemple » ci-dessus) :

Proposition — Soit C un convexe fermé contenant 0 dans un espace de dimension finie. Alors, sa jauge ne s'annule qu'en l'origine si et seulement si C est borné.

Exemples d'utilisation

modifier
  • Dans la théorie des espaces vectoriels topologiques, c'est par l'introduction d'une collection appropriée de jauges qu'on peut caractériser les espaces localement convexes en termes de semi-normes[5].
  • En géométrie des convexes, la jauge est un outil intéressant pour ramener un problème purement géométrique (recherche d'un hyperplan) à un problème analytique (recherche d'une équation de l'hyperplan). Ainsi dans la preuve de la « forme géométrique » du théorème de Hahn-Banach — fondement de toute la théorie de la séparation des convexes et des hyperplans d'appui —, un pas essentiel est la constatation qu'exiger de l'hyperplan d'équation f(x) = 1 qu'il évite un convexe donné C (ouvert et contenant 0), c'est la même chose que de demander à f de majorer pC.

Aspects calculatoires

modifier

Dans cette section[6], il s'agira exclusivement de jauges sous-linéaires sur un espace euclidien  , dont le produit scalaire est noté  .

Pour une telle jauge  , nous noterons   son ensemble de sous-niveau   :

 .

Rappelons que l'adhérence d'une partie   de   est notée   et que le polaire de   est le convexe fermé contenant l'origine, noté et défini par

 

On peut donner une autre expression du polaire de   :

 .

Adhérence

modifier

L'adhérence ou la fermeture de   est la jauge   telle que  .

Par conséquent :

  •   est la plus grande jauge fermée minorant   ;
  • les épigraphes de   et   sont reliés par  .

Polaire

modifier

La polaire de   est la jauge   telle que  .

Propriétés
  •   est fermée.
  •  [7].
  • La bipolaire de   est égale à son adhérence :   (car  , d'après les propriétés de l'ensemble bipolaire).
  • La polaire de   est égale à la fonction d'appui[note 5]   de  , donc à la conjuguée[note 6] de la fonction indicatrice[note 7] de  .
  • Si   est une norme,   est sa norme duale[note 8] (en particulier si   est la norme euclidienne,  ).
  • Inégalité de Cauchy-Schwarz généralisée : [note 1],[8] donc (en remplaçant   par  ) ,ce qui renforce l'inégalité précédente puisque  .

Sous-différentiel

modifier

Le sous-différentiel   de   en un point   vérifie

 

(en particulier,   et si  ,  ).

On en déduit :

 argmax , avec égalité si   est fermée.

Quelques remarques sur le résultat ci-dessus.

  • Il existe des jauges   et des points   pour lesquels l'inclusion ci-dessus est stricte.
    C'est le cas, dans le plan euclidien, pour la jauge   du § « Exemple » ci-dessus et le point   :  , tandis que   donc  .
  •   est sous-différentiable[note 9] en tout point de   si, et seulement si, 0 est intérieur à  .
    En effet (voir supra) 0 est intérieur à   si et seulement si   ne prend que des valeurs finies. Or si   ne prend que des valeurs finies alors elle est sous-différentiable en tout point (puisqu'elle est convexe), et réciproquement (puisque  ).

Notes et références

modifier
  1. a et b Le domaine effectif   d'une fonction   à valeurs dans est l'ensemble des points où elle ne prend pas la valeur  .
  2. Par convention,   (cf. par exemple Rockafellar 1970, p. 24 ou Schechter 1997, p. 313).
  3. Cette précision, redondante dans cet article, sera dorénavant implicite. Noter cependant que (en) H. G. Eggleston, Convexity, Cambridge University Press, (lire en ligne), p. 47 appelait « fonctions jauges » les applications sous-linéaires (à valeurs dans  ) ; (en) A. Wayne Roberts et Dale E. Varberg, Convex Functions, Academic Press, (lire en ligne), p. 216, nommaient ainsi celles à valeurs dans   ; et Rockafellar 1970, p. 128, celles à valeurs dans  , car il excluait de son étude les jauges d'ensembles non convexes.
  4. Ce cône est noté   dans l'article « Cône asymptotique », où   est supposé convexe.
  5. La fonction d'appui d'une partie   de   est définie par  .
  6. La conjuguée   d'une fonction   est définie par  .
  7. En analyse convexe, la fonction indicatrice d'une partie d'une partie   de   est la fonction qui s'annule sur   et prend la valeur   sur le complémentaire de  .
  8. Pour le voir, on peut par exemple utiliser la relation   précédente.
  9. On dit que   est sous-différentiable en   si  .

Références

modifier
  1. Aliprantis et Border 2006. De nombreux auteurs ne la définissent que pour un convexe contenant 0 :
    • Claude Berge, Espaces topologiques : fonctions multivoques, Dunod, , chap. VII, § 5 ;
    • Laurent Schwartz, Analyse hilbertienne, Hermann, , p. 44 ;
    • A. Badrikian, « Remarques sur les théorèmes de Bochner et P. Lévy », dans Symposium on Probability Methods in Analysis, Springer, coll. « Lecture Notes in Math. » (no 31), , p. 1-19, p. 3 : « V un voisinage de zéro convexe équilibré ouvert et PV sa jauge (ou « fonctionnelle de Minkowski ») » ;
    • Gilbert Demengel et Françoise Demengel, Espaces fonctionnels : Utilisation dans la résolution des équations aux dérivées partielles, EDP Sciences (lire en ligne), p. 51, exercice 1. 7 : « un ensemble convexe, équilibré et absorbant d'un espace vectoriel topologique X, contenant 0. On définit la fonctionnelle de Minkowski p, ou encore jauge du convexe » ;
    • etc.
  2. Dans le cas d'une partie   étoilée par rapport à 0, ceci équivaut à la définition par Schechter 1997 de sa « fonctionnelle de Minkowski » :   est la borne inférieure de l'intervalle  , qui contient  .
  3. Schechter 1997, Aliprantis et Border 2006.
  4. Nawfal El Hage Hassan, Topologie générale et espaces normés, Dunod, (1re éd. 2011) (lire en ligne), p. 428.
  5. Cédric Villani, « Analyse II : cours donné à l'École normale supérieure de Lyon », 2003-2004, § I.2.
  6. Les résultats de cette section sont repris de Rockafellar 1970, Hiriart-Urruty et Lemaréchal 2004, Friedlander, Macêdo et Pong 2014 et Gilbert 2016.
  7. Cette propriété tient lieu de définition de   dans Rockafellar 1970, p. 128.
  8. Rockafellar 1970, p. 130.

Bibliographie

modifier
  • (en) Charalambos D. Aliprantis et Kim C. Border, Infinite Dimensional Analysis: A Hitchhiker's Guide, Springer, , 3e éd. (1re éd. 1994) (lire en ligne), chap. 5.8 (« Sublinear functions and gauges »), p. 190-194
  • (en) M. Friedlander, I. Macêdo et T. K. Pong, « Gauge optimization and duality », SIAM Journal on Optimization, vol. 24, no 4,‎ , p. 1999-2022 (DOI 10.1137/130940785, arXiv 1310.2639)
  • (en) J. Ch. Gilbert, « On the solution uniqueness characterization in the L1 norm and polyhedral gauge recovery », Journal of Optimization Theory and Applications, vol. 1, no 1,‎ , p. 1-32 (DOI 10.1007/s10957-016-1004-0)
  • (en) Jean-Baptiste Hiriart-Urruty et Claude Lemaréchal, Fundamentals of Convex Analysis, Berlin Heidelberg New York, Springer, coll. « Grundlehren Text », (1re éd. 2001) (lire en ligne), p. 128-130
  • (en) R. Tyrrell Rockafellar, Convex Analysis, Princeton, New Jersey, Princeton University Press, coll. « Princeton Mathematical Series » (no 28), (lire en ligne)
  • (en) Eric Schechter, Handbook of Analysis and Its Foundations, Academic Press, (lire en ligne), « Minkowski Functionals », p. 315-317