En mathématiques, la théorie de l'arrêt optimal[1],[2] ou de l'arrêt anticipé[3] concerne le problème du choix d'un moment pour entreprendre une action spécifique, afin de maximiser une récompense attendue ou de minimiser un coût attendu. Des problèmes d'arrêt optimaux peuvent être trouvés dans les domaines des statistiques, de l'économie et des mathématiques financières (liés à la tarification des options américaines). Un exemple clé de problème d'arrêt optimal est le problème du secrétaire. Les problèmes d'arrêt optimal peuvent souvent être écrits sous forme d'une équation de Bellman et souvent résolus à l'aide d'une programmation dynamique.

En temps discret modifier

Les problèmes de règle d'arrêt sont liés à deux entités :

  1. Une séquence de variables aléatoires  , dont la distribution jointe est supposé connu
  2. Une séquence de fonctions de « récompense »   qui dépendent des valeurs observées des variables aléatoires en 1 :
     

En considérant ces éléments, le problème se pose de la manière suivante :

  • Vous observez la séquence de variables aléatoires, et à chaque étape  , vous pouvez choisir d'arrêter l'observation ou de continuer
  • Si vous arrêtez d'observer à l'étape  , vous recevrez une récompense  
  • Vous souhaitez choisir une règle d'arrêt pour maximiser votre récompense attendue (ou de manière équivalente, minimiser votre perte attendue)

En temps continu modifier

Soit un processus de gain   défini sur un espace de probabilité filtré   et supposons que   est adapté à la filtration. Le problème d'arrêt optimal est de trouver le temps d'arrêt   qui maximise le gain attendu

 

  est appelée la fonction valeur . Ici   peut prendre de la valeur   .

Nous considérons un processus de Markov adapté   défini sur un espace de probabilité filtré    désigne la mesure de probabilité à laquelle le processus stochastique commence à   . Étant donné les fonctions continues  , et  , le problème d'arrêt optimal est

 

Parfois, on fait référence à la formulation MLS, abréviation représentant les noms de Mayer, Lagrange et Supremum[4].

Méthodes de résolution modifier

Il existe deux approches pour résoudre les problèmes d’arrêt optimal[4]. Lorsque le processus sous-jacent (ou le processus de gain) est décrit par ses distributions inconditionnelles de dimension finie, la technique de solution appropriée est l'approche martingale, ainsi appelée parce qu'elle utilise la théorie de la martingale, le concept le plus important étant l'enveloppe de Snell. Pour des plages de temps discrètes et un horizon de planification fini, la résolution du problème peut être aisément effectuée en utilisant la programmation dynamique.

Lorsque le processus sous-jacent est déterminé par une famille de fonctions de transition (conditionnelles) conduisant à une famille de probabilités de transition de Markov, de puissants outils analytiques fournis par la théorie des processus de Markov peuvent souvent être utilisés et cette approche est appelée méthode de Markov. La solution est généralement obtenue en résolvant les problèmes de frontière libre (problèmes de Stefan).

Un résultat de diffusion par saut modifier

Soit  , une diffusion Lévy en   donné par le SDE

 

  est un  -dimensionnel mouvement brownien,   est un  -dimensionnel mesure aléatoire de Poisson compensée,  ,  , et   reçoivent des fonctions telles qu'une solution unique   existe. Soit  , un ensemble ouvert (la région de solvabilité) et

 

, le moment de la faillite. Le problème d’arrêt optimal est :

 

Il s’avère que sous certaines conditions de régularité[5], le théorème de vérification suivant est valable :

Si une fonction   satisfait

  •   où se trouve la région de continuation   ,
  •   sur  , et
  •   sur  , où   est le générateur infinitésimal de  

alors   pour tout   . De plus, si

  •   sur  

Alors   pour tout   et   est un temps d'arrêt optimal.

Exemples modifier

Lancer de pièces modifier

(Exemple où   converge)

Vous avez une pièce de monnaie et vous la lancez à plusieurs reprises. À chaque fois, avant qu'il ne soit lancé, vous pouvez choisir d'arrêter de le lancer et d'être payé (en dollars, par exemple) le nombre moyen de piles observés.

 

et si

 

alors les séquences  , et   sont les objets associés à ce problème.

(Exemple où   ne converge pas nécessairement)

Vous possédez une maison et souhaitez la vendre. Chaque jour on vous propose   pour votre maison et vous payez   pour continuer à en faire la publicité. Si vous vendez votre maison le jour  , vous gagnerez  , où   .

Vous souhaitez maximiser le montant que vous gagnez en choisissant une règle d'arrêt.

Dans cet exemple, la séquence (   ) est la séquence d'offres pour votre maison, et la séquence de fonctions de récompense correspond au montant que vous gagnerez.

Problème de secrétaire modifier

(Exemple où   est une suite finie)

Vous cherchez à adopter une séquence d’objets qui peuvent être classés du meilleur au pire. Vous souhaitez choisir une règle d'arrêt qui maximise vos chances de sélectionner le meilleur objet.

Ici, si   ( n est un grand nombre) sont les rangs des objets, et   est la chance que vous choisissiez le meilleur objet si vous arrêtez de rejeter intentionnellement des objets à l'étape i, alors   et   sont les séquences associées à ce problème. Ce problème a été résolu dans les années 1960 par plusieurs personnes. Une solution au problème du secrétaire et plusieurs modifications de ce problème sont fournies par l'algorithme de cotes d'arrêt optimal le plus récent (algorithme de Bruss).

Théorie de la recherche modifier

Les économistes ont étudié un certain nombre de problèmes d'arrêt optimal similaires au « problème du secrétaire » et appellent généralement ce type d'analyse « théorie de la recherche ». La théorie de la recherche s'est spécifiquement penchée sur la quête d'un employé pour un poste à haute rémunération ou la recherche d'un consommateur pour un produit à prix réduit.

Problème de stationnement modifier

Un exemple particulier d'application de la théorie de la recherche est la sélection optimale d'une place de stationnement par un conducteur se rendant à l'opéra (théâtre, shopping, etc.). En arrivant à destination, le conducteur emprunte la rue le long de laquelle se trouvent des places de stationnement – généralement, seules certaines places du parking sont gratuites. L'objectif est clairement visible, ce qui permet d'évaluer facilement la distance par rapport à la cible. La tâche du conducteur est de sélectionner un emplacement de stationnement gratuit le plus proche possible de la destination sans faire demi-tour afin que la distance de cet endroit à la destination soit la plus courte[6].

Négociation d'options modifier

Lors de la négociation d'options sur les marchés financiers, le détenteur d'une option américaine est autorisé à exercer le droit d'acheter (ou de vendre) l'actif sous-jacent à un prix prédéterminé à tout moment avant ou à la date d'expiration. La valorisation des options américaines constitue donc essentiellement un problème d’arrêt optimal. Considérons une configuration classique de Black-Scholes et soit  ,,le taux d’intérêt sans risque ;  , le taux de dividende et  , la volatilité du titre. Le cours de l'action   suit le mouvement brownien géométrique suivant :

 

dans le cadre de la mesure de risque neutre.

Lorsque l’option est perpétuelle, le problème d’arrêt optimal est :

 

où la fonction de paiement est   pour une option d'achat et   pour une option de vente. L'inégalité variationnelle est la suivante :

 

pour tout    est la limite de l’exercice. La solution est connue pour être [7]

  • (Option d'achat perpétuel)    et  
  • (Option de vente perpétuelle)    et  

D’un autre côté, lorsque la date d’expiration est finie, le problème est associé à un problème bidimensionnel à frontière libre sans solution de forme fermée connue. Diverses méthodes numériques peuvent cependant être utilisées, comme le modèle Black-Scholes pour diverses méthodes d'évaluation ici, ainsi que Fugit pour un calcul discret, basé sur un arbre, du moment optimal pour exercer.

Notes et références modifier

  1. Y.S. Chow, H. Robbins et D. Siegmund, Great Expectations: The Theory of Optimal Stopping, Boston, Houghton Mifflin,
  2. Thomas S. Ferguson, Optimal Stopping and Applications, UCLA, (lire en ligne)
  3. Hill, « Knowing When to Stop », American Scientist, vol. 97, no 2,‎ , p. 126–133 (ISSN 1545-2786, DOI 10.1511/2009.77.126, S2CID 124798270)
  4. a et b Goran Peskir et Albert Shiryaev, Optimal Stopping and Free-Boundary Problems, coll. « Lectures in Mathematics. ETH Zürich », (ISBN 978-3-7643-2419-3, DOI 10.1007/978-3-7643-7390-0)
  5. B. Øksendal et A. Sulem, Applied Stochastic Control of Jump Diffusions, (ISBN 978-3-540-69825-8, DOI 10.1007/978-3-540-69826-5, S2CID 123531718)
  6. MacQueen et Miller Jr., « Optimal persistence policies », Operations Research, vol. 8, no 3,‎ , p. 362–380 (ISSN 0030-364X, DOI 10.1287/opre.8.3.362)
  7. Ioannis Karatzas et Steven E. Shreve, Methods of Mathematical Finance, vol. 39, coll. « Stochastic Modelling and Applied Probability », (ISBN 978-0-387-94839-3, DOI 10.1007/b98840)

Articles connexes modifier