En mathématiques, le calcul fonctionnel matriciel est une théorie permettant d'étendre à des matrices une fonction définie initialement uniquement pour des variables réelles ou complexes.
En prolongeant ces définitions, on peut définir pour toute fonctionnelle f complexe définie sur U un ouvert de contenant les valeurs propres de M. Les propriétés de régularité sont à prendre au sens complexe, ainsi on dit qu'une fonction f est -dérivable en z0 si
On considère alors un polynôme P qui interpole f aux points λi et aux ordres mi. On définit alors f(M) par P(M).
Théorème — La fonction matricielle ne dépend pas du choix du polynôme interpolateur P
Démonstration
Supposons P et Q deux polynômes qui interpolent f aux points et ordres voulus :
Ainsi le polynôme P − Q admet les complexes λi comme racines d'ordre au moins mi. Donc pour tout i ∈ {1,...,j}, le polynôme (X − λi)mi divise P − Q. Comme ces derniers polynômes sont deux à deux premiers entre eux,
Il existe donc un polynôme D tel que
Autrement dit, PM divise P − Q. En évaluant cette dernière égalité en M, on obtient P(M)=Q(M) par le théorème de Cayley-Hamilton, ce qui termine la démonstration.
En fait, on aurait pu se contenter d'interpoler f aux ordres de multiplicité géométriques (c'est-à-dire l'ordre des valeurs propres dans le polynôme minimal) pour avoir ce résultat :
Théorème — Soit M ∈ Mn(C) et P,Q ∈ C[X]. Soit le polynôme minimal de M. Les propositions suivantes sont équivalentes.
Le calcul fonctionnel est donc bien défini indépendamment du choix du polynôme interpolateur. Ceci répond en particulier à la question laissée en suspens : le calcul fonctionnel défini pour les matrices diagonalisables ne dépendait pas du choix de la matrice de passage.
Les propriétés du calcul fonctionnel et l'expression du polynôme d'interpolation de Lagrange permettent d'établir la formule suivante, appelée formule de Sylvester. Pour toute matrice M diagonalisable de valeurs propres {λ1, ..., λk} et toute fonction définie sur un voisinage de ces valeurs propres
Il existe des formules analogues dans le cas non diagonalisable.
Cette définition est plus générale et donc adaptée aux matrices non diagonalisables.
On considère alors sa forme de Jordan : pour une matrice M carrée de taille n, avec p valeurs propres {λ1, ..., λp} de multiplicités respectives {m1, ..., mp}, alors il existe une matrice P inversible telle que :
Ce calcul fonctionnel hérite automatiquement des propriétés de morphismes du calcul fonctionnel polynomial : pour toutes fonctions f et g de classe C∞ sur un ouvert U contenant les valeurs propres de M :
On appelle alors exponentielle d'une matrice l'image de l'application
Cette définition est valable pour toute matrice carrée.
Logarithme d'une matrice
On appelle alors logarithme d'une matrice l'image de l'application[1]
.
Cette définition n'est valable pour toute matrice carrée telle que . De même que la fonction logarithme est multivaluée sur le plan complexe, le logarithme principal d'une matrice est une matrice dont les valeurs propres ont une partie imaginaire entre –π et π.
On peut définir le logarithme de toute matrice définie positive hermitienne avec la définition suivante :
.
Polynôme matriciel
Pour tout polynôme , on peut définir le polynôme matriciel :
Cette définition est valable pour toute matrice carrée.
Fonction d'une matrice 2×2
Pour toute fonction f, une matrice 2×2 peut s'écrire
où sont les valeurs propres de la matrice, soit les solutions de l'équation |A − λI| = 0, et qui sont données par
De la même façon qu'une exponentielle de matrice a été définie pour la résolution de systèmes différentiels linéaires du premier ordre, on peut définir une fonction de matrice pour des systèmes différentiels plus généraux. Par exemple, un système différentiel linéaire du second ordre, de la forme :
aura une solution de la forme :
où les cosinus et sinus de matrices sont définies par les séries matricielles :