Combinatoire analytique

En mathématiques, et plus précisément en combinatoire, la combinatoire analytique (en anglais : analytic combinatorics) est un ensemble de techniques décrivant des problèmes combinatoires dans le langage des séries génératrices, et s'appuyant en particulier sur l'analyse complexe pour obtenir des résultats asymptotiques sur les objets combinatoires initiaux.

Les résultats de combinatoire analytique permettent notamment une analyse fine de la complexité de certains algorithmes.

IntroductionModifier

La combinatoire analytique repose fondamentalement sur deux approches : la première approche, combinatoire, également parfois qualifiée de méthode symbolique, permet de décrire des relations entre des objets mathématiques discrets en les transcrivant directement en termes d'opérations algébriques sur les séries génératrices associées; la deuxième approche, analytique, utilise ou développe des outils d'analyse complexe en vue d'extraire de ces séries génératrices des informations sur le comportement asymptotique du nombre d'objets énumérés. C'est ainsi la nature des singularités de ces séries qui est la clé de l'étude du comportement asymptotique des objets discrets initiaux. Une application importante est l'étude de propriétés probabilistes de grandes structures aléatoires.

Cette théorie a été largement développée notamment par Philippe Flajolet et son école. Elle est détaillée dans son livre avec Robert Sedgewick, Analytic Combinatorics[1]. Elle trouve sa source dans des travaux de précurseurs comme Leonhard Euler, Arthur Cayley, Srinivasa Ramanujan, Gaston Darboux, George Pólya et Donald Knuth.

Classes combinatoireModifier

La méthode symbolique s'appuie sur le concept de classe combinatoire, c'est-à-dire d'ensembles d'objets, où chaque objet a une taille. La méthode permet de traduire des opérations ensemblistes sur les classes en des opérations algébriques sur les séries génératrices associées. On obtient ainsi un processus de traduction purement formel, et automatisable. En pratique, on utilise souvent des séries génératrices dites ordinaires pour les structures non étiquetées, et des séries génératrices exponentielles pour les structures étiquetées. D'autres types de séries génératrices (de Dirichlet, de Poisson, de Bell, de Lambert, de Wright, ...) sont toutefois aussi utilisables.

DéfinitionsModifier

Une classe combinatoire est par définition un ensemble   muni d'une application   appelée taille qui, à chaque élément   de l'ensemble   associe un entier naturel  . On demande de plus que, pour chaque  , le nombre d'éléments de taille   est fini.

Comme la définition le suggère, un même ensemble peut être doté de plusieurs tailles différentes. Ainsi, la taille des arbres binaires peut être leur nombre de sommet; une autre taille est leur hauteur. Mais le nombre de feuilles n'est pas une taille valide, parce qu'il existe une infinité d'arbres binaires « filiformes » (où chaque nœud n'a qu'il seul enfant) qui n'ont qu'une feuille unique. En général, un objet d'une certaine taille est formé de composants élémentaires que l’on appelle parfois des atomes (comme les sommets d'un graphe par exemple).

Soit maintenant   un ensemble combinatoire, et soit   le nombre d'éléments de taille   de  . La série génératrice ordinaire associée à   est par définition la série   définie par

 .

Il est parfois commode de considérer une autre expression équivalente pour la série, à savoir :

 .

On considère aussi, dans le cas de structures étiquetées, des séries génératrices exponentielles dont il sera question plus bas.

En général, les séries génératrices associées au dénombrement d'objets combinatoires sont des séries formelles, que l'on peut manipuler sans considération de convergence (au sens de convergence dans les réels ou dans les complexes), mais il existe en fait une notion de convergence dans l'anneau des séries formels qui repose sur la valuation des séries et qui donne un cadre rigoureux à toutes les manipulations mentionnées ci-après. Dans le cadre de la combinatoire analytique, les questions de convergence jouent d'ailleurs un rôle, puisqu'on étudie le comportement des séries en des points précis, dans le cadre de l’analyse complexe. L'observation fondamentale utilisée - qui est explicitée plus loin - est que la nature de la singularité sur l'axe réel positif donne des informations précises sur la croissance des nombres   d'objets de taille  .

Une notation utile pour l'extraction de coefficients d'une série génératrice   est la suivante : on désigne par   le coefficient de la variable  , de sorte que, pour

 ,

on a :

 .

Dans la suite de cet article, on parlera parfois avec un léger abus de langage des coefficients d'une fonction, pour désigner les coefficients du développement de Taylor en 0 de cette fonction.

ExemplesModifier

Quelques exemples usuels sont les suivants.

  • Classe des mots sur un alphabet binaire, la taille est la longueur du mot. Il y a   mots de longueur  . La série génératrice est  .
  • Compositions d'entiers (une composition d'un entier positif   est une suite   d'entiers positifs tels que  ). Chaque entier positif   possède   compositions. La série génératrice est  .
  • Arbres binaires complets. Le nombre d'arbres binaires complets à   nœuds internes est  , et la série génératrice est  .

La méthode symboliqueModifier

La méthode symbolique est un procédé qui permet de traduire directement des relations entre classes combinatoires dans les séries génératrices correspondantes. L'algorithme consiste à commencer avec des classes combinatoires très simples, et à les composer à l'aide d'opérateurs au comportement connu. Ces opérateurs ensemblistes comprennent diverses opérations simples, comme la réunion disjointe, le produit cartésien; d'autres opérations, comme l'ensemble des parties, la formation de suites, de multiensembles sont un peu plus complexes. Enfin des définitions récursives sont possibles. L'attrait de la méthode est que la définition ensembliste, ou symbolique, se traduit directement en de relations algébriques sur les fonctions génératrices.

Deux types de séries génératrices sont utilisées usuellement en combinatoire, les séries génératrices ordinaires, pour des classes combinatoires d'objets non étiquetés, et des séries génératrices exponentielles, pour des classes combinatoires d'objets étiquetés,

Il est d'usage, dans cette théorie, de noter les classe combinatoires par des lettres cursives, et leurs séries génératrices par les mêmes lettres, droites. Ainsi, les séries associées à des classes combinatoires   ou   sont notées respectivement   et  .

Constructions élémentairesModifier

Les briques de base sont des classes formées d'un seul objet. Deux types de classes sont utiles : celles où le singleton est de taille nulle, et celles dont le singleton est de taille un. Une classe   du premier type a donc un élément   de taille nulle, et sa série génératrice est la fonction constante  . Une classe   du deuxième type a un seul élément, de taille un, et sa série génératrice est ainsi  . Les opérations élémentaires sont l'union disjointe, le produit cartésien, la formation de suites.

Union disjointeModifier

On écrit   si la classe   est l’union disjointe des classes   et  . Cette relation se traduit en séries génératrices par

 

puisqu'en effet

 .

Produit cartésienModifier

On écrit   si la classe   est l'ensemble des couples  , avec   et  . La fonction taille est définie par  . On a alors, pour les séries génératrices, la relation

 .

SéquencesModifier

On écrit   lorsque   est l'ensemble des suites finies d'éléments de  . Cette construction est aussi appelée étoile de Kleene en théorie des langages. On peut l'écrire plus formellement comme

 , ou encore  .

La taille d'une suite   est la somme des tailles de ses composants. Pour que l’opération soit bien définie, la classe   ne doit pas contenir d'élément de taille 0 car sinon la classe   contiendrait une infinité d'éléments d'une taille donnée. La traduction en séries génératrices est

 .

La série   est appelée parfois le quasi-inverse de la série  .

Définition récursiveModifier

Lorsque certaines conditions assez techniques sont remplies[2], on peut définir une classe combinatoire de façon récursive. Voici des exemples.

Arbres binairesModifier

Le premier exemple est celui des arbres binaires. Un arbre binaire est soit l’arbre binaire vide, soit formé d'une racine et de deux sous-arbres qui sont des arbres binaires. L'équation de la classe combinatoire   des arbres binaires est donc :

 ,

  est réduite à un élément de taille 0 et   est composé d'un élément de taille 1. Cette équation se traduit en l’équation

 .

Arbres unaires-binairesModifier

Un arbre unaire-binaire est un arbre où chaque nœud interne a un ou deux enfants. L'équation symbolique s'écrit

 

d'où l'on déduit l'équation fonctionnelle

 .

ExemplesModifier

On peut employer la méthode symbolique même dans des cas très élémentaires :

Mots binairesModifier

Un mot binaire est une suite de symboles 0 et 1. On a deux classes combinatoires   et   dont la série génératrice est  . Les mots binaires sont donnés par la construction

 ,

leur série génératrice est

  et  .

C'est utiliser une grosse artillerie pour un exemple tout simple.

Composition restreinte d'entiersModifier

Le problème est de couvrir le segment   avec des briques de taille 1 et 2, en d'autre termes d'écrire l'entier   comme une somme dont les termes sont 1 ou 2, et de compter le nombre de façons de le faire. Par exemple, l'entier 4 possède les cinq écritures :

4=1+1+1+1=1+1+2=1+2+1=2+1+1=2+2 .

Il est facile de voir directement que le nombre de ces compositions de   est  , le  e nombre de Fibonacci. Pour utiliser la méthode symbolique, on considère deux classes   et   composées d'un élément unique de taille 1 et de taille 2 respectivement. Alors la classe de couvertures est

 

et la série génératrice est :

 .

Autres constructions symboliquesModifier

D'autre constructions symboliques importantes sont : Cycles. Les cycles   sont comme des séquences, sauf que deux objets qui s'obtiennent l'un de l'autre par une rotation circulaire ne sont pas considérés comme distincts. La série génératrice est nettement plus compliquée; dans le cas étiqueté, elle est plus simple. Ici, elle s'écrit

 

  est l'indicatrice d'Euler. Classe pointée. La classe   est formée d'objets de   qui sont « pointés » : dans chaque objet, un atome est distingué. Par exemple, les arbres enracinés sont des arbres libres pointés. Formellement, chaque objet est augmenté d'un élément de taille zéro sur un de ses atomes. La série génératrice est

 .

Substitution. La classe   est obtenue en substituant, à chaque atome d'un élément de  , un élément de la classe  . La série génératrice est simplement  .

AnalyseModifier

Les méthodes d'analyse complexe se concentrent autour du processus d'extraction d'informations asymptotiques à partir de fonctions génératrices. Il existe un ensemble de résultats qui fournissent une traduction systématique entre fonctions génératrices et la forme asymptotique des coefficients.

Dans la plupart des situations qui se présentent en combinatoire, une série formelle

 

de dénombrement peut être vue comme le développement, autour de 0, d'une fonction analytique  . Le rayon de convergence   de la série est donné par exemple par

 .

Ceci signifie que

 )

  est une fonction sous-exponentielle de  . Il y a donc au moins une singularité sur le bord du disque de convergence, et un théorème classique de Pringsheim dit que si les coefficients   sont positifs, ce qui est bien le cas dans des séries énumératrices, alors il existe une singularité réelle positive au point  .

Cas des séries rationnellesModifier

Pour les séries rationnelles, une décomposition en éléments simples donne une forme close pour le terme  , qui s'écrit donc comme une somme de termes de la forme  . Ainsi, si la singularité dominante R est de multiplicité  , alors

 .

Exemple. On considère la série rationnelle

 .

Ses singularités sont   (où   désigne le nombre d'or). La singularité dominante est 1/2, et sa multiplicité est 5. On a donc

 .

Cas des séries algébrico-logarithmiquesModifier

Considérons maintenant la classe des fonctions algébrico-logarithmiques, c'est-à-dire les sommes et produits de   et de  . Pour des séries génératrices ayant une telle forme, des méthodes d'analyse complexe[3] donnent l'asymptotique suivante pour leurs coefficients, exprimée ici dans le cas où la singularité est 1 (on peut toujours s'y ramener par un changement de variable):

Soient   et  . On a
 ,
  est la fonction Gamma usuelle.

Cet équivalent asymptotique peut en fait être poussé à n'importe quel ordre, ce qui donne par exemple[4] :

Fonction Coefficients
   
   
   
   
   
   

Remarquons que la classe des fonctions algébrico-logarithmiques n'englobe pas toutes les fonctions algébriques, mais toute fonction algébrique possède un développement en série de Puiseux qui est une somme infinie de briques de base du type  , et la troncation de cette somme à un ordre donné est bien une fonction algébrico-logarithmique. Le théorème de transfert détaillé dans la section suivante permet de lier le développement asympotique des coefficients de la somme infinie et de sa truncation.

Le théorème de transfertModifier

Le théorème de transfert[5] énonce qu'il suffit de connaître le comportement de deux fonctions autour de leur plus petite singularité pour pouvoir comparer le comportement asymptotique de leurs coefficients. L'énoncé est le suivant.

Soient   et  ) deux fonctions dont la plus petite singularité est 1. Alors — Si  , alors  .
— Si  , alors  .
— Si  , alors  .

Un exempleModifier

On retrouve comme suit l'évaluation asymptotique du nombre d'arbres binaires. On part de l'équation symbolique

 ,

  est réduite à un élément de taille 0 et   est composé d'un élément de taille 1. Cette équation se traduit en l’équation

 .

On résout l'équation et on trouve

 .

La fonction a une singularité algébrique en  , d'exposant  . Autour de  , on a

 

et, par le théorème précédent sur les singularités algébrico-logarithmiques, on obtient

 

parce que  .

Classes combinatoires étiquetéesModifier

Une classe combinatoire est étiquetée si ses éléments sont étiquetés. Par définition, un tel objet combinatoire, de taille  , est de plus doté d'une permutation de  . Les exemples les plus pertinents d'objets étiquetés sont les graphes.

Pour énumérer les objets d'une classe étiquetée, on emploie des séries génératrices exponentielles, où les coefficients sont normalisées par une factorielle.

DéfinitionModifier

Plus formellement, soit   une classe combinatoire étiquetée, et soit  , pour  , le nombre d'objets de taille   dans cette classe. La série génératrice exponentielle associée à   est

 .

Il est équivalent d'écrire

  .

L'extraction d'un coefficient de cette série donne

 , donc  .

ExemplesModifier

Permutations. Soit   la classe des permutations. Sa série génératrice exponentielle est

 .

Graphes sans arête. Il existe, pour chaque entier n, un seul graphe sans arête. La série génératrice correspondante est

 

La même série compte les graphes complets.

Graphes cycliques. Le nombre de graphes étiquetés de n sommets formés d'un seul cycle est (n-1)!. Leur série génératrice exponentielle est donc

 .

ConstructionsModifier

ProduitModifier

La construction d'une somme disjointe de classes combinatoires se transpose sans modifications aux classes étiquetées. Pour le produit, il faut être plus attentif. Soient   et   deux classes combinatoires étiquetées. Le produit cartésien est formé de couples   d'objets étiquetées, mais un tel couple n’est pas correctement étiqueté puisque ses éléments n'ont pas des étiquettes distinctes. On définit une structure   associée, dont les éléments ont exactement les étiquettes  , et où l'ordre relatif des étiquettes de chaque élément est respecté. On définit

 

comme l'ensemble des couples   ainsi ré-étiquetés. La famille   contient exactement   éléments. Le produite étiqueté des classes   et   est par définition

 .

Pour les séries génératrices exponentielles, on a

 .

En effet, pour   et  , on a

 ,

et donc

 .

SéquenceModifier

À partir de la somme disjointe et du produit, on construit l'opérateur de séquence comme dans le cas ordinaire : On écrit   lorsque   est l'ensemble des suites finies d'éléments de  ; ici   n'a pas d'élément de taille nulle. En d'autres termes,

 ,

ou encore  , où les suites son ré-étiquetées. La série génératrices exponentielle est

 .

Ensemble des partiesModifier

Les définitions d'ensemble et de cycle donnée ici s'appliquent aussi bien aux structures non étiquetées. On définit la classe

 

comme la classe des parties de la classe   contenant   éléments. On peut voir cette classe comme la classe quotient de

 ,

  est l’ensemble des suites à   éléments de  , et où   met en équivalence deux suites qui sont les mêmes à une permutation de ses éléments près. On a

 .

La classe des parties de la classe   est par définition

 ,

et la série génératrice exponentielle correspondante est

 .

CycleModifier

On définit la classe

 

comme la classe des cycles de   éléments de la classe  . On peut la voir comme le quotient de la classe des suites de longueur   d'éléments de   par l'ensemble des permutations circulaires de ses éléments. On a

 .

La classe des cycles de la classe   est par définition

 ,

et la série génératrice exponentielle correspondante est

 .

Deux cas particuliers sont l'opérateur de construction des cycles de longueur paire, et celui de longueur impaire, qui sont respectivement

  et  .

Leurs séries génératrices sont respectivement

  et  .

ExemplesModifier

Permutations. Une permutation peut être vue comme un ensemble de cycles de supports disjoints. Ceci conduit à l'équation symbolique

 ,

  est la classe formée d'un seul élément de taille 1. La série génératrice exponentielle est

 .

Involutions. Une involution est une permutation   telle que  . On peut voir une involution comme un ensemble de cycles de longueur 1 ou 2 à supports disjoints. L'équation symbolique est donc

 ,

et a série génératrice exponentielle est  . Un calcul élémentaire permet d'obtenir l'expression close

 

Dérangements. Un dérangement est une permutation sans point fix. La définition symbolique est

 ,

et la fonction génératrice exponentielle est

 .

Pour évaluer le nombre d_n de dérangements de taille  , on observe que la singularité de   est en  . Autour de ce point, le développement de   est

 , de sorte  .

Arbres. Un arbre enraciné est formé d'un sommet et d'un ensemble de sous-arbres. Ce sont des structures étiquetées ou non. Pour les arbres étiquetés, l'équation symbolique est

 ,

et la série exponentielle correspondante est :

 .

Pour un arbre plane enraciné et non étiqueté, formé d'un sommet et d'une suite de sous-arbres, l'équation symbolique est

 ,

et la série génératrice ordinaire est :

 .

Multi-ensembleModifier

La construction de la classe des multi-ensembles ou parties avec multiplicité est semblable à celle des parties. Dans la classe

 ,

chaque élément de   peut figurer un nombre arbitraire de fois dans une partie. On obtient :

 

Ceci conduit à la relation (ici   est le nombre d'éléments de taille   de  ) :

 

Un exemple d'application est constitué des partitions d'entiers. On définit d'abord la classe des entiers positifs, notée ici  , où la taille de chaque entier est sa valeur

 .

La série génératrice de  iest alors

 

L'ensemble des partitions d'entiers est la classe des multi-ensembles d'entiers positifs. Si on la note  , on obtient donc la formule

 

La série génératrice de   est

 

Il n'y a pas de formule close connue pour cette série, mais on peut calculer la valeur asymptotique de ses coefficients.

Notes et référencesModifier

  1. Flajolet et Sedgewick 2008.
  2. Flajolet et Sedgewick 2008, Chap I, §2.3.
  3. Flajolet et Sedgewick 2008, Theorem VI.2, p. 385.
  4. Flajolet et Sedgewick 2008, Figure VI.5, p. 388.
  5. Flajolet et Sedgewick 2009, Transfer Theorem, Th. VI.3, p. 390.
(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Analytic Combinatorics » (voir la liste des auteurs).

BibliographieModifier

  • (en) Herbert Wilf, Generatingfunctionology, Academic Press, 1990, (ISBN 0-12-751955-6). (lire en ligne)
  • Jérémie Lumbroso et Basile Morcrette, « A Gentle Introduction to Analytic Combinatorics », dans CIMPA Summer School Analysis of Random Structures, An Najah University, Naplouse, Palestine, 18-27 août 2014 (lire en ligne)  
  • François Bergeron, Gilbert Labelle et Pierre Leroux, Combinatorial Species and Tree-like Structures, Cambridge University Press, coll. « Encyclopedia of Mathematics and its Applications » (no 67), , 457 p. (ISBN 9780521573238) — Version française : Théorie des espèces et combinatoire des structures arborescentes, LaCIM, Montréal (1994).
  • (en) Philippe Flajolet et Robert Sedgewick, Analytic Combinatorics, Cambridge University Press, (ISBN 0-521-89806-4, lire en ligne)
  • Micha Hofri, Analysis of Algorithms: Computational Methods and Mathematical Tools, Oxford University Press (1995).
  • Robin Pemantle et Mark C. Wilson, Analytic Combinatorics in Several Variables, Cambridge University Press, coll. « Cambridge Studies in Advanced Mathematics » (no 140), , 392 p. (ISBN 978-1107031579).