Utilisateur:Vers75/Brouillon1

En combinatoire, et particulièrement en combinatoire des mots un mot fermé est un mot qui commence et fini par un mot sans contenir d'autres occurrences de . Un mot de fermé est aussi appelé un mot de retour complet.

Ces mots permettent de séparer deux occurrences consécutives d'un facteur dans un mot infini, et ainsi de découper des mots infinis en un produit de facteurs finis, et leur nombre et leurs occurrences permettent de caractériser des familles de mots infinis comme les mots sturmiens.

Définition et exemples modifier

Un mot   est fermé s'il est constitué d'au plus une lettre, ou s'il possède un bord (un préfixe et suffixe tous deux non vides) qui apparaît exactement deux fois dans  [1],[2] , formellement s'il appartient à l'ensemble  , pour un mot   et où   est l'alphabet. Les premiers mots fermés sur un alphabet binaire sont

 .

Le plus long bord d'un mot fermé est appelé sa frontière. Par exemple, le mot   est fermé, sa frontière est le mot  . Un mot est ouvert s'il n'est pas fermé. Le mot   est ouvert, car il est sans bord. Le mot   aussi est ouvert : sa frontière est  , mais elle apparaît trois fois dans ce mot.

Un mot   est un mot de retour complet pour un mot   s'il commence par  , se termine par   et ne contient pas   en facteur interne, formellement s'il appartient à l'ensemble  , où   est l'alphabet. Ainsi,   est un mot de retour complet pour un mot   si   est fermé et sa frontière est  . Un mot réduit à une lettre est un mot de retour complet. Un mot de retour (sans la spécification « complet ») pour un mot   est un mot   tel que   est un mot de retour complet pour  . Par exemple,   est un mot de retour pour   puisque  est un mot de retour complet. Un mot de retour pour   est donc   en préfixe ou est un préfixe de  .

Soit   un mot infini et soit   un préfixe de  . On considère l'ensemble   des débuts d'occurrence de   dans  . Si   sont deux éléments consécutifs de  , alors le facteur   de   qui commence en position   et se termine en position   est un mot de retour.

Exemple 1 : mot de Champernowne

Soit   le mot de Champernowne binaire formé de la concaténation des développements binaires des entiers naturels. Les débuts d'occurrences du facteur   sont en position  , et le mot de Champernowne est le produit des mots de retour commençant en ces positions, soit  . Comme le mot est récurrent (tout facteur du mot apparaît une infinité de fois dans le mot), cette factorisation du mot de Champernowne en un produit infini de facteurs fini est possible.

Exemple 2 : Mot de Fibonacci

Le mot de Fibonacci   est uniformément récurrent. Par exemple, les occurrences du chiffre   dans ce mot infini sont les éléments de la suite A001950 de l'OEIS, soit 1, 4, 6, 9, 12, 14, 17,... en commençant la numérotation à 0. La distance entre deux   consécutifs est donc au plus 3.

Le préfixe 010 apparaît aux positions 0, 3, 5, 8,..., et le mot se factorise en  . Les mots de retour pour   dans le mot de Fibonacci sont au nombre de deux : ce sont   et  .

Les mots de retour pour un préfixe d'un mot infini sont en nombre fini seulement si ce préfixe apparaît à distance bornée, ce qui est le cas lorsque le mot infini est uniformément récurrent. Les mots de retour sont des mots finis seulement si ce préfixe apparaît une infinité de fois, ce qui est le cas lorsque le mot est récurrent.

Mots de retour des mots sturmiens modifier

Les mots sturmiens sont caractérisés comme suit par leurs mots de retour[3] :

  • Dans tout mot sturmien, tout préfixe possède exactement deux mots de retour. Il est équivalent de dire que la distance entre deux occurrences consécutives d'un préfixe d'un mot sturmien prend exactement deux valeurs.
  • Réciproquement, si tout préfixe d'un mot infini possède exactement deux mots de retour, alors ce mot est sturmien.

On peut aussi voir cette propriété comme suit : un mot sturmien s'écrit comme un produit infini de deux facteurs fini. En renommant ces facteurs, le produit de ces symboles est un mot infini qui est à nouveau sturmien, sur ce nouvel alphabet.

On peut caractériser les mots points fixes de morphismes par leurs mots de retour[4].

Complexité ouverte et fermée modifier

La complexité fermée d'un mot   (fini ou infini) est la fonction qui, à chaque entier  , associe le nombre   de facteurs fermés de longueur   dans  . De même, la complexité ouverte associe à chaque entier  , associe le nombre   de facteurs ouverts de longueur   dans  .

Par exemple, le mot   a deux facteurs fermés de longueur 2, à savoir   et  , et donc   pour ce mot. Aucun de ses facteurs de longueur 3 n'est fermé, donc  . Tout facteur est soit ouvert soit fermé, donc on a

 

  est le nombre de facteurs de longueur  . On a le résultat suivant[5] :

Théorème (Parshina, Postic) — Pour un mot infini  , les trois conditions sont équivalentes :

  1.   est apériodique
  2.  
  3.  .

Chacune des conditions 2 ou 3 implique que le mot est apériodique, car un mot périodique n'a qu'un nombre fini de facteurs (et donc de facteurs fermés ou ouverts) de chaque longueur.

La table des plus long facteurs fermés modifier

Le table des plus long facteurs fermés (the longest closed factor array) d'un mot   de longueur   est le vecteur   tel que, pour  ,   est la longueur du plus long facteur fermé de   commençant en position  .

Par exemple, pour  , on a  .

La table des plus long facteurs fermés d'un mot de longueur   peut être calculée en tembs  [6].

Graphe de Rauzy modifier

En combinatoire, et particulièrement en combinatoire des mots, le graphe de Rauzy est un graphe qui décrit l'évolution du cheminement dans un mot fini ou infoni. Il a été introduit par Gérard Rauzy. le graphe de Rauzy d'ordre   d'un mot   est le graphe orienté dont les sommets sont les facteurs de longueur n du mot   et dont les arcs sont étiquetés par les facteurs de longueur   ; il y a un arc étiqueté   du sommet   vers le sommet   si   est préfixe et   est suffixe de  . En d'autres termes, le mot   s'écrit   pour deux lettres   et  . Le graphe de de Bruijn est le graphe de Rauzy particulier correspondant à un mot de de Bruijn.

Notes et références modifier

Bibliographie modifier

  • Golnaz Badkobeh, Alessandro De Luca, Gabriele Fici et Simon J. Puglisi, « Maximal Closed Substrings », Lecture Notes in Computer Science, Springer « String Processing and Information Retrieval (SPIRE) »,‎ , p. 16–23 (ISBN 978-3-031-20643-6, DOI 10.1007/978-3-031-20643-6_2, lire en ligne, consulté le )
  • Hideo Bannai, Shunsuke Inenaga, Tomasz Kociumaka, Arnaud Lefebvre, Jakub Radoszewski, Wojciech Rytter, Shiho Sugimoto et Tomasz Walen, « Efficient Algorithms for Longest Closed Factor Array », Lecture Notes in Computer Science, Springer, vol. 9309 « String Processing and Information Retrieval »,‎ , p. 95–102 (ISBN 978-3-319-23826-5, DOI 10.1007/978-3-319-23826-5_10, lire en ligne, consulté le )
  • Olga Parshina et Svetlana Puzynina, « Finite and infinite closed-rich words », Theoretical Computer Science, vol. 984,‎ , article no 114315, 12 p. (DOI 10.1016/j.tcs.2023.114315, arXiv 2111.00863)
  • Fabien Durand, « A characterization of substitutive sequences using return words », Discrete Math., vol. 179,‎ , p. 89-101.
  • Gabriele Fici, « Open and closed words », Bulletin of the European Association for Theoretical Computer Science, no 123,‎ , p. 140-149 (lire en ligne, consulté le ).
  • Olga Parshina et Mickaël Postic, « Open and closed complexity of infinite words », submitted,‎ (arXiv 2005.06254).