Thierry Lecroq (Universite de Rouen)

L’oracle de facteur d’un mot w est une structure d’index qui reconnait au moins tous les facteurs de w. C’est une structure tres compacte, facile a construire et a stocker, d’abord concue pour la recherche de mot. Nous montrons comment employer l’oracle pour calculer des repetitions afin de comparer de tres longs mots tels que des sequences biologiques. Le calcul des repetitions d’un mot mene naturellement a etablir une factorisation du mot qui donne un schema sequentiel de compression. Il est egalement possible d’obtenir une methode globale de compression en utilisant des regles de grammaire qui decrivent le mot. Enfin nous montrons comment l’oracle peut aider a estimer l’entropie topologique des sequences biologiques.