Algorithmes d’analyse de séquences en bioinformatique. Périodicité et répétitions

Eric Rivals (LIRMM)

February 15, 2006

En biologie, l’information portée par nombre de macromolécules réside dans la succession de composés biochimiques élémentaires le long d’une chaà®ne principale : les nucléotides pour les ADN et les ARN, les acides aminés pour les protéines. D’un point de vue mathématique ou informatique, ces molécules sont des séquences sur un alphabet donné. Prédire la fonction de ces molécules, déterminer leur histoire évolutive, ou encore inférer leur structure spatiale requiert des algorithmes d’analyse et de comparaison de séquences. Nous présentons nos contributions à ce champ algorithmique de la bioinformatique et les applications biologiques qui en découlent. En particulier, nous nous focalisons sur la localisation de structures locales dans les séquences, telles que les répétitions en tandem dans les génomes, et sur quelques méthodes originales de comparaison de séquences. Nous abordons également les aspects statistiques et combinatoires des séquences que nous avons développés pour résoudre ces questions algorithmiques. Nous montrons l’importance de la notion de périodicité des séquences dans divers aspects de ces recherches.