Recherche de longues répétitions multiples
Pierre Peterlongo (université de Marne-la-Vallée)L’un des récents défis posés par la génomique est la détection de répétitions dans les séquences d’ADN. Le problème de la détection multiple (plus de deux occurrences) est résolu en temps exponentiel par la programmation dynamique. En pratique, sur des séquences génomiques, cette complexité est rédhibitoire et des solutions heuristiques sont utilisées.
Nous proposons une approche exacte de recherche de répétitions multiples basée sur des filtres permettant de supprimer rapidement de larges portions de séquences en amont de la recherche exacte par programmation dynamique. Nous présenterons pour ces filtres, appelés Nimbus et Ed’Nimbus, les conditions nécessaires d’appartenance à une répétition multiple sur lesquels ils sont basés, ainsi que l’application algorithmique résultante.