Fouille de séquences : représentation condensée de motifs séquentiels à partir de mesures basées sur la fréquence
Marc Plantevit (GREYC, Caen)Les représentations condensées sont le coeur de beaucoup de travaux de fouille de données. Il existe de nombreuses propositions dans le domaine de l’extraction de motifs ensemblistes. Dans cet exposé, nous nous situons dans le contexte de l’extraction de motifs séquentiels. Nous montrons tout d’abord les difficultés pour passer des itemsets aux séquences. Ensuite, nous définissons une représentation condensée exacte (sans perte d’information) des motifs séquentiels par rapport à des mesures basées sur la fréquence. Ces mesures sont souvent utilisées pour évaluer l’intérêt d’une règle ou d’un motif. Nous montrons également comment obtenir les motifs qui maximisent ces mesures. Ces motifs sont directement obtenus à partir de la représentation condensée.