Bruno Crémilleux (GREYC,Caen)

Comment savoir si une méthode de fouille de données extrait des motifs intéressants ? Comment savoir et évaluer si une méthode de fouille de données est meilleure qu’une autre pour une tâche donnée ? Dans cet exposé, nous nous intéressons à ces questions dans le contexte des problèmes non supervisés et représentés par des données transactionnelles. Nous formalisons la qualité d’une méthode de fouille de données en identifiant les motifs qui sont les supporters et ceux qui sont les opposants d’un motif extrait par une méthode de fouille. Le principe est de regarder les comparaisons indispensables entre un motif X susceptible d’être extrait et les autres motifs de l’espace de recherche, de déterminer quels sont les motifs de l’espace de recherche qui favorisent la sélection de X (ses supporters) et ceux qui défavorisent sa sélection (ses opposants). La localisation dans l’espace de recherche des supporters et des opposants, ainsi que leur nombre, donnant lieu à une évaluation en complexité, caractérisent les méthodes de fouille de données et leur qualité et expliquent d’un point de vue formel le comportement observé de méthodes de fouille. Une étude expérimentale illustre les résultats obtenus.

Travail commun avec A. Giacometti et A. Soulet (LIFAT).