Analyse de Concepts Formels et découverte de Redescriptions - une application au web des données
Justine Reynaud (GREYC, Caen)Dans un premier temps, je présenterai l’Analyse de Concepts Formels (FCA – Formal Concept Analysis) qui est le cadre théorique sur lequel je m’appuie pour faire de la fouille de données. Intuitivement, il s’agit de considérer un ensemble d’objets \(G\), un ensemble d’attributs \(M\), et une relation binaire \(I \subseteq G\times M\) où \(gIm\) s’interprète comme « l’objet \(g\) possède l’attribut \(m\) ». J’évoquerai quelques approches qui permettent de généraliser la FCA, en utilisant des données structurées ou en considérant plus de dimensions par exemple.
Dans un second temps, je présenterai la Découverte de Redescriptions, qui consiste à trouver deux motifs distincts caractérisant un même ensemble d’objets. J’expliquerai ce qui motive, selon moi, l’intérêt de s’appuyer sur le formalisme de la FCA pour s’intéresser à ce problème.
Enfin, je présenterai quelques expérimentations réalisées lors de ma thèse sur des données issues de DBPedia, une base de connaissances du web des données qui peut être considérée comme un graphe orienté et labellisé.