Réseaux Bayésiens : apprentissage et modélisation de systèmes complexes

Philippe Leray (INSA de Rouen)

March 20, 2007

La représentation des connaissances et le raisonnement à partir de ces représentations a donné naissance à de nombreux modèles. Les modèles graphiques probabilistes, et plus précisément les réseaux bayésiens, initiés par Judea Pearl dans les années 1980, se sont révélés des outils très pratiques pour la représentation de connaissances incertaines, et le raisonnement à partir d’informations incomplètes.

Dans certains problèmes, l’expert est souvent amené à construire lui-même le graphe du réseau bayésien, en refléchissant en terme de causalité. A l’opposé, l’apprentissage du graphe à partir de données se fait dans un cadre plus général que celui des réseaux bayésiens causaux, cadre dans lequel plusieurs graphes seront équivalents, mais où un seul capturera éventuellement les relations de causalité du problème.

Depuis 1990, les travaux de recherche dans le domaine se sont essentiellement intéressés à l’apprentissage des réseaux bayésiens lorsque toutes les variables sont connues (pas de variables latentes), et lorsque ces variables sont complètement observées (pas de données manquantes), problème lui aussi NP-complet.

La prise en compte de données incomplètes, comme la découverte de variables latentes, posent encore de sérieux défis en terme de complexité.

La découverte de réseaux bayésiens complètement causaux à partir de données est une question qui a été abordée plus récemment. Les travaux sur le sujet s’accordent sur le fait qu’il est impossible de travailler à partir de données d’observations uniquement. Les plans d’expériences, c’est à dire la façon dont les données ont été obtenues, sont des informations essentielles pour capturer la notion de causalité.

Les méthodes proposées dans le cadre de l’apprentissage de structure ont transformé les réseaux bayésiens non seulement en outil de représentation des connaissances, mais aussi en outil de découverte de celles-ci.

L’essentiel de nos travaux de recherche concerne l’apprentissage de structure d’un réseau bayésien, en levant progressivement les différentes hypothèses posées :

pas de variables latentes, données complètes
pas de variables latentes, données incomplètes
comment découvrir des variables latentes ?
comment arriver à une structure réellement causale ?