Spam web
Thomas Lavergne (France Télécom R&D, Lannion)Le visage du web a beaucoup changé depuis qu’il est devenu une source de revenus importante. Le classement dans les moteurs de recherche est devenu un enjeu capital, et certains sont prêts à tout pour obtenir les premières places. Une nouvelle forme de “spam” est donc apparue sur le web, et une nouvelle lutte entre spammeurs et anti-spammeurs.
Nous commencerons par une présentation des algorithmes utilisés dans les moteurs de recherche pour le classement des pages. Le PageRank avec ses qualités et ses défauts, ainsi que ses différentes évolutions. Puis une présentation des différentes formes de spam-web et des techniques qu’elles utilisent pour contourner les algorithmes de classement. Et pour terminer, quelques méthodes permettant de détecter et éliminer cette nouvelle forme de spam.