Retour à l'index du GREYC

Séminaire Algorithmique

Site du CNRS

Séminaire Algorithmique

Le séminaire a lieu le mardi à 11 h 45 (sauf modification exceptionnelle), au campus Côte de Nacre, bâtiment Sciences 3, salle S3 351, 3ème étage.

Résumé du séminaire du Mardi 17 Octobre 2006

Spam web

par Thomas Lavergne (France Télécom R&D, Lannion)

Le visage du web a beaucoup changé depuis qu'il est devenu une source de revenus importante. Le classement dans les moteurs de recherche est devenu un enjeu capital, et certains sont prêts à tout pour obtenir les premières places. Une nouvelle forme de "spam" est donc apparue sur le web, et une nouvelle lutte entre spammeurs et anti-spammeurs.

Nous commencerons par une présentation des algorithmes utilisés dans les moteurs de recherche pour le classement des pages. Le PageRank avec ses qualités et ses défauts, ainsi que ses différentes évolutions. Puis une présentation des différentes formes de spam-web et des techniques qu'elles utilisent pour contourner les algorithmes de classement. Et pour terminer, quelques méthodes permettant de détecter et éliminer cette nouvelle forme de spam.

GREYC
Campus Côte de Nacre, boulevard du Maréchal Juin
BP 5186
14032 Caen Cedex
FAX : +33 (0)2 31 56 73 30
http://www.greyc.fr