Actualités référencement - Positionnement - Internet - Moteur de recherche - E-commerce - Référencement Google -
Référencement
|
Google victime de son filtre bayésien anti spam ?
|
|
Quel rapport entre l'évolution parfois décevante des résultats du moteur de recherche Google et le filtre anti spam bayésien ? C'est toute l'ambiguïté de la démarche commerciale des moteurs de recherche sponsorisés ... Le moteur de recherche Google, qui appartient aujourd'hui au paysage Internet, plus d'un internaute sur deux y déposant des requêtes, est d'abord victime de son succès ! Après être devenu un outil de recherche pour les hackers, en particulier avec la capacité de son robot à indexer de nombreux formats de fichiers présents sur les serveurs, et pour certains au contenu confidentiel non protégé, il est devenu un outil majeur pour les spammeurs. Les pages de résultats de Google sont en effet aujourd'hui spammées par des pages web sans intérêt particulier, sauf d'afficher des liens commerciaux ou de renvoyer vers des sites qui pratiquent l'affiliation payante. Ainsi, à chaque clic, l'auteur du site qui pratique le spam se voit rémunéré, et le visiteur – tout comme le moteur, mais seulement jusqu'à un certain point ! - trompés. Le filtre bayésien a la faveur des moteurs de recherche C'est à ce niveau, celui du tri et du classement des résultats qui seront envoyés à l'internaute en réponse à sa requête, qu'interviennent les filtres bayésiens. Il s'agit en effet d'une méthode statistique avancée qui calcule la probabilité qu'un site ou une page proposé en résultat soit spammé. La méthode reste sémantique, puisqu'elle associe un 'taux de spam' aux mots clés de la requête de l'internaute, qu'elle compare à un 'taux de probabilité de spam' associé au contenu des sites indexés dans la base du moteur. Ainsi, une requête sur un mot clé unique sera 'nettoyée' plus largement qu'une requête associant plusieurs mots clés. Un filtre qui influe sur la pertinence des résultats La démarche est intéressante, mais le résultat laisse à désirer ! Implémenté par Google au cours du mois d'octobre 2003, le filtre bayésien anti spam a eu des répercussions dramatiques sur les résultats proposés par le moteur, faisant disparaître des sites légitimes, avec parfois l'effet inverse à celui escompté. Dans les semaines qui ont suivies, les résultats ont été améliorés, sans doute avec l'intervention manuelle des responsables de Google pour nettoyer la base. Mais la pertinence du moteur reste encore douteuse sur certaines requêtes. Nouvelle évolution majeure des algorithmes de Google à la mi novembre 2003. Cette fois, ce sont surtout des sites historiques, indexés depuis longtemps, techniquement très pertinents, et sans aucune pratique de techniques assimilables au spam, qui sont propulsés dans l'arrière boutique… Lire la suite >>> |
Article du fr 03/12/2003, Silicon.fr |
| Lire l'article complet (en français) |