Le filtre anti-porno de Google toujours aussi puritain…

Plus d’un an après son lancement, le filtre antipornographie de Google continue de pécher par excès: il bloque de nombreux sites innocents

Le site PartsExpress.com, spécialisé dans le matériel audio, ne figure pas dans les résultats proposés par Google sur des requêtes anodines ! Pourquoi ?

Ce site Web, comme des milliers d’autres, ne présente aucun contenu à caractère pornographique, ni dans son activité, ni dans sa sémantique. Pourtant le filtre de Google écarte bien PartsExpress.com de ses résultats. En fait, son algorithme a identifié un terme interdit : ‘sex’. Oui, vous l’avez bien lu, ce site est boycotté par Google car le filtre repère, prohibées dans son nom de domaine, la séquence des trois lettres! Ce cas n’a rien d’unique, tous les outils de recherche leaders proposent des filtres pornographiques, et tous écartent des sites ne présentant aucun contenu explicite, mais pourtant classés comme tels à cause des lacunes de leurs algorithmes. Ce qui est plus grave chez Google, pourtant présenté comme un monstre de technologie en évolution permanente, c’est que rien n’a évolué sur ce plan depuis que le filtre a été activé. Les mêmes limitations avaient été dénoncées voici un an, mais rien n’a évolué depuis? Pourtant, que ce soit chez Yahoo! ou MSN, qui présentaient le même défaut, la qualité du filtrage s’est nettement améliorée au fil des mois. Pour un moteur de recherche au modèle économique basé sur la publicité contextuelle, comme Google, les filtres pornographiques représentent un manque à gagner considérable, mais répondent aux exigences de leurs clients. Alors tant pis, quitte à en faire trop?