Avec RankBrain, Google épaule la recherche avec du deep learning

Le moteur de recherche de Google intègre depuis quelques mois une technologie d’intelligence artificielle, RankBrain capable de répondre de manière plus pertinente aux requêtes des utilisateurs.

Tout comme « char » et « chariot », « bateau » et « batellerie » sont des mots de la même famille. En revanche, si le dieu Apollon a perdu sa majuscule pour désigner, par antonomase, un beau jeune homme, il n’existe pas de lien sémantique entre l’acteur Vin Diesel et le moteur à combustion qui porte le même nom, constate ITespresso.

Autant de particularités assez facilement assimilables par l’humain… mais beaucoup moins pour un moteur de recherche. C’est dans cette logique que Google a développé RankBrain. Exploitée pour améliorer la pertinence des résultats présentés aux utilisateurs, cette technologie d’intelligence artificielle a été discrètement déployée en début d’année. Elle est pleinement opérationnelle depuis quelques mois, traitant la plupart des quelques 3 milliards de requêtes enregistrées quotidiennement à l’échelle de la planète.

Un apprentissage pour le deep learning

D’après Bloomberg, qui s’appuie sur le témoignage d’un ingénieur de Google, RankBrain est le fruit d’une année de travaux menés par des experts tel Thomas Strohmann, spécialiste du deep learning. La dimension d’apprentissage automatique associée à cette technologie doit permettre d’interpréter des recherches complexes. Search Engine Land donne l’exemple suivant : « Comment appelle-t-on le consommateur qui se trouve au plus haut de la chaîne alimentaire ? ».

Pour Google, il s’agit surtout d’améliorer la présentation des résultats pour ces 15 % de recherches « inédites » enregistrées chaque jour en moyenne. En l’état actuel, le moteur est « assisté » dans cette tâche par des humains qui lui injectent des listes de synonymes ou établissent des liens entre différentes expressions.

RankBrain doit précisément prendre le relais. Il le fait en découpant les requêtes en unités de sens représentées sous forme de vecteurs interprétables par l’ordinateur. Ce qui lui permet de déterminer les mots de sens proche et de proposer des résultats pertinents bien qu’ils ne contiennent pas forcément les termes recherchés.

Un signal voué à prendre de l’importance

Pour l’heure, la phase d’apprentissage se fait hors ligne, les équipes de Google alimentant RankBrain avec des historiques de recherches. Lorsque le résultat est satisfaisant, une nouvelle version est mise en production.

La multinationale dit s’être rendu compte, après des tests en interne, que désactiver RankBrain était « aussi préjudiciable que de supprimer la moitié des résultats provenant de Wikipedia ».

Et pourtant, malgré sa puissance, RankBrain ne serait qu’un « signal » parmi des centaines d’autres sur lesquels se base l’algorithme de référencement Hummingbird. On citera Top Heavy (qui sanctionne les pages avec trop de publicité), Pirate (qui détecte les atteintes au droit d’auteur), Pigeon (pour favoriser les résultats locaux) ou encore Panda (lutte contre le spam).

Reste à savoir dans quelle mesure RankBrain influe sur les performances SEO. Google reste silencieux sur ce point…

A lire aussi :

Apple accélère ses recrutements dans l’intelligence artificielle

Google finance une intelligence artificielle pour le Big Data

Crédit Photo : Foto-Ruhrgebiet/Shutterstock