RankBrain : l’intelligence artificielle appliquée à Google Search

Bases de donnéesBig dataData-stockage
google-rankbrain

Entrée discrète, dans le moteur Google, pour la technologie RankBrain, qui s’appuie sur le machine learning afin d’améliorer la pertinence des résultats.

Tout comme « char » et « chariot », « bateau » et « batellerie » sont des mots de la même famille. En revanche, si le dieu Apollon a perdu sa majuscule pour désigner, par antonomase, un beau jeune homme, il n’existe pas de lien sémantique entre l’acteur Vin Diesel et le moteur à combustion qui porte le même nom.

Autant de particularités assez facilement assimilables par l’humain… mais beaucoup moins pour un moteur de recherche. C’est dans cette logique que Google a développé RankBrain,.

Exploitée pour améliorer la pertinence des résultats présentés aux utilisateurs, cette technologie d’intelligence artificielle a été discrètement déployée en début d’année. Elle est pleinement opérationnelle depuis quelques mois, traitant la plupart des quelques 3 milliards de requêtes enregistrées quotidiennement à l’échelle de la planète.

D’après Bloomberg, qui s’appuie sur le témoignage d’un ingénieur de Google, RankBrain est le fruit d’une année de travaux menés par des experts tel Thomas Strohmann, spécialiste du deep learning.

La dimension d’apprentissage automatique associée à cette technologie doit permettre d’interpréter des recherches complexes. Search Engine Land donne l’exemple suivant : « Comment appelle-t-on le consommateur qui se trouve au plus haut de la chaîne alimentaire ? ».

Pour Google, il s’agit surtout d’améliorer la présentation des résultats pour ces 15 % de recherches « inédites » enregistrées chaque jour en moyenne.

En l’état actuel, le moteur est « assisté » dans cette tâche par des humains qui lui injectent des listes de synonymes ou établissent des liens entre différentes expressions.

RankBrain doit précisément prendre le relais. Il le fait en découpant les requêtes en unités de sens représentées sous forme de vecteurs interprétables par l’ordinateur. Ce qui lui permet de déterminer les mots de sens proche et de proposer des résultats pertinents bien qu’ils ne contiennent pas forcément les termes recherchés.

Pour l’heure, la phase d’apprentissage se fait hors ligne, les équipes de Google alimentant RankBrain avec des historiques de recherches. Lorsque le résultat est satisfaisant, une nouvelle version est mise en production.

La multinationale dit s’être rendu compte, après des tests en interne, que désactiver RankBrain était « aussi préjudiciable que de supprimer la moitié des résultats provenant de Wikipedia ».

Et pourtant, malgré sa puissance, RankBrain ne serait qu’un « signal » parmi des centaines d’autres sur lesquels se base l’algorithme de référencement Hummingbird. On citera Top Heavy (qui sanctionne les pages avec trop de publicité), Pirate (qui détecte les atteintes au droit d’auteur), Pigeon (pour favoriser les résultats locaux) ou encore Panda (lutte contre le spam).

Reste à savoir dans quelle mesure RankBrain influe sur les performances SEO. Google reste silencieux sur ce point…

Crédit photo : JuliusKielaitis – Shutterstock.com

Lire aussi :

Lire la biographie de l´auteur  Masquer la biographie de l´auteur