Les moteurs de recherche passent à la photo

Cloud

De nombreux laboratoires travaillent sur des moteurs de recherche capables de retrouver des photos sans l’aide d’aucun mot, à partir d’un croquis ou d’indications concernant la couleur ou les textures.

Cette semaine, IBM vient de présenter à l’intention des professionnels un système de gestion de documents (textes, images, son) baptisé Content Manager. L’une de ses particularités est Qbic, un moteur de recherche graphique qui permet de retrouver une image en utilisant l’analyse des couleurs, des contours ou des textures.

Développé depuis une dizaine d’années dans les laboratoires d’Almaden aux Etats-Unis, Qbic signifie « Query by image content », qu’on peut traduire par « recherche par contenu graphique ». Cet outil est téléchargeable gratuitement sur le site d’IBM. Auto-exécutable, il pèse environ 3 Mo et s’utilise grâce au navigateur Netscape.

A partir d’une bibliothèque de photos, le logiciel crée un catalogue d’indexation qui rassemble, pour chaque image, les informations mathématiques sur les textures (rayé, uni), les pourcentages de bleu, de vert et de rouge, le positionnement des formes ou des textures.

« Le musée de l’Hermitage de St Petersbourg a retenu Qbic pour indexer environ 3 000 oeuvres en haute définition sur son site », explique Frantz De Rycke, responsable de la division DataManagement chez IBM. L’internaute peut donc, en dessinant la forme de son choix et en jouant sur les couleurs, tenter de retrouver un tableau de maître. L’interface du site du musée permet de dessiner des cercles ou des rectangles. A l’essai, la représentation d’un ciel, avec un cercle jaunâtre en haut et différentes parties ovales ou rectangulaires en bleu vers le haut de l’écran renvoient effectivement vers des paysages, mais tous les coups ne sont pas gagnants. Avec la méthode des couleurs, un bloc inférieur noir associé à un bloc supérieur jaune renvoie vers un panorama du XVIIème siècle, aux tons très proches. La présence d’autres tableaux graphiquement plus éloignés laisse tout de même perplexe.

C’est qu’il reste des progrès à faire. Dans le monde et en France, de nombreux laboratoires développent des moteurs graphiques mais ils sont encore peu intuitifs, et les réponses sont souvent hors sujet ou classées bizarrement. « Un spécialiste de la recherche arrive tout de même à de bons résultats », défend José Martinez, maître de conférence à l’Ecole polytechnique de l’université de Nantes. Selon lui, il existe une quantité impressionnante de moteurs expérimentaux, sans compter les trois versions commerciales existantes que sont Virage, Excalibur RetrievalWare et le fameux Qbic d’IBM. « Dans une base de 1 200 images, je peux retrouver l’une d’elles après une douzaine d’itérations » en jonglant avec les paramètres, poursuit-il.

Le moteur graphique doit apprendre à devenir plus pertinent, en explorant différentes solutions. Une méthode consiste à partir d’une photo et à l’associer à d’autres tout en précisant un panel d’images à refuser. En croisant les informations, le logiciel de recherche devient capable d’affiner la fouille. « On est encore dans le domaine du jouet », juge toutefois José Martinez. « Les applications et les besoins commencent seulement à arriver. Pour le grand public, on pourra rechercher les photos de l’album de famille, par exemple en indiquant la forme d’un chapeau », explique le scientifique. La recherche continue.

Pour en savoir plus :

* La démonstration de l’Hermitage Museum

* Qbic à télécharger sur le site IBM Almaden

* Des moteurs graphiques à essayer