Powerset veut faire oublier la recherche par mots-clés

Cloud

Une jeune pousse de San Francisco développe un moteur pour des recherches naturelles. Première application avec l’encyclopédie en ligne Wikipedia.

« Bon début. Impression à confirmer au cours des prochains mois. » Voici le commentaire que l’on pourrait faire de Powerset, un moteur de recherche d’un nouveau genre en gestation depuis 2005 à San Francisco. Il tire son nom d’un terme mathématique qui, en anglais, désigne « l’ensemble de tous les sous-ensembles possibles d’un ensemble…  » (sic).

Grâce à ce nouvel outil, il devrait être bientôt possible de fouiller le World Wide Web en s’exprimant en bon français (même si pour l’instant, il ne comprend que l’anglais). Car les utilisateurs n’ont plus besoin d’entrer des mots-clés. Le programme analyse le sens des questions qui lui sont posées et les décompose en une série de concepts.

La jeune pousse, financée par trois firmes de capital-risque (Foundation Capital, Founders Fund et Paperboy Ventures) et plusieurs business angels, a récemment ouvert son premier service destiné au grand public en se concentrant sur la recherche d’information à partir de l’encyclopédie en ligne Wikipedia.

Le logiciel semble au point. Lorsque qu’on lui demande « How many people died in Hiroshima? » (Combien de personnes sont mortes à Hiroshima), sans préciser de date (il s’agit bien sûr du bombardement atomique du 6 août 1945), Powerset souligne dans les sites qu’ils a trouvés le bout de phrase semblant le mieux répondre au sens de la question : « 80,000 people » (80,000 personnes), « 86 000 people », « 140 000 people ».

L’exercice peut même se révéler cocasse. A la question « Who is Jacques Chirac? » (Qui est Jacques Chirac ?), la machine répond « JacquesChirac is one favorite character of Les Guignols de l‘Info, a satiric latex puppet show. » (Jacques Chirac est l’un personnages favoris des Guignols de l’Info, une émission satirique à base de marionnettes en latex).

En attendant la version « Full Web »

Lorsqu’au début des années 2000, Google avait lancé son moteur de recherche, il proposait également aux internautes de poser directement une question. Mais Google ôtait de cette phrase tous les éléments inutiles (articles, ponctuations… ) et n’en gardait que les mots-clés.

Cette fois, Powerset semble vraiment tenir sa promesse. En tout cas dans les premiers résultats : ensuite, il prend également en compte les notices de Wikipedia qui contiennent un ou plusieurs mots de la question posée.

Il faudra attendre la sortie de la version recherche « full World Wide Web » pour savoir ce que Powerset a vraiment dans le ventre. Beaucoup moins structuré que Wikipedia, Internet sera plus dure à comprendre par le logiciel.

Prudents, les deux fondateurs de Powerset – Barney Pell et Gian Lorenzo Thione – n’ont pas annoncé de date pour cette version très attendue de leur produit. Le premier dispose d’un doctorat en informatique de Cambridge et a occupé des fonctions à la Nasa. Le second est un chercheur d’origine italienne qui a obtenu un master en génie logiciel de l’université d’Austin au Texas. Il a travaillé au Fuji Xerox Palo Alto Laboratory.