SearchProcess complique la recherche sur Internet

Cloud
Information - news

Fondée par des universitaires marseillais, la jeune société Intelligence Process propose l’accès gratuit à son outil de recherche. Internautes pressés s’abstenir.

Fondée en septembre 1999, la jeune société Intelligence Process puise ses racines dans le monde universitaire, puisque ses fondateurs proviennent du Centre de Recherche Rétrospective de Marseille. Peu connu du grand public, ce haut lieu scientifique de la bibliométrie développe depuis plusieurs années des techniques facilitant la recherche d’informations pertinentes dans une grande masse de documents.

On pouvait donc attendre beaucoup du logiciel de recherche SearchProcess, dont une version en ligne est gratuitement disponible. D’abord, elle fonctionne de manière pour le moins originale. Il faut dire que lorsque l’internaute dépose sa requête, comme avec un moteur de recherche traditionnel, la réponse n’est pas instantanée. Il doit patienter environ deux heures pour obtenir des documents triés, qu’il pourra consulter sur le Web après une alerte reçue via son courrier électronique.

« Il faut entre une et deux heures pour faire le tri dans toutes les pages Web sélectionnées », confirme Mylène Leitzelman d’Intelligence Process. « SearchProcess récupère les 100 ou 200 premiers liens de plusieurs moteurs comme Altavista ou Voila. La recherche est statistique et ne travaille donc pas avec un moteur sémantique, qui obligerait à développer des dictionnaires pour chaque langue », complète Bruno Mannina, concepteur du logiciel. Autrement dit, peu de chance de renvoyer une réponse liée à « automobile » si l’on indique seulement « voiture ». Dommage, car cette piste, même si elle a ses défauts, permettrait de ne pas laisser de côté certaines pages Web pertinentes. Pour le reste, Search Process agit comme un « meta-moteur » qui interrogera plusieurs moteurs généralistes ou non.

Seulement, à l’essai, l’application en décevra plus d’un. A la requête « microscope à effet tunnel », qui doit a priori éliminer les informations relatives à une percée dans les montagnes, la fonction chargée d’interroger d’Altavista renvoie seulement 7 réponses… alors que Voila renvoie plus de 690 000 réponses ! Vérification faite, une requête effectuée à la main chez Altavista livre pourtant plus de 360 000 réponses dont les premières tombent juste. Une dissymétrie qui devrait être corrigée prochainement, puisque le service est en cours de maturation et gagnera même bientôt de nouvelles fonctions.

Plus drôle, la recherche de fichiers Midi à l’aide de « Heavy Metal Midi » renvoie un site en danois consacré au Mac. Le problème est que cette page, prise en flagrant délit de hors sujet, est conseillée avec une pertinence maximale (quatre étoiles). Il en est de même pour une autre page des îles Tonga offrant des adresses électroniques gratuites. Et mieux vaut oublier les autres documents HTML non pertinents, dont l’un vous fait perdre votre temps en vous égarant, ironie du sort, vers un laboratoire de recherche en informatique bordelais.

Pourtant, le site a quelques bons points. Il propose une classification des réponses par catégorie, selon la nature du site où elles ont été puisées (commercial, universitaire, site d’entreprise). Pour chaque page retenue, l’application relève tous les passages qui vous intéressent en marquant en gras le (ou les) mot(s) indiqué(s) dans votre requête. Encore mieux, une représentation cartographique de thèmes « forts » permet de faire des rapprochements entre plusieurs sujets souvent voisins dans la page Web.

En conclusion, l’élève ou l’internaute en quête de documents pour son dossier d’études restera sur sa faim. Le service s’adresse plutôt aux adeptes de la veille technologique, habitués à compulser des masses de données. Par exemple, les traditionnels « formulaires d’étonnement » sont disponibles pour les connaisseurs qui voudront noter une information intéressante. Pour les autres, le détour risque d’être de courte durée.

Pour en savoir plus : SearchProcess