Moteur : Cuil relance la course au plus gros index

Mobilité

Fondé par des anciens de Google et d’IBM, ce nouveau moteur mise beaucoup sur la taille de son index. Sans négliger la pertinence ?

Cuil signifie « connaissance » en gaélique et se prononce « cool » en anglais… C’est aussi le nom d’un tout nouveau moteur de recherche américain se présentant comme « le plus gros moteur du Web », rien de moins.

Surprenant, n’est-ce pas ? Et bien Cuil, qui vient seulement de faire son entrée sur la Toile, revendique déjà le plus gros index de la planète avec 121,617,892,992 pages répertoriées. Un pur hasard, certainement : des chercheurs de Google ont récemment diffusé un petit billet faisant valoir plus de 1000 milliards de pages repérées par ce moteur (1,000,000,000,000).

N’empêche, Cuil revendique lui 120 milliards de pages Web indexées, et non repérées, soit trois fois plus que tout autre moteur de recherche, selon ses  propres estimations. Mais est-ce que la qualité d’un moteur se mesure à la taille de son index ou de sa base de données ? Danny Sullivan, un expert américain des moteurs de recherche, y voit un regrettable retour à la guerre des chiffres que se menaient les principaux moteurs il y a quelques années, avant de revenir à d’autres critères de comparaisons tels que la pertinence et les délais de rafraîchissement des résultats.

Clusters de résultats

En dehors des considérations sur les volumes de pages indexées, Cuil a plusieurs cordes à son arc. A commencer par son équipe dirigeante, qui réunit Tom Costello (un ancien du projet WebFountain d’IBM), sa femme Anna Patterson et Russell Power (qui ont eux précédemment travaillé sur le projet TeraGoogle de Google). Le français Louis Monier (le fondateur du « regretté » Altavista) aurait aussi rallié le projet.

Enfin, Cuil se distingue par plusieurs innovations en termes de classement des résultats. Il met en avant, en particulier, un algorithme allant au-delà de l’analyse du nombre de liens pointant vers une page et de sa fréquentation (la base du fameux PageRank de Google) pour prendre aussi en compte les contenus et le contexte de la recherche (à partir d’une analyse de l’historique de consultation de l’utilisateur).

Ce moteur offre surtout une « catégorisation » des résultats par thématiques, à l’instar de ce que proposent déjà des spécialistes comme Fast Search & Transfer (détenu par Microsoft), Vivisimo ou les français Exalead et PolySpot.