Google, nouvel index du Web

Régulations

Ce nouveau moteur de recherche indexe le Web en analysant la fréquence et l’importance des liens mentionnés sur les sites.

Un nouveau moteur de recherche émerge de l’Université de Stanford dans la Silicon Valley. Marchant sur les pas de ses prédécesseurs, le moteur Google s’appuie sur trois années de travail de deux chercheurs de l’université, Larry Page et Sergey Brin qui ont créé leur startup.

Pour s’y retrouver, le nouvel outil de recherche analyse la manière dont les sites sont liés les uns aux autres. Il est capable de donner une importance aux liens en comptant combien de fois ils sont référencés et en attribuant un poids plus fort aux liens présents sur des sites fort fréquentés.

Pour Larry Page, « l’importance d’un site est la somme des importances des sites qui pointent vers lui ». Il explique que d’autres moteurs de recherche utilise les liens pour construire des index mais selon lui, ils ne font pas une bonne analyse. Pour être pertinent, Google utilise une technologie baptisée Pagerank qui permet de classer chaque page en fonction de son référencement sur le Web. Ensuite, il utilise la présentation des liens pour affiner son analyse. Il attribue des points différents selon que les liens sont en gras ou en gros caractères. Selon les chercheurs, le Web compte au moins 300 millions de pages indexables. Les six principaux moteurs de recherche (Altavista, Excite, Hotbot, Infoseek, Lycos et Northern Light) qu’ils ont étudiés en indexent une petite partie. Hotbot arrive en tête avec 34% des pages Web indexées, loin devant Lycos qui n’en recense que 3%. Google indexe actuellement 25 millions de pages et compte en atteindre 100 millions d’ici la fin de l’année.

Pour en savoir plus : http://www.google.com