Pour gérer vos consentements :
Categories: Mobilité

Google franchit le cap du trillion d’adresses Web identifiées

Le nombre de sites Internet a atteint le trillion déclare Google. Le géant de la recherche déclare que ses bases de données ont catalogué ce nombre gigantesque par le compte d’URL, via l’enregistrement de chaque lien sur une page.

Ce record historique a été atteint dix ans après que Google a révélé son premier décompte de sites, avec un total 26 millions de sites. En 2000, ce nombre était passé à un milliard.

Les développeurs de logiciels Jesse Alpert et Nissan Hajaj ont déclaré dans un post sur un blog de la société, que ce chiffre correspond à des adresses URL, et non à des pages Web réelles.

« En fait, le nombre de pages est infini » ont-ils expliqué. « Les calendriers Web par exemple, peuvent être affectées d’un lien « Jour suivant » et nous pourrions suivre ce lien indéfiniment en trouvant une « nouvelle » page à chaque fois. »

L’expansion du Web implique une évolution des capacités d’indexation. D’après ces deux développeurs, aux débuts d’Internet, Google pouvait traiter et classer chacune des 26 millions de pages composant le Web en utilisant une seule station de travail.

De nos jours, calculer le PR (Page Rank ou Rang de page) des pages revient à indexer et à classer 50 000 fois chaque intersection des USA.

« Pour traiter un tel volume d’informations, nous avons dû faire considérablement évoluer nos systèmes, depuis le traitement du premier ensemble de données Web traité par Google pour la réponse aux requêtes » déclarent Alpert et Hajaj. « De nos jours, Google télécharge le Web continuellement, collectant des informations de pages à jour et recalculant l’intégralité du graphe de liens Web plusieurs fois par jour ».

Adaptation de l’article Web address total tops one trillion de Vnunet.com en date du 25 juillet 2008.

Recent Posts

IA et RGPD : sont-ils compatibles ?

Quelle part d’incertitude faut-il accepter dans la mise en conformité des IA avec le RGPD…

3 semaines ago

Windows 10 : quel coût pour le support étendu ?

Microsoft a dévoilé les prix des mises à jour de sécurité étendues pour Windows 10.…

4 semaines ago

Cybersécurité : la plan de Docaposte pour convaincre les PME

Docaposte a sélectionné une douzaine de spécialistes français pour créer un Pack cybersécurité spécialement étudié…

1 mois ago

Surface Pro 10 : plus autonome et un peu plus réparable

La Surface Pro 10 sera disponible le 9 avril en France. Passage en revue de…

1 mois ago

Office 2024 : ce qu’on sait de la prochaine version

Que réserve Office 2024 ? Une première version de test officielle sera disponible en avril.…

1 mois ago

Microsoft Teams : comment fonctionne le double usage « pro-perso »

Microsoft Teams évolue dans une version « unifiée » qui permet de combiner les usages…

2 mois ago