Pour gérer vos consentements :
Categories: Cloud

Vingt ans de forums indexés par Google !

Les chiffres parlent d’eux-mêmes : 3 milliards de documents indexés dont 2 milliards de pages Web (75 % sont entièrement indexées), 700 millions de messages postés sur les forums Usenet et 330 millions d’images. De quoi faire de Google, si ce n’est pas déjà le cas, un outil indispensable pour tout internaute. Et il s’en donne les moyens. Pour preuve, son rachat l’année dernière de DejaNews, archives des listes de discussion Usenet. A l’époque, la communauté des utilisateurs de ces forums avait frémi en voyant du jour au lendemain cette mine d’informations rendue inaccessible. Mais Google ne faisait que reprendre en main ces archives pour mieux les indexer. Et il n’aura pas fallu attendre longtemps pour voir ressurgir les listes de discussion sur son site, dans un premier temps en version bêta. La période de test vient de s’achever et Google peut désormais s’enorgueillir de proposer une plongée dans 20 ans de messages. Au total, 700 millions de posts parmi 35 000 catégories de sujets, dont le premier date de 1981. Google ne les a pas tous hérités de DejaNews, ses responsables ont également fait appel à tous ceux ayant géré des listes en leur demandant de fournir leurs archives. Le résultat est vertigineux. Google en a conscience, pour preuve la page qu’il consacre à la disponibilité de ces archives sur laquelle il place des liens vers une cinquantaine de messages illustrant l’« âge d’or de Usenet ». Tout y est : de la première mention de Microsoft en mai 1981, à celle du CD en juillet 1982 en passant par le premier message évoquant le Sida en décembre 1982 ou encore l’annonce du projet de World Wide Web par le Cern en août 1991… On voudrait tout citer. La valeur de cet outil est inestimable. Bien sûr, on y trouve également les pires messages, ou les bêtises qu’on y a postées, mais tout comme Google permet aux sites de ne pas être indexés ou que leurs pages ne soient pas mises en cache, il est possible de demander l’effacement d’un message.

D’autres nouveautés ont aussi été dévoilées ces derniers temps. Ainsi, sur la version en anglais du moteur, si une requête concerne un sujet d’actualité, Google propose maintenant des liens vers des sites d’information l’ayant abordé dans la journée ou la veille. Les liens sont affichés en haut de page, dans une rubrique baptisée « News ». Après l’indexation des documents au format PDF, le moteur s’intéresse aussi aux fichiers au format Microsoft Word (.doc), Excel (.xls), PowerPoint (.ppt) ainsi qu’au Rich text format (.rtf). Il s’attaquerait également aux fichiers au format PostScript d’Adobe. Une nouvelle fonction qui lui a attiré des critiques sévères l’accusant de pillage et pointant du doigt les risques de divulgation d’informations confidentielles. Pour les utilisateurs, c’est en revanche tout bénéfice. D’ailleurs, si un internaute n’est pas satisfait des résultats de sa recherche, il peut désormais faire part de ses remarques à Google (voir un exemple).

Le classement des internautes

Dans le même ordre d’idées, le moteur teste actuellement une fonction inédite dans la barre de menu en anglais qu’il propose en téléchargement (la fonction n’est pas encore présente dans la barre de menu en français). La barre s’installe dans Internet Explorer en créant des boutons donnant accès directement aux fonctions du moteur, sans passer par son site. La nouvelle fonction, baptisée « Page rank » (classement de la page), permet de voter pour la page affichée en cliquant soit sur une icône souriante, soit sur une autre mécontente. Là encore, les critiques s’élèvent contre un système dont certains pourraient abuser pour faire remonter leur site dans la page de résultats, ou au contraire descendre celui du concurrent. Charge à Google de trouver la parade. En attendant, la fonction n’est pas prise en compte dans les résultats affichés. Ces derniers utilisent un système complexe d’algorithmes qui déterminent la pertinence d’une page en fonction notamment du nombre de liens renvoyant vers elle. Et Google considère différemment des liens provenant, par exemple, d’un site personnel de ceux issus d’un site officiel. C’est ce qui explique en partie son succès. Avec le système de vote, un site plébiscité par les internautes serait davantage mis en avant. La démarche semble ici encore très intéressante. Une pincée de démocratie qui s’accorde totalement avec la formidable tribune qu’il offre de parcourir.

Recent Posts

IA et RGPD : sont-ils compatibles ?

Quelle part d’incertitude faut-il accepter dans la mise en conformité des IA avec le RGPD…

2 semaines ago

Windows 10 : quel coût pour le support étendu ?

Microsoft a dévoilé les prix des mises à jour de sécurité étendues pour Windows 10.…

3 semaines ago

Cybersécurité : la plan de Docaposte pour convaincre les PME

Docaposte a sélectionné une douzaine de spécialistes français pour créer un Pack cybersécurité spécialement étudié…

4 semaines ago

Surface Pro 10 : plus autonome et un peu plus réparable

La Surface Pro 10 sera disponible le 9 avril en France. Passage en revue de…

1 mois ago

Office 2024 : ce qu’on sait de la prochaine version

Que réserve Office 2024 ? Une première version de test officielle sera disponible en avril.…

1 mois ago

Microsoft Teams : comment fonctionne le double usage « pro-perso »

Microsoft Teams évolue dans une version « unifiée » qui permet de combiner les usages…

1 mois ago