Pour gérer vos consentements :
Categories: Cloud

World Wide Lexicon, un dictionnaire mondial collaboratif

Brian McConnell fait partie des gens dont les idées et les actes balancent entre l’idiotie et le génie. Auteur du relativement populaire Beyond Contact : A Guide to SETI and Communicating with Alien, McConnell veut appliquer le principe de calcul distribué du Seti@home (qui exploite la puissance de l’ordinateur inutilisé au profit d’un programme de recherche de signaux extra-terrestres) pour créer un dictionnaire multilingue universel. Oui mais. Son système n’exploite pas l’ordinateur mais le cerveau de l’utilisateur. Comme avec le Seti@home, le World Wide Lexicon ? c’est le nom du projet ? intervient quand l’ordinateur se met en veille pour solliciter l’utilisateur, volontaire, bien sûr. Celui-ci devra donc proposer la traduction d’une phrase qui lui est soumise dans la langue qu’il maîtrise (ou est censé maîtriser) afin d’enrichir la base de données mondiale du World Wide Lexicon. Les mots à traduire seront issus du Web à travers une compilation effectuée par un spider program, dans le même genre que ceux utilisés par les moteurs de recherche pour indexer des sites.

Si l’idée est séduisante, sa mise en oeuvre risque d’être laborieuse. D’abord parce que quand un ordinateur se met en veille, c’est généralement que l’utilisateur n’est pas devant et qu’il a probablement autre chose à faire que traduire des mots dans des langues exotiques. Mais les volontaires savent probablement dans quoi ils s’engagent. Ensuite, comment, de par l’anonymat du traducteur et son niveau de connaissances, garantir la validité de la traduction. Enfin, quid des mots que personne ne parviendra à traduire ?

Un grand projet de travail collaboratif

Reste que l’idée d’un travail collaboratif pour construire une base de données a le mérite d’exploiter pleinement les propriétés du Web sur la base du partage des connaissances. Et ce principe peut s’enorgueillir de quelques succès dont la célèbre base de données cinématographique IMDB dont la construction a commencé dans les années 90 dans un forum de discussion (newsgroup) et aujourd’hui rachetée par Amazon. Une référence en la matière. Les prémices d’un futur système de traduction universel mondial reposent peut-être sur le World Wide Lexicon. La première version du projet sera présentée à la conférence des technologies émergentes organisée par O’Reilly en mai prochain.

Le site d’O’Reilly (en anglais)

http://www.oreilly.com/

Recent Posts

IA et RGPD : sont-ils compatibles ?

Quelle part d’incertitude faut-il accepter dans la mise en conformité des IA avec le RGPD…

2 semaines ago

Windows 10 : quel coût pour le support étendu ?

Microsoft a dévoilé les prix des mises à jour de sécurité étendues pour Windows 10.…

3 semaines ago

Cybersécurité : la plan de Docaposte pour convaincre les PME

Docaposte a sélectionné une douzaine de spécialistes français pour créer un Pack cybersécurité spécialement étudié…

1 mois ago

Surface Pro 10 : plus autonome et un peu plus réparable

La Surface Pro 10 sera disponible le 9 avril en France. Passage en revue de…

1 mois ago

Office 2024 : ce qu’on sait de la prochaine version

Que réserve Office 2024 ? Une première version de test officielle sera disponible en avril.…

1 mois ago

Microsoft Teams : comment fonctionne le double usage « pro-perso »

Microsoft Teams évolue dans une version « unifiée » qui permet de combiner les usages…

1 mois ago