World Wide Lexicon, un dictionnaire mondial collaboratif

Cloud

Un dictionnaire multilingue universel en ligne. C’est le pari fou que tente Brian McConnell en lançant le World Wide Lexicon, un dictionnaire créé par des internautes volontaires. Le principe est le même que le Seti@home, sauf qu’ici, ce n’est pas le processeur de la machine qui est mis à contribution mais le cerveau de son utilisateur.

Brian McConnell fait partie des gens dont les idées et les actes balancent entre l’idiotie et le génie. Auteur du relativement populaire Beyond Contact : A Guide to SETI and Communicating with Alien, McConnell veut appliquer le principe de calcul distribué du Seti@home (qui exploite la puissance de l’ordinateur inutilisé au profit d’un programme de recherche de signaux extra-terrestres) pour créer un dictionnaire multilingue universel. Oui mais. Son système n’exploite pas l’ordinateur mais le cerveau de l’utilisateur. Comme avec le Seti@home, le World Wide Lexicon ? c’est le nom du projet ? intervient quand l’ordinateur se met en veille pour solliciter l’utilisateur, volontaire, bien sûr. Celui-ci devra donc proposer la traduction d’une phrase qui lui est soumise dans la langue qu’il maîtrise (ou est censé maîtriser) afin d’enrichir la base de données mondiale du World Wide Lexicon. Les mots à traduire seront issus du Web à travers une compilation effectuée par un spider program, dans le même genre que ceux utilisés par les moteurs de recherche pour indexer des sites.

Si l’idée est séduisante, sa mise en oeuvre risque d’être laborieuse. D’abord parce que quand un ordinateur se met en veille, c’est généralement que l’utilisateur n’est pas devant et qu’il a probablement autre chose à faire que traduire des mots dans des langues exotiques. Mais les volontaires savent probablement dans quoi ils s’engagent. Ensuite, comment, de par l’anonymat du traducteur et son niveau de connaissances, garantir la validité de la traduction. Enfin, quid des mots que personne ne parviendra à traduire ?

Un grand projet de travail collaboratif

Reste que l’idée d’un travail collaboratif pour construire une base de données a le mérite d’exploiter pleinement les propriétés du Web sur la base du partage des connaissances. Et ce principe peut s’enorgueillir de quelques succès dont la célèbre base de données cinématographique IMDB dont la construction a commencé dans les années 90 dans un forum de discussion (newsgroup) et aujourd’hui rachetée par Amazon. Une référence en la matière. Les prémices d’un futur système de traduction universel mondial reposent peut-être sur le World Wide Lexicon. La première version du projet sera présentée à la conférence des technologies émergentes organisée par O’Reilly en mai prochain.

Le site d’O’Reilly (en anglais)

http://www.oreilly.com/