Translate Community : le crowdsourcing appliqué à Google Traduction

Cloud

Google fait appel aux contributions des internautes pour améliorer son algorithme de traduction avec l’objectif de l’ouvrir à des langues non encore prises en charge.

Google sollicite les internautes pour faire tomber les barrières de la langue.

Le groupe Internet vient de lancer un programme collaboratif visant à améliorer l’algorithme lié à son service Translate. Pour prendre part à cette expérience en mode crowdsourcing, il faut maîtriser au moins deux langues et posséder nécessairement des compétences en anglais, autour duquel tout gravite.

L’utilisateur aura à traduire des mots, groupes de mots ou phrases simples grâce à un clavier virtuel adaptée à la langue sélectionnée. Son concours sera précieux pour aborder des spécificités grammaticales, syntaxiques et culturelles que la machine a pour le moment des difficultés à interpréter.

En tête de liste, les variations de sens d’un même terme, qu’elles soient d’ordre diatopique (dépendant de la région), diachronique (en fonction des générations), diastratique (selon la dimension sociale et démographique) ou diaphasique (d’après le registre de langue). Il s’agira également de s’ouvrir progressivement aux dialectes non encore pris en charge, comme l’Ouzbek ou le Cherokee. En fonction de l’engouement qui naîtra dans cette communauté, Google n’exclut pas d’aborder la question des langues vernaculaires, c’est-à-dire locales.

crowdsourcing-google-traduction
L’exercice porte sur des mots ou des phrases simples.

Les membres de la Translate Community seront par ailleurs amenés à évaluer les traductions de leurs pairs. Sur le principe même du bénévolat, les contributions ne sont pas créditées. Google assure néanmoins qu’elles “seront prises en compte […] et auront un impact sur les résultats proposés à des millions d’internautes“.

Un système similaire est attendu pour la plate-forme de streaming vidéo YouTube. Google a déjà franchi une première étape en rapprochant les producteurs de contenus des traducteurs indépendants affiliés aux plates-formes Gengo et Translated.net autour d’un partenariat concernant les sous-titres intégrables en postproduction pour toucher un public multilingue, mais aussi les internautes atteints de déficiences auditives.

L’effort de crowdsourcing est soutenu en parallèle par des éditeurs tiers comme Amara, qui gère déjà la sous-titrage des cours en ligne de la Khan Academy, des spots publicitaires officiels de Twitter et de certains contenus VoD de Netflix.

google-traduction-crowdsourcing
Il est possible d’évaluer les traductions des autres utilisateurs.

—— A voir aussi ——
Quiz ITespresso.fr : entre Siri, Google Now et Cortana, la reconnaissance vocale, ça vous parle ?

Crédit illustration : Oleksiy Mark – Shutterstock.com


Lire la biographie de l´auteur  Masquer la biographie de l´auteur