Pour gérer vos consentements :
Categories: Cloud

Translate Community : le crowdsourcing appliqué à Google Traduction

Google sollicite les internautes pour faire tomber les barrières de la langue.

Le groupe Internet vient de lancer un programme collaboratif visant à améliorer l’algorithme lié à son service Translate. Pour prendre part à cette expérience en mode crowdsourcing, il faut maîtriser au moins deux langues et posséder nécessairement des compétences en anglais, autour duquel tout gravite.

L’utilisateur aura à traduire des mots, groupes de mots ou phrases simples grâce à un clavier virtuel adaptée à la langue sélectionnée. Son concours sera précieux pour aborder des spécificités grammaticales, syntaxiques et culturelles que la machine a pour le moment des difficultés à interpréter.

En tête de liste, les variations de sens d’un même terme, qu’elles soient d’ordre diatopique (dépendant de la région), diachronique (en fonction des générations), diastratique (selon la dimension sociale et démographique) ou diaphasique (d’après le registre de langue). Il s’agira également de s’ouvrir progressivement aux dialectes non encore pris en charge, comme l’Ouzbek ou le Cherokee. En fonction de l’engouement qui naîtra dans cette communauté, Google n’exclut pas d’aborder la question des langues vernaculaires, c’est-à-dire locales.

L’exercice porte sur des mots ou des phrases simples.

Les membres de la Translate Community seront par ailleurs amenés à évaluer les traductions de leurs pairs. Sur le principe même du bénévolat, les contributions ne sont pas créditées. Google assure néanmoins qu’elles « seront prises en compte […] et auront un impact sur les résultats proposés à des millions d’internautes« .

Un système similaire est attendu pour la plate-forme de streaming vidéo YouTube. Google a déjà franchi une première étape en rapprochant les producteurs de contenus des traducteurs indépendants affiliés aux plates-formes Gengo et Translated.net autour d’un partenariat concernant les sous-titres intégrables en postproduction pour toucher un public multilingue, mais aussi les internautes atteints de déficiences auditives.

L’effort de crowdsourcing est soutenu en parallèle par des éditeurs tiers comme Amara, qui gère déjà la sous-titrage des cours en ligne de la Khan Academy, des spots publicitaires officiels de Twitter et de certains contenus VoD de Netflix.

Il est possible d’évaluer les traductions des autres utilisateurs.

—— A voir aussi ——
Quiz ITespresso.fr : entre Siri, Google Now et Cortana, la reconnaissance vocale, ça vous parle ?

Crédit illustration : Oleksiy Mark – Shutterstock.com

Recent Posts

IA et RGPD : sont-ils compatibles ?

Quelle part d’incertitude faut-il accepter dans la mise en conformité des IA avec le RGPD…

2 semaines ago

Windows 10 : quel coût pour le support étendu ?

Microsoft a dévoilé les prix des mises à jour de sécurité étendues pour Windows 10.…

3 semaines ago

Cybersécurité : la plan de Docaposte pour convaincre les PME

Docaposte a sélectionné une douzaine de spécialistes français pour créer un Pack cybersécurité spécialement étudié…

4 semaines ago

Surface Pro 10 : plus autonome et un peu plus réparable

La Surface Pro 10 sera disponible le 9 avril en France. Passage en revue de…

1 mois ago

Office 2024 : ce qu’on sait de la prochaine version

Que réserve Office 2024 ? Une première version de test officielle sera disponible en avril.…

1 mois ago

Microsoft Teams : comment fonctionne le double usage « pro-perso »

Microsoft Teams évolue dans une version « unifiée » qui permet de combiner les usages…

1 mois ago