Google Translate : le deep learning aura sa traduction dans toutes les langues

Big dataCloudData-stockage

Sur Google Translate, l’exploitation de la technologie d’intelligence artificielle GNMT se révèle pertinente pour la traduction. Elle couvrira progressivement toutes les langues.

Fin septembre 2016, une nouvelle version Google Translate dopée au deep learning (réseaux neuronaux, technologie d’intelligence artificielle) avait été introduite. Il s’agissait alors de proposer des traductions de meilleure qualité grâce au système Google Neural Machine Translate (GNMT).

Jusqu’à présent, un lot de huit langues étaient supportées avec l’anglais, le français, l’allemand, l’espagnol, le portugais, le chinois, le japonais, le coréen et le turc. La technologie est maintenant étendue à des langues comme l’hindi, le russe et le vietnamien.

Un choix qui n’est pas anodin pour la firme de Mountain View puisque, rien qu’aux Etats-Unis, on recense près de 1,3 million d’individus qui parlent vietnamien, 836 000 le russe et plus de 586 000 l’hindi, précise Google dans son billet de blog (citant le US census data).

Ces langues à elles-seules représentent les langues maternelles d’un tiers de la population mondiale et couvrent plus de 35% des requêtes de traduction sur l’application dédiée, est-il précisé dans un nouveau billet de blog.

Google Translate fait partie de la gamme de produits phares de la firme Internet de Mountain View  : 500 millions d’internautes l’utilisent chaque mois. Le service aboutit à la traduction de 140 milliards de mots par jour, selon un article du New York Times remontant à décembre 2016.

L’approche de GNMT consiste à traduire la phrase entière en une seule fois, plutôt que des bouts de phrases. Il en résulte des traductions beaucoup plus précises.

Cette nouveauté est exploitée sur les apps mobiles (iOS et Android) mais aussi via translate.google.com, Google search et l’app Google.

A terme, Google prévoit d’exploiter le système GNMT pour les 103 langues supportées sur son application de traduction .

Par principe, cette technologie IA consiste à traduire des chaînes de caractères en utilisant une base de connaissance constamment mise à jour par l’apprentissage accumulé en fonction des modifications effectuées par les utilisateurs sur les traductions suggérées.

La nouvelle approche basée sur les réseaux neuronaux considère l’ensemble de la phrase à traduire comme une unité et prend en compte les nuances de la parole et le sens.

Google a mis à contribution son toolkit d’apprentissage automatique TensorFlow et ses puces TPU (Tensor Processing Unit) pour alimenter GNMT.

Pour Google, il s’agit de rapprocher son service de la qualité de traduction opérée par un humain qui constitue la référence. GNMT va clairement dans ce sens puisqu’il est censé réduire les erreurs de traduction entre 55% et 85%.

Un véritable bond opéré par le service qui a récemment fêté ses 10 ans.

Hindi_GoogleTranslate_v2B

(Crédit photo : @Google)

Lire aussi :