Google Translate : l’intelligence artificielle apprend (trop) vite

Big dataData-stockage
google-translate-intelligence-artificielle

La technologie d’intelligence artificielle derrière Google Translate est parvenue à basculer d’une langue à une autre sans qu’on lui demande. Fascinant et troublant.

Fin septembre, Google a présenté une nouvelle version de son service de traduction Google Translate dopé au deep learning (réseaux neuronaux, technologie d’intelligence artificielle).

Il s’agissait alors de proposer des traductions de meilleure qualité grâce au système Google Neural Machine Translate (GNMT).

Le fait d’étendre cette technologie aux 103 langues supportées par Google Translate – avec à la clef 140 milliards de mots traduits chaque jour – est loin d’être un exercice trivial.

Avec cette bascule dans le deep learning,  le système GNMT a été adapté pour être exploitable aisément avec de nouveaux duos de traductions, peut-on lire dans une contribution blog de la division Recherche du groupe Internet en date du 22 novembre.

Dans le cadre de ces travaux, Google a notamment tenté de faire des traductions de l’anglais au coréen (et réciproquement) et de l’anglais vers le japonais (et réciproquement).

Cela leur a permis de découvrir que l’intelligence artificielle était alors devenue capable d’effectuer directement des traductions entre les deux langues asiatiques…sans avoir pourtant bénéficié d’un apprentissage de la traduction directe entre les langues concernées.

Google parle de « zero-shot », signifiant que la traduction est directe (sans passer par d’autres traductions intermédiaires : du japonais à l’anglais et de l’anglais au coréen par exemple).

Rappelons que le principe de GNMT consiste à traduire des chaînes de caractères en utilisant une base de connaissance constamment mise à jour par l’apprentissage accumulé en fonction des modifications effectuées par les utilisateurs sur les traductions suggérées.

Aucun raccourci ou tangente n’avait été prévu pour permettre au système d’apprendre de nouvelles traductions. Google précise que l’intelligence artificielle a donc créé cette méthode d’elle-même.

L’IA exploite donc les leçons apprises des autres traductions pour créer des passerelles entre deux langues (dont elle n’a pas encore appris les liens au préalable).

Poussée plus loin, l’analyse du mécanisme que l’IA a adopté montre qu’elle a créé un ensemble d’éléments qui servent de jonction entre les deux langues.

A ce stade, on peut dire qu’ils constituent une « langue » propre à l’IA ou d’un « interlingua ».

En revanche, les mécanismes complexes mis en oeuvre dans le deep learning ne permettent pas de comprendre précisément comment cela s’est produit.

La découverte soulève donc de nouvelles questions. Comment maîtriser ces effets de bord pour les induire à dessein ? Jusqu’où l’IA peut-elle aller en termes d’évolution sur la base des connaissances apprises ?

L’IA avait été initialement exploitée dans Google Translate pour améliorer la qualité des traductions. On découvre maintenant qu’elle va permettre à Google de la faire évoluer plus rapidement, à moindre effort… mais sans un réel contrôle.

Procédé baptisé « zero-shot » par Google :
google-brain-ia_langage_a
(Crédit images : archive NME)

Lire aussi :