AlphaGo terrasse Ke Jie : mission intelligence artificielle accomplie pour Google

Big dataData-stockage
alphago-ke-jie

Google peut affirmer ses ambitions dans l’intelligence artificielle : son programme spécialisé dans le jeu de go a triomphé du numéro un mondial Ke Jie.

Maintenant qu’il a battu celui que l’on considère comme le maître de la discipline, AlphaGo peut arrêter la compétition.

Ainsi en a décidé l’équipe à l’origine de ce programme informatique spécialisé dans le jeu de go.

L’équipe en question, c’est celle de DeepMind, société britannique de recherche en intelligence artificielle sur laquelle Google avait mis la main début 2014, pour un demi-milliard de dollars.

AlphaGo n’en était pas à son premier fait d’armes lorsqu’il avait, en mars 2016, défait par quatre manches à une le Sud-Coréen Lee Sedol, alors considéré comme l’une des références mondiales de ce même jeu de go. Mais il s’était véritablement révélé au yeux du grand public à cette occasion.

Restait un ultime défi : Ke Jie, du nom d’un jeune joueur chinois. Aujourd’hui âgé de 19 ans, l’intéressé domine la hiérarchie mondiale depuis 2015, d’après le classement – de référence, bien que non officiel – établi par le Français Rémi Coulom.

classement-go
Le classement de Rémi Coulom au 25 mai 2017

« Think different »

Avant le match face à Lee Sedol, Ke Jie estimait avoir largement les moyens de battre AlphaGo. Son discours avait changé après la rencontre, lors de laquelle le programme avait impressionné jusqu’à ses créateurs. Sa technique de jeu avait conduit les amateurs et les experts à reconsidérer des stratégies auparavant perçues comme indésirables, voire inappropriées.

DeepMind le souligne : sous l’impulsion d’AlphaGo, les joueurs sont devenus « plus créatifs ».

On l’aura constaté avec Ke Jie, dès la première des trois confrontations organisées la semaine passée dans le cadre du sommet « Future of Go » organisé à Wuzhen (sud-ouest de Shanghai).

Le champion s’est incliné d’un demi-point après 289 coups, mais il a utilisé des techniques inexploitées il y a encore quelques mois avant qu’AlphaGo, qui se livrait à des parties en ligne sous le pseudo « Magister », ne les révèle.

Les experts qui ont décrypté cette première manche ont constaté la capacité d’un ordinateur « étrangement efficace » à répondre à de tels coups peu communs de la part des joueurs humains.

Lors de la deuxième manche, Ke Jie semble avoir voulu compliquer le plus possible le plateau, ce qui s’est traduit par près d’une dizaine de zones de jeu indécises. Mais là encore, il s’est incliné, abandonnant après 156 coups, AlphaGo étant notamment parvenu à l’enfermer dans le coin supérieur droit.

Un autre abandon lors de l’ultime affrontement – après 209 coups et plus de 3 heures de jeu – a scellé l’issue du match. On soulignera que l’IA a également battu, en filigrane, une équipe de 5 joueurs.

alphago-jie-scores

Un algo peut en cacher un autre

Fort de l’exemple AlphaGo, DeepMind compte désormais se concentrer sur le développement d’algorithmes qui « pourraient un jour aider les chercheurs à résoudre nos problèmes les plus complexes » : trouver des remèdes contre des maladies, réduire la consommation d’énergie, créer de nouveaux matériaux, etc.

La communauté du jeu de go n’est pas oubliée. Google lui ouvre, entre autres, les données associés à 50 parties qu’AlphaGo a jouées contre lui-même. Un outil de formation est par ailleurs en cours de développement avec la collaboration de Ke Jie.

Pour mémoire, AlphaGo exploite la méthode de Monte-Carlo, inspirée des jeux de casino, avec des algorithmes visant à calculer une valeur numérique approchée en utilisant des techniques probabilistes.

Appliquée au jeu de go, cette méthode consiste à mesurer la valeur d’une position et des coups qui y conduisent en fonction de variables comme le nombre de pièces sur le damier, leur valeur, leur position relative les unes par rapport aux autres, etc. L’ordinateur joue plus précisément un grand nombre de fins de partie réalistes à partir de la position en cours d’évaluation et comptabilise la proportion de parties gagnantes ou perdantes.

Google y a associé la dimension des réseaux neuronaux artificiels, avec 12 couches de « cellules » superposées sur le modèle du cortex cérébral. Assez pour permettre à AlphaGo d’apprendre en jouant non seulement contre des humains, mais aussi contre lui-même.


Lire la biographie de l´auteur  Masquer la biographie de l´auteur