AlphaGo : Google sort le grand jeu dans l’intelligence artificielle

Big dataData-stockage
alphago-google-lee-sedol
3 4

AlphaGo n’a gagné qu’une bataille, en l’occurrence la première manche de son match face au champion du monde de go. Mais le logiciel de Google impressionne.

Quoi qu’il arrive au terme du match en cinq manches qui l’oppose au Sud-Coréen Lee Sedol, AlphaGo a déjà relevé son ultime défi : le programme informatique développé par Google est parvenu à remporter une partie contre celui que l’on considère comme le meilleur joueur de Go au monde.

Plusieurs dizaines de milliers d’internautes ont suivi l’affrontement, retransmis en direct sur YouTube ainsi que sur certaines chaînes TV, notamment en Asie.

Il était environ 4 h 30 ce matin à Paris quand la rencontre, organisée au Four Seasons Hotel de Séoul, a débuté. Il aura fallu 186 coups et plus de trois heures et demie de jeu pour déclarer un vainqueur : la machine, qui s’en est tirée de peu après avoir longtemps été menée.

Ce n’est pas la première fois qu’un ordinateur bat un joueur professionnel. On peut remonter jusqu’aux années 1950 pour le morpion, se remémorer la défaite, en 1997, du champion du monde d’échecs Garry Kasparov face à Deep Blue d’IBM ou encore penser à Watson, qui avait déjoué les pronostics en 2011 sur le plateau de Jeopardy.

Mais ce triomphe au go est un accomplissement particulier : le jeu, dont les origines remontent à 2 500 ans en Chine, est considéré comme le plus complexe qui soit. Et pour cause : il y a plus de combinaisons jouables que d’atomes dans l’univers.

Modelé sur l’humain

Le principe de base est simple : tour à tour, les deux joueurs placent leurs pions, blancs pour l’un et noir pour l’autre, en tentant de capturer les pions de leurs adversaires ou de gagner des « points de territoire » en entourant des espaces vides du plateau.

AlphaGo a été conçu spécifiquement pour cet usage, sous la houlette de DeepMind, filiale de Google. Il exploite la méthode de Monte-Carlo, inspirée des jeux de casino avec des méthodes algorithmiques visant à calculer une valeur numérique approchée en utilisant des techniques probabilistes.

Appliquée au jeu de go, cette méthode consiste à mesurer la valeur d’une position et des coups qui y conduisent en fonction de variables comme le nombre de pièces sur le damier, leur valeur, leur position relative les unes par rapport aux autres, etc. L’ordinateur joue plus précisément un grand nombre de fins de partie réalistes à partir de la position en cours d’évaluation et comptabilise la proportion de parties gagnantes ou perdantes.

Google y a associé la dimension des réseaux neuronaux artificiels, avec 12 couches superposées sur le modèle du cortex cérébral, chaque cellule étant en contact avec des milliers d’autres. C’est ce qui permet à la machine d’apprendre à jouer comme un humain, y compris en faisant des parties contre elle-même.

Capable d’anticiper les coups des adversaires humains dans 57 % des cas selon Google, AlphaGo avait déjà battu, par cinq manches à zéro en octobre dernier, un joueur professionnel classé dans le top 600 mondial : Fan Hui, un Français d’origine chinoise, triple champion d’Europe en titre. À l’époque, ce fut un retentissement : les experts estimaient qu’il faudrait encore 10 ans à l’intelligence artificielle pour vaincre un joueur de ce standing.

Crédit photo : vladis.studio – Shutterstock.com


Lire la biographie de l´auteur  Masquer la biographie de l´auteur