Quand l’intelligence artificielle maîtrise le bluff au poker

Big dataData-stockageGestion des talentsManagement
poker-libratus-intelligence-artificielle

Aux Etats-Unis, un tournoi de poker a opposé pendant 20 jours quatre joueurs face à une machine IA baptisée Libratus. Le résultat est…bluffant.

Quand l’intelligence artificielle abat ses cartes…Le monde du poker va se souvenir du tournoi qui s’est déroulé pendant 20 jours au Rivers Casino de Pittsburgh (Pennsylvanie, Etats-Unis).

Ils s’appellent Jason Les, Dong Kim, Daniel McAulay et Jimmy Zhou. Ces quatre joueurs de poker parmi les plus futés au monde ont affronté Libratus, un super ordinateur exploitant une technologie d’intelligence artificielle développée par l’Université de Carnegie-Mellon.

Malgré leur expérience et leur talent de bluff, ils n’ont pas pu résister à la machine dans un tournoi no-limit Texas Hold’em (la variante la plus populaire du poker sans limite de mises).

Dans un jeu comme le poker aux combinaisons infinies, difficile d’établir une stratégie de jeu comme avec les échecs : les cartes sont distribuées de manière aléatoire à chaque partie et il est impossible de savoir ce qui sera exposée en « flop », « turn » et « river » (les cartes dévoilées progressivement au centre du jeu). Il faut mêler de la tactique, de l’audace, tout en prenant en compte l’insaisissable composante « chance ».

Dans ce tournoi baptisé « Brains Vs. Artificial Intelligence: Upping the Ante« , chaque joueur a affronté Libratus séparément, lors de duels successifs. 120 000 mains (cartes que les joueurs ont en main) ont été disputées.

La machine IA, qui fonctionnait sur trois systèmes diffénts intégrant le deep learning (« réseaux neuronaux »), a récupéré 1,7 million de dollars (gain virtuel).

Du côté des quatre joueurs pros humains de poker, ils sont parvenus à gagner des parties pendant cinq jours sur 20 et sont partagés une dotation de (vraies) 200 000 dollars en fonction des performances respectives (merci les sponsors).

« Le programme a gagné 13,48 dollars par main en moyenne – soit 13,8 « grosses blindes » toutes les 100 mains, ce qui est considérable », précise Sciences et Avenir. « La probabilité pour que ce résultat puisse être attribué à un coup de chance est de 0,0001% (dans la limite basse de l’écart type). Libratus est donc tout simplement meilleur que la crème des joueurs. »

La machine IA ne peut pas gagner si elle ne bluffe pas

Une performance qui subjugue Tuomas Sandholm, professeur en sciences informatiques, et le doctorant Noam Brown qui ont tous les deux travaillé sur le projet Libratus à l’Université de Carnegie-Mellon.

« La meilleure aptitude AI en mesure de raisonner de manière stratégique tout en disposant d’informations partielles peut désormais dépasser le niveau acquis par les plus talentueux des hommes », suggère Tuomas Sandholm après le tournoi. Ce qui ouvre des perspectives dans d’autres domaines comme le business, l’armée ou la santé.

Frank Pfenning, à la tête du département Sciences informatiques de l’Université de Carnegie-Mellon, affiche sa satisfaction sous un autre angle : « La machine ne peut pas gagner [au poker] si elle ne bluffe pas. »

Tout en poursuivant : « Le fait de développer une intelligence artificielle qui y parvient avec succès est un pas formidable d’un point de vue scientifique et qui peut se décliner en de multiples applications. Imaginez : un jour, votre smartphone sera peut-être en mesure de négocier le meilleur prix pour acquérir une voiture à votre place. C’est juste le début. »

Cette performance a aussi fasciné de nombreux experts dans le monde comme Andrew Ng, Chief Scientist de Baidu (groupe Internet chinois) et co-fondateur de Coursera (plateforme MOOC), qui a exprimé sa stupéfaction sur Twitter.

(Crédit photo image une : @WinBigRivers)
 


Lire la biographie de l´auteur  Masquer la biographie de l´auteur