Pour gérer vos consentements :

Après les échecs ou le Go : l’IA bat les champions de poker

Après 20 jours d’affrontements dans un casino de Pittsburgh, une intelligence artificielle (IA) construite par des chercheurs de l’université Carnegie Mellon a officiellement battu quatre joueurs de poker au top niveau mondial. Le cadre du duel entre les hommes et la machine ? Une règle du jeu appelée le Texas Hold ‘Em no limit, une forme de poker particulièrement complexe où le succès repose largement sur des paris à long terme, basés sur la théorie des jeux.

Après la supériorité de l’IA sur l’homme au dames, aux échecs, au scrabble, au jeu télévisé Jeopardy! et, tout récemment, au jeu de Go, c’est une nouvelle étape franchie par la machine. Aucun logiciel n’était en effet encore parvenu à prendre le meilleur sur des joueurs au top niveau mondial dans un jeu  aussi exigeant que le Texas Hold ‘Em, où certaines informations (les cartes retournées sur la table) restent masquées. Un jeu qui requiert une part d’intuition, car il faut aussi deviner les choix de l’adversaire. « La capacité de la meilleure IA à effectuer des raisonnements stratégiques à partir d’une information imparfaite dépasse désormais celle des humains les plus doués en la matière », résume Tuomas Sandholm (au centre le photo ci-dessus), professeur de Carnegie Mellon qui, avec l’aide de son assistant Noam Brown, a conçu l’IA championne de poker.

Libratus corrige ses erreurs

Appelée Libratus (soit ‘équilibrer’ en latin), l’IA des deux chercheurs dernière a totalisé environ 1,9 million de dollars de gains sur les 20 jours de tournoi, là où ses quatre adversaires humains, qu’elle a affronté en duel dans des parties simultanées, ont tous terminé dans le rouge. Il y a deux ans de cela, Tuomas Sandholm et Noam Brown avaient déjà défié des joueurs de poker de haut niveau. Et leur IA s’était alors inclinée.

Selon les champions de Texas Hold ‘Em qui ont affronté Libratus, cette IA a la capacité à équilibrer différentes stratégies, bluffer, miser petit avec une bonne main, modifier sa mise pour désorienter les adversaires, etc. « Il répartit ses mises en trois, quatre, cinq différentes tailles. Aucun humain ne peut faire cela », explique dans les colonnes de Wired Daniel McAulay, un des joueurs ayant affronté la machine.

Pour l’instant, les deux chercheurs n’ont pas révélé comment fonctionnait Libratus, mais ont promis de livrer des détails dans les jours qui viennent. Les quatre adversaires de l’IA – Dong Kim, Jason Les, Jimmy Chou et Daniel McAulay – expliquent que la machine a été modifiée d’un jour sur l’autre, notamment afin de combler les failles qu’ils découvraient dans la stratégie de Libratus. Ce que confirment les chercheurs. « Après chaque jour de jeu, un méta-algorithme a analysé les failles que les joueurs pros avaient identifiées et exploitées dans la stratégie de Libratus », détaille Sandholm. « Il a ensuite priorisé ces failles et un algorithme a comblé les trois principales en utilisant le supercalculateur chaque nuit (qui faisait fonctionner Libratus dans la journée, NDLR). C’est une approche très différente de la façon dont l’apprentissage a été utilisé dans le passé pour le poker. Typiquement, les chercheurs développent plutôt des algorithmes qui tentent d’exploiter les faiblesses de l’adversaire ». Là où Libratus essaie avant tout de corriger les siennes.

A lire aussi :

IA : qui de DeepStack ou Libratus bat l’humain au poker ?

IA : on ne joue plus… ou alors à se faire peur

Recent Posts

ESN : DXC cherche (encore) à se vendre

DXC Technology confirme des discussions avec un "sponsor financier". La société de capital-investissement BPEA serait…

1 heure ago

Cybersécurité : pourquoi Pradeo s’offre la start-up rennaise Yagaan

En prenant le contrôle de Yagaan, Pradeo dit engager la consolidation entre acteurs français de…

5 heures ago

6 casques VR pour le métavers d’entreprise

Quelles portes d'entrée dans les métavers B2B ? Côté casques, voici six modèles d'autant de…

5 heures ago

ESN 2022 : le top 10 en France

L'année 2021 est marquée par une croissance de 12 % pour les ESN et ICT,…

6 heures ago

OpenStack assouplit sa politique de saut de version

OpenStack va simplifier le basculement entre des versions majeures non consécutives, avec les mêmes garanties…

9 heures ago

5 scale-up françaises de cybersécurité à retenir

De Ledger à HarfangLab, des entreprises et start-up françaises de sécurité cyber et protection de…

1 jour ago