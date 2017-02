Après 20 jours d’affrontements dans un casino de Pittsburgh, une intelligence artificielle (IA) construite par des chercheurs de l’université Carnegie Mellon a officiellement battu quatre joueurs de poker au top niveau mondial. Le cadre du duel entre les hommes et la machine ? Une règle du jeu appelée le Texas Hold ‘Em no limit, une forme de poker particulièrement complexe où le succès repose largement sur des paris à long terme, basés sur la théorie des jeux.

Après la supériorité de l’IA sur l’homme au dames, aux échecs, au scrabble, au jeu télévisé Jeopardy! et, tout récemment, au jeu de Go, c’est une nouvelle étape franchie par la machine. Aucun logiciel n’était en effet encore parvenu à prendre le meilleur sur des joueurs au top niveau mondial dans un jeu aussi exigeant que le Texas Hold ‘Em, où certaines informations (les cartes retournées sur la table) restent masquées. Un jeu qui requiert une part d’intuition, car il faut aussi deviner les choix de l’adversaire. « La capacité de la meilleure IA à effectuer des raisonnements stratégiques à partir d’une information imparfaite dépasse désormais celle des humains les plus doués en la matière », résume Tuomas Sandholm (au centre le photo ci-dessus), professeur de Carnegie Mellon qui, avec l’aide de son assistant Noam Brown, a conçu l’IA championne de poker.

Libratus corrige ses erreurs

Appelée Libratus (soit ‘équilibrer’ en latin), l’IA des deux chercheurs dernière a totalisé environ 1,9 million de dollars de gains sur les 20 jours de tournoi, là où ses quatre adversaires humains, qu’elle a affronté en duel dans des parties simultanées, ont tous terminé dans le rouge. Il y a deux ans de cela, Tuomas Sandholm et Noam Brown avaient déjà défié des joueurs de poker de haut niveau. Et leur IA s’était alors inclinée.

Selon les champions de Texas Hold ‘Em qui ont affronté Libratus, cette IA a la capacité à équilibrer différentes stratégies, bluffer, miser petit avec une bonne main, modifier sa mise pour désorienter les adversaires, etc. « Il répartit ses mises en trois, quatre, cinq différentes tailles. Aucun humain ne peut faire cela », explique dans les colonnes de Wired Daniel McAulay, un des joueurs ayant affronté la machine.

Pour l’instant, les deux chercheurs n’ont pas révélé comment fonctionnait Libratus, mais ont promis de livrer des détails dans les jours qui viennent. Les quatre adversaires de l’IA – Dong Kim, Jason Les, Jimmy Chou et Daniel McAulay – expliquent que la machine a été modifiée d’un jour sur l’autre, notamment afin de combler les failles qu’ils découvraient dans la stratégie de Libratus. Ce que confirment les chercheurs. « Après chaque jour de jeu, un méta-algorithme a analysé les failles que les joueurs pros avaient identifiées et exploitées dans la stratégie de Libratus », détaille Sandholm. « Il a ensuite priorisé ces failles et un algorithme a comblé les trois principales en utilisant le supercalculateur chaque nuit (qui faisait fonctionner Libratus dans la journée, NDLR). C’est une approche très différente de la façon dont l’apprentissage a été utilisé dans le passé pour le poker. Typiquement, les chercheurs développent plutôt des algorithmes qui tentent d’exploiter les faiblesses de l’adversaire ». Là où Libratus essaie avant tout de corriger les siennes.

