所有文章 > 正文

Science:AI首次在六人扑克比赛中击败职业选手

作者: Jansfer

时间: 2019-07-15 18:30

人工智能程序虽然在跳棋、国际象棋、围棋和双人扑克中已经成功击败了人类,但多人扑克却是一项更大的挑战。

图|人工智能程序Pluribus击败了德州扑克六人组顶级玩家

卡内基梅隆大学的研究人员与Facebook的人工智能合作研发的Pluribus程序,近日,击败了六人无限制德州扑克中的一群顶级职业选手。该研究已发表在Science上。

卡内基梅隆大学计算机科学教授托马斯·桑德霍尔姆(Tuomas Sandholm)说,Pluribus在多人扑克游戏中取得了非凡的表现,是人工智能和博弈论领域公认的新里程碑,因为到目前为止,AI战略推理中的里程碑还仅限于双方竞争。

根据Pluribus开发者的说法,这项技术可以用来解决各种各样的现实问题,就像在扑克游戏中一样,参与者会虚张声势或隐藏关键信息。

该项目首先击败了两大扑克冠军,Darren Elias和Chris Ferguson,两人各自打了5000手牌。Pluribus在另一个的实验中与13个职业选手较量,每次五人,在总共10000手牌中,该程序取得了胜利。

首先,该程序可以自己进行练习,逐步学习如何将扑克的招式运用到最佳状态。Elias表示,其主要优势在于能够运用混合策略,这也是人类试图做的事。人类的执行问题就是以完全随机的方式执行此操作,循环往复,但大多数人都做不到。

令人惊讶的是,Pluribus使用了“donk betting”方式,在第一轮以一个叫牌结束,下一轮以一个比专业人士多得多的赌注开始,而专业人士通常认为这是弱者采取的举动。

Brown 甚至大胆预测,该程序的策略甚至会改变专业人士玩游戏的方式。

下面附Pluribus的游戏策略:

平衡选择问题的例子

利用蒙特卡洛CFR的游戏树遍历

石头剪刀布中的信息博弈搜索

Pluribus的实时搜索

Pluribus性能

参考:https://phys.org/news/2019-07-ai-pros-six-player-pokera.html

https://science.sciencemag.org/content/early/2019/07/10/science.aay2400

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多