Libratus :卡内基梅隆大学开发的智能系统

更新时间:2024-09-20 20:23

Libratus是卡耐基·梅隆大学开发的人工智能系统。2017年1月11日至1月30日,美国卡耐基梅隆大学开发的人工智能Libratus与4名人类顶尖德州扑克选手之间的“人机大战”在美国匹兹堡进行,最终人工智能取得胜利。

比赛背景

Libratus 并非唯一一个会玩德州扑克的 AI,就在就在卡内基梅隆大学宣布 Libratus 出战的几天前,加拿大阿尔伯特大学抢先发表了关于扑克 AI 的论文,表示他们的 DeepStack 是世界上第一个在“一对一无限注德州扑克”上击败了职业扑克玩家的计算机程序。Libratus是从头开始编写的,但它是Claudico的名义上的继任者,其名字在拉丁语中意为“平衡”。Libratus在匹兹堡超级计算中心的新“Bridges”超级计算机上使用了超过1500万核心小时的计算,远超Claudico的2-3百万核心小时。

比赛过程

卡耐基·梅隆大学的 Libratus 采用的是一种名为“纳什均衡”的对战策略,在这一策略里,只要其他玩家的策略保持不变,单一玩家就无法通过变换策略获益。Libratus 要做的就是识别没有希望的策略,从而更快地找到纳什均衡点。经过反复的训练后,Libratus 已经能够忽略那些糟糕的路径了。Libratus的算法是一个计算策略的算法,它没有固定的内置策略。所涉及的技术是反事实遗憾最小化的一种新变体,即CFR+方法,以及桑德霍姆和他的博士生诺姆·布朗为解决终局问题开发的一种新技术。在比赛期间,Libratus白天与玩家对抗,晚上通过分析先前的游戏和当天的结果,特别是它的损失,自行完善其策略。它在比赛中又使用了400万核心小时的Bridges超级计算机

比赛成绩

2017年1月11日至1月30日,在宾夕法尼亚州匹兹堡的Rivers赌场,卡耐基·梅隆大学(CMU)开发的人工智能系统Libratus与4名人类选手共玩了12万手一对一不限注的德州扑克。到比赛结束时,人工智能领先人类选手共约177万美元的筹码。在4名人类顶尖选手中,输得最少的一位也落后人工智能约8.6万美元的筹码。Libratus在比赛的第一天就一直领先于人类玩家,最终以压倒性的胜利结束比赛,其胜率相当于每100手牌赢得14.7个大盲注,这在扑克中被认为是异常高的胜率,具有高度的统计学意义。在人类玩家中,董金排名第一,麦考利排名第二,吉米·周排名第三,杰森·莱斯排名第四。奖金为20万美元,全部分给了人类玩家,每个玩家最少获得2万美元,其余根据他们对抗人工智能的成功程度进行分配。

特殊规则与比赛设置

由于Libratus只与另一个人类或计算机玩家对战,因此强制执行了两人德州扑克的特殊“对决”规则。四名玩家分为两个由两名玩家组成的小组,其中一个小组在公开场合比赛,而另一个小组位于一个被称为“地牢”的单独房间,不允许使用手机或其他外部通讯设备。地牢小组得到了与公开场合发放的相同的牌序,只是双方互换了:地牢中的人类得到了AI在公开场合得到的牌,反之亦然。这个设置旨在抵消牌运的影响。

参考资料

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}
友情链接: