Libratus(卡内基梅隆大学开发的智能系统)

Libratus ：卡内基梅隆大学开发的智能系统

更新时间：2024-09-20 20:23

Libratus是卡耐基·梅隆大学开发的人工智能系统。2017年1月11日至1月30日，美国卡耐基梅隆大学开发的人工智能Libratus与4名人类顶尖德州扑克选手之间的“人机大战”在美国匹兹堡进行，最终人工智能取得胜利。

比赛背景

Libratus 并非唯一一个会玩德州扑克的 AI，就在就在卡内基梅隆大学宣布 Libratus 出战的几天前，加拿大阿尔伯特大学抢先发表了关于扑克 AI 的论文，表示他们的 DeepStack 是世界上第一个在“一对一无限注德州扑克”上击败了职业扑克玩家的计算机程序。Libratus是从头开始编写的，但它是Claudico的名义上的继任者，其名字在拉丁语中意为“平衡”。Libratus在匹兹堡超级计算中心的新“Bridges”超级计算机上使用了超过1500万核心小时的计算，远超Claudico的2-3百万核心小时。

比赛过程

卡耐基·梅隆大学的 Libratus 采用的是一种名为“纳什均衡”的对战策略，在这一策略里，只要其他玩家的策略保持不变，单一玩家就无法通过变换策略获益。Libratus 要做的就是识别没有希望的策略，从而更快地找到纳什均衡点。经过反复的训练后，Libratus 已经能够忽略那些糟糕的路径了。Libratus的算法是一个计算策略的算法，它没有固定的内置策略。所涉及的技术是反事实遗憾最小化的一种新变体，即CFR+方法，以及桑德霍姆和他的博士生诺姆·布朗为解决终局问题开发的一种新技术。在比赛期间，Libratus白天与玩家对抗，晚上通过分析先前的游戏和当天的结果，特别是它的损失，自行完善其策略。它在比赛中又使用了400万核心小时的Bridges超级计算机。

比赛成绩

2017年1月11日至1月30日，在宾夕法尼亚州匹兹堡的Rivers赌场，卡耐基·梅隆大学(CMU)开发的人工智能系统Libratus与4名人类选手共玩了12万手一对一不限注的德州扑克。到比赛结束时，人工智能领先人类选手共约177万美元的筹码。在4名人类顶尖选手中，输得最少的一位也落后人工智能约8.6万美元的筹码。Libratus在比赛的第一天就一直领先于人类玩家，最终以压倒性的胜利结束比赛，其胜率相当于每100手牌赢得14.7个大盲注，这在扑克中被认为是异常高的胜率，具有高度的统计学意义。在人类玩家中，董金排名第一，麦考利排名第二，吉米·周排名第三，杰森·莱斯排名第四。奖金为20万美元，全部分给了人类玩家，每个玩家最少获得2万美元，其余根据他们对抗人工智能的成功程度进行分配。

特殊规则与比赛设置

由于Libratus只与另一个人类或计算机玩家对战，因此强制执行了两人德州扑克的特殊“对决”规则。四名玩家分为两个由两名玩家组成的小组，其中一个小组在公开场合比赛，而另一个小组位于一个被称为“地牢”的单独房间，不允许使用手机或其他外部通讯设备。地牢小组得到了与公开场合发放的相同的牌序，只是双方互换了：地牢中的人类得到了AI在公开场合得到的牌，反之亦然。这个设置旨在抵消牌运的影响。

参考资料

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}