江南体育app体验棒 继围棋之后,人工智能又攻克了德州扑克

江南体育app体验棒 继围棋之后,人工智能又攻克了德州扑克

【编者按】本周晚些时候,由卡耐基梅隆大学(CMU) 开发 的“Libratus” 人工智能 (AI)系统将开始一场新的挑战:试图在一对一、无限制投注的“无限注德州扑克”(No-Limit
Texas Hold’em)比赛中挑战人类顶级职业玩家,获胜者将获得20万美元的奖金。

卡耐基梅隆大学研究人员表示,希望Libratus最终能够赢得比赛,这样他们就可以首次向全世界宣布:人工智能又攻克了德州扑克,首次战胜人类冠军。但同时,卡耐基梅隆大学的竞争对手又表示不服。

加拿大阿尔伯塔大学、捷克布拉格查理大学和捷克理工大学的研究者近日联合发表论文称,其所研发的人工智能系统已经在德州扑克比赛中达到了专家级水平。因此,他们的人工智能系统才是第一个战胜人类的。

需要指出的是,该论文尚未经过“同行评议”,因此目前尚不可尽信。但基于这支团队的历史成就,他们声称的结果绝非空穴来风。

2008年,几乎由同一批研究人员组成的一个团队开发了出了一套系统,首次在有投注限制的“有限注德州扑克”(Limit Texas
Hold’em)比赛中战胜人类高手。2015年,该团队又完成了对该系统的升级,并称已接近完美。

阿尔伯塔大学研究人员在论文中称,他们开发的这套系统使用了一种名为“DeepStack”的通用算法,近期在“一对一无限注德州扑克”(Heads-up
No-Limit Texas Hold’em)比赛中战胜了人类。

2016年11月7日至12月12日,DeepStack共与33位人类选手在 互联网 上进行了44852手较量。比赛结果显示,DeepStack的平均赢率为492mbb/g。DeepStack团队称,一般人类玩家到50mbb/g就被认为拥有较大优势,而750mbb/g就是对手每局都弃牌的赢率。

但是,帮助卡耐基梅隆大学设计Libratus人工智能系统的托马斯·桑德霍姆(Tuomas
Sandholm)教授称:“DeepStack并未战胜顶尖高手,因此还不能说它已经战胜了人类。”

桑德霍姆还称:“我们两年前已经达到他们的水平了,但那不是我们的目标。我们的目标从来就不是‘专家级’,而是‘超人水平’,就像‘深蓝’和‘沃森’那样。”

到目前为止,无论是在“有限注德州扑克”,还是“无限注德州扑克”比赛中,人工智能系统只能应对“一对一”的比赛。而在多人(五人或更多)同时比赛中,其复杂性仍是人工智能目前所难以应付的。但不管怎样,这些比赛结果表明,至少有两套人工智能系统又要创造新的里程碑。

DeepStack研究人员称,德州扑克是一种典型的非完整信息 游戏 ,因为你不知道竞争对手的牌,也不知道下一手牌是什么。因此,对于人工智能而言,其复杂性要超过象棋。而DeepStack是一种可用于一个很大类别的序列非完整信息博弈的通用算法,它所取得的成绩表明,人工智能系统已经精通非完整信息游戏。

云顶老虎机一定要卡? ( 微博 )的AlphaGo一样,Libratus和DeepStack并不试图解决整个比赛的所有问题,因为这需要考虑到太多的可能性。相反,这两套人工智能系统利用深度学习来培养一种直觉。DeepStack研究人员称:“在比赛之前,DeepStack不会计算和存储完整的战略,而是使用一种快速的‘近似估算’法,我们称之为‘直觉’。”

如果人工智能这一次能在德州扑克比赛中能战胜人类高手,则意味着研究人员可以利用这套 技术 来解决日常生活中的一些实际问题,尤其是涉及到非完整信息的一些问题,如商务谈判。在谈判中,双方都会隐藏一些信息。

参与Libratus研发的卡耐基梅隆大学博士生诺姆·布朗(Noam
Brown)称:“在现实世界中,信息不可能像棋盘上的棋子那样整洁有序,总有一些重要信息被丢失或隐藏,而人工智能需要有能力来处理这个问题。”

(0)
上一篇 2017年1月12日 07:34
下一篇 2017年1月12日 08:58