来自加拿大和捷克共和国的研究人员开发了扑克机器人,这种机器人在一对一比赛和德州扑克无限注德州扑克游戏中击败了职业玩家。扑克机器人的胜利标志着人工智能的新突破。

研究人员称,该程序用“近似法”击败了人类对手,这有点类似于直觉。密歇根大学博弈论和人工智能教授迈克尔·韦尔曼说:“如果是这样的话,这意味着人工智能游戏已经取得了显著的进步。首先,这是一个里程碑,人工智能在游戏中打败了职业扑克玩家。其次,它结合了一些新思想,创造了令人兴奋的新方法,我们可以用这些方法来处理信息不完整的游戏。”

本周晚些时候,匹兹堡赌场将举办一场扑克锦标赛,几名世界级的扑克玩家将与卡内基梅隆大学开发的项目展开竞争。卡内基梅隆大学的计算机教授托马斯·桑德霍尔姆是该程序的主要开发者。他说参赛选手比之前测试中的选手好得多。在20多天的比赛中,玩家将玩120,000手扑克。研究人员可以计算数据并帮助开发工作。长期以来,人们认为扑克对电脑来说太复杂了。锦标赛可能会向我们证明人工智能在扑克方面可以超越人类。

扑克软件DeepStack曾经打败过职业玩家。它是在加拿大阿尔伯塔大学的计算机教授迈克尔·鲍林的领导下开发的。查里斯特大学和捷克科技大学的研究人员也参与了这项研究。网上发布了一份研究报告,研究人员称DeepStack轻松击败几名人类玩家赢得了45000场扑克游戏。

人类也在其他游戏中与人工智能竞争。扑克比那更复杂。扑克中有许多不确定的因素,例如,对手可能会作弊,现实世界中作弊无处不在,人工智能仍然不知道如何作弊。扑克玩家看不到对手的牌,但在国际象棋、国际象棋和围棋中,你可以清楚地看到对手的棋子。今年早些时候,Alphabet的子公司DeepMind开发的人工智能程序击败了韩国著名职业围棋手李石时。

对机器来说,无限注德州扑克太难了。每手牌都有10到160 (10后面跟160个零)的可能性。迪普斯塔克通过和自己玩扑克来不断学习。每一轮之后,系统将修改优化策略以提升技能。由于无限注扑克非常复杂,该系统通过玩无限注扑克来提高其技能。为了解决复杂性问题,研究者采用快速逼近技术,将以前的扑克比赛数据输入深度学习算法,并不断优化和提炼。

密歇根大学的威尔曼认为扑克是一种复杂的游戏。随着新技术的采用,该系统能够有效应对各种情况,这是一个新的突破。以前,我们必须画整棵树,找出各种可能性。

研究人员将深度堆叠的近似技术与人类玩家的直觉进行了比较。当对手作弊或拿到一手好牌时,人类会用直觉来判断,例如,根据对手的语言。不同的机器根据对手的下注方式进行判断。研究人员说:“我们可以将这一估计视为深度堆栈的直觉。”

通过观察扑克玩家在多场比赛中赢得的钱数,系统可以评估玩家的表现,而不是根据赌桌上的赌注来判断。与优秀的职业玩家相比,DeepStack的胜率高出约9倍。

2015年,波琳和他在阿尔伯塔大学的同事找到了一个解决方案。他们开发的扑克机器可以玩限注德州扑克,并且表现完美。参加匹兹堡锦标赛的机器人被称为“天平”。它是由托马斯·桑德霍尔姆与学生诺姆·布朗合作开发的。天平在匹兹堡超级计算中心的强大硬件上运行。