半个多世纪以来,游戏一直是人工智能领域新思想的试验场。游戏的成功标志着一个重要的里程碑——超级象棋计算机“深蓝”打败了象棋大师加里·卡斯帕罗,超级计算机沃森打败了危险边缘项目的前冠军肯·詹宁斯和布拉德·鲁特。然而,打败一个顶尖的人类玩家并不等同于真正破解一个游戏。现在,加拿大阿尔伯塔大学科学学院计算机扑克研究小组(CPRG)的研究人员首次破解了平手限注德州扑克的获胜方法。

“在过去的40年里,扑克一直是人工智能面临的一个具有挑战性的问题,这个问题已经结束了。”这项研究的主要作者,科学研究所的保龄说。这项研究发表在1月9日的《科学》杂志上。扑克是信息不完整的游戏的集合。玩家不完全了解过去的事件。最受欢迎的扑克类型是德州扑克。当它只有两个玩家(一对一,二对一)并且只有固定数量的赌注时,它被称为一对一限制扑克。因为它比国际象棋小,双限扑克中不完全信息的性质使它成为一种更具挑战性的游戏,需要用电脑来玩或解决。

“如果玩无休止的纸牌和以95%的置信度破解这组纸牌之间没有统计差异,那么我们将把游戏定义为破解了。”保龄球解释道。“想象一个人一小时玩200张牌,连续70年每天玩12个小时。想象一个更糟糕的情况,最大限度的精神掠夺,对手的战术和从不犯错。”

尽管许多完整的信息游戏(即玩家在做决定之前被告知游戏中可能发生的一切)已经被破解,例如俄罗斯方块,但是人类玩家玩的重要的不完整信息游戏都没有被破解。这些游戏更具挑战性。尽管完整的信息游戏可能是公共客厅游戏不可或缺的一部分,但在现实世界的决策中却非常罕见。

“这一结果背后的突破是对通用算法的改进,这使得任何类型的大规模模型中的游戏推理更易于管理。”保龄球解释道。虽然看起来很有趣,但博弈论一直被认为有重要的意义,包括涉及安全的游戏应用,如机场安检区系统、空中武警调度和海岸警卫队巡逻部署。现实世界的决策几乎总是包含不确定性和信息的缺乏。高计算方法,如破解扑克所需的方法,可以用来推广未来的应用。