“AI赌神”开发者:下一代AI很快会在六人桌战胜人类

由卡耐基梅隆大学教授Tuomas Sandholm和他的学生Noam Brown共同研发的扑克人工智能(AI)Libratus,在上个月进行的无限注德州单挑游戏中大胜四位顶尖人类选手。

“AI赌神”开发者:下一代AI很快会在六人桌战胜人类

德州扑克人机大战现场


与Libratus交手12万手牌后,四位人类选手全部水下,总共输掉了170万筹码,也就是1.7万个大盲注,每百手亏损近14个大盲注。但Noam Brown表示,Libratus还有很大的改进空间,他预测下一代AI将轻松打爆Libratus,甚至可以达到每百手50个大盲注的赢利。


最近接受CardPlayer采访时,Brown谈到了刚刚过去的人机大战,以及扑克AI未来的发展。


采访内容如下:


CardPlayer(CP):你对这次AI大胜人类的结果感到惊讶吗?


Noam Brown(NB):是的,挺惊讶。它对上之前的版本Claudico,可以每百手赢利10到12个大盲注,比人类在2015年对上Claudico时要赢得多,所以我觉得Libratus会有微弱的优势。它的表现真的很了不起。


“AI赌神”开发者:下一代AI很快会在六人桌战胜人类

Noam Brown 在过去五年中一直在开发 AI 应用程序来破解德州扑克游戏


CP:所以你们之前没有料到Libratus能够以每百手14个大盲注的赢率击败人类选手?


NB:第一次人机大战时,人类选手找到了Claudico的弱点,并一直在利用,比如不断加注Claudico的平跟,这是他们最终获胜的主要原因。而Libratus并不会利用对手的弱点,但它还是可以每百手赢Claudico10到12个大盲注,所以这表明Libratus其实在单挑游戏中比人类强不少。


CP:人类某个阶段差点就完成了反超,你当时有没有觉得Libratus的弱点被找到了?


NB:是的,第一周比赛快结束时,人类确实有反超的迹象,当时他们都在猜测Libratus的打法,进行数据分析,试图找出可以利用的漏洞,不过没有告诉我分析结果,但从其它渠道听到的有关他们得出的结论,我认为大部分不靠谱。


比如,有一天,他们拿80%的牌3-Bet,因为通过数据分析,发现AI在面对特定3-Bet尺寸时很弱,我不觉得这是一个弱点,是数据让他们产生了错觉。


但他们有些分析是准确的,比如,他们注意到AI在面对特定翻牌前加注尺寸时表现不佳,我们研发的时候认为这些都不是什么大问题,结果在实战中确实可以被对手利用,不过幸运的是,当人类选手晚上睡觉时,AI可以一直学习,并迅速填补这些漏洞,这就是Libratus第二周会变得更强的原因。


“AI赌神”开发者:下一代AI很快会在六人桌战胜人类

支撑Libratus运行的匹斯堡超级计算机中心的Bridges计算机


CP:每个session后都会对AI的策略进行调整,这很重要?是不是这样才公平?因为毕竟人类选手赛后也会在一起讨论。


NB:这里有很多误解。并不是我们对AI进行调整,我们并不会告诉它更多的4-Bet或弃牌,事实上,人类会在翻牌前或翻牌进行不同尺寸的下注,我们事先已经为AI植入了很多下注尺寸,所以它知道怎么应对2倍、2.5倍或3倍的翻牌前加注,但如果人类加注2.75倍,AI就会把它近似为3倍。


到了晚上,AI会基于算法自己模拟对手下注2.75倍时该如何行动。这种算法的关键就在于,它可以帮助AI不断地适应人类的打法。Libratus并不会向他们猜测的那样利用对手的弱点,它只是单纯地学习如何更好地应对人类选手各种尺寸的下注。


CP:那是不是对AI来说,转牌和河牌怎么行动不那么重要了?


NB:转牌和河牌阶段,AI通常要花些时间才行动。它真的需要时间来验算,不过还是有很多人没有注意到,针对人类选手在转牌或河牌的每次下注,AI都会花时间来验算自己的策略,而且都是在打牌过程中实时计算的。


CP:Claudico没有这种实时计算的能力吗?还是有,但不够完美?


NB:Claudico确实可以在河牌实时计算,但功能很弱。首先,它不会考虑阻断牌,当它手中有A♠,而公共牌有三张黑桃时,他的策略会和手中有A♣,公共牌有三张黑桃时一样。其次,Claudico不会验算。我认为验算能力是Libratus这次大胜的关键所在。还有,我们让它在转牌就拥有了这种能力。


“AI赌神”开发者:下一代AI很快会在六人桌战胜人类

Tuomas Sandholm 是卡耐基梅隆大学扑克项目的负责人


CP:Libratus何时能完美使用GTO(博弈论最优策略)?


NB:没有人知道AI什么时候会学会GTO,我们其实有办法做到,但费用太高了,不过下一步应该会尝试,我预测完美使用GTO的AI对上Libratus,可以每百手赢利15个大盲注,这是我的粗略估算,当然也可能是5个或50个。


CP:很多人说Libratus在转牌和河牌非常激进,经常超底池下注。你认为AI的这种打法是完美的吗?


NB:超底池下注确实让我们很惊讶,我们并没有用人类的数据来训练Libratus,它从来没有看过一手人类的牌局,它在使用独一无二、自认为的最佳策略,和人类认为的最佳策略不一样。而大的超底池下注正是它的策略之一,还有反主动下注,这真的难以置信。之前Claudico也会这样,经常在底池很小的情况下全押,我认为这是不对的,没有达到平衡,但Libratus做到了平衡,这是它成功的关键。


CP:很多人关心AI对线上扑克未来的发展意味着什么。


NB:我至少可以向人们保证,我们没有让Libratus打线上,也没有计划这样做。当然,我们不能阻止其他人使用我们的技术发明机器人。我不会过多的猜测AI会怎样影响线上扑克,因为我也不是很清楚,我知道扑克机器人已经在被使用了,各大扑克室也在想办法清除它们,我不知道最终哪边会获胜。


CP:AI现在可以在德州扑克多人游戏中战胜人类吗?


NB:已经有团队在研究三人桌了,一般而言,Libratus的技术在应对多人游戏时效果也会不错,但问题不在技术,而在如何评估结果。三人局中,即使你完美的使用GTO策略,还是有可能会输钱,因为另两位对手可能打伙牌。所以如果举办一场AI和五位人类选手参加的比赛,最后会很难评估AI是不是比人类更优秀。这就是为什么人机大战都是单挑游戏,在单挑游戏中,比赛的结果更有意义。


我认为六人桌游戏目前超出了Libratus或类似AI的能力。不过机器人扑克大赛最近增加了六人桌游戏,所以现在针对六人桌的研究正在进行,我认为很快会出成果。如果对Libratus做点小改进,它在未来两年内就可以在六人桌游戏中打败人类。当面对多个对手的时候,我们不清楚使用GTO策略,或专注于剥削弱玩家,哪个更好。我们和扑克玩家们讨论过这件事,还没得出结论。人类选手在利用对手漏洞,和剥削弱玩家方面还是比AI有优势。

(本文转发自扑克新闻:www.pukexinwen.com,版权归原作者所有)


“AI赌神”开发者:下一代AI很快会在六人桌战胜人类

  • 挑战职业牌手的那个AI,是什么来头

  • AA被河杀出局!WSOP史上最惨BB

  • 翻牌中暗三条,如何打赢更多

  • 技术再好,缺少这五种心态还是输

  • 说这四句傻话会让你更像一条鱼


点击【分享这篇文章】查看更多精彩内容

发表评论

你的电子邮件地址不会被公开