焦作赶集网:逾越99.9%人类玩家,微软专业十段麻将AI论文细节首次宣布

admin 6个月前 (04-13) 科技 91 0
机械之心报道

机械之心编辑部

在去年 8 月尾的天下人工智能大会上,时任微软全球执行副总裁的沈向洋正式对外宣布了微软亚洲研究院研发的麻将 AI「Suphx 」。克日,关于 Suphx 的所有手艺细节已经正式宣布。



继围棋、德州扑克、Dota、星际争霸之后,微软亚洲研究院的「Suphx」缔造了 AI 在游戏领域的另一跨越性突破——麻将。
一直以来,麻将都因其庞大的出牌、得分规则和厚实的隐含信息,被视为 AI 研究中极具挑战性的领域。微软亚洲研究院副院长刘铁岩曾示意:「可以说 Dota 这类游戏更「游戏」,而麻将这类棋牌游戏更「AI」。」
Suphx 代表着 AI 系统在麻将领域取得的最好成就,它也是首个在国际着名专业麻将平台「天凤」上荣升十段的 AI 系统,其实力逾越了该平台与之对战过的 99.9% 的人类选手。
不久前,微软麻将 AI 研究团队在 arXiv 上首次公然公布了 Suphx 的论文,而 Suphx 背后的更多手艺细节也随之公然。


论文链接:https://arxiv.org/abs/2003.13590
方式概述
在论文中,研究者创建了适用于 4 玩家日本麻将的 AI 系统 Suphx(Super Phoenix 的简称,意为超级凤凰),它接纳深度卷积神经网络作为模子。首先,凭据人类职业玩家的日志,他们通过监视学习对网络举行训练;然后以网络为计谋,通过 self-play 强化学习(RL)实现网络增强。详细而言,研究者使用盛行的计谋梯度算法来举行 self-play 强化学习,并提出以全局奖励展望(global reward prediction)、Oracle guiding 和 pMCPA 三种手艺来解决已知的一些挑战:

转载说明:本文转载自互联网,若有侵略你的利益,请发邮件至本站邮箱,本站24小时内将予删除。,

Sunbet

Sunbet www.114co.cn立足亚洲,展望国际,在即将到来的2019年,努力在技术、安全、服务上尽善尽美,致力提高业务品质,期望与业界精英共同开拓未来。

保险网声明:该文看法仅代表作者自己,与本平台无关。转载请注明:焦作赶集网:逾越99.9%人类玩家,微软专业十段麻将AI论文细节首次宣布

网友评论

  • (*)

最新评论

相关推荐