0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软亚洲研究院开发的麻将AI系统Suphx成为首个在国际知名专业麻将平台“天凤”

DPVg_AI_era 来源:lq 2019-09-13 16:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

微软亚洲研究院开发的麻将 AI 系统 Suphx 成为首个在国际知名专业麻将平台“天凤”上荣升十段的 AI 系统,这是目前 AI 系统在麻将领域取得的最好成绩,其实力超越该平台公开房间顶级人类选手的平均水平。

要说中国最流行、群众基础最深厚的运动是什么,那一定是历史悠久、老少咸宜的“国粹”——麻将。 麻将的起源众说纷纭,今天我们熟知的麻将玩法大体成型于晚清,在当时称作“麻雀”。随着商贸与外交活动的开展,麻将渐渐风行亚洲,乃至流传到世界各地,成为蕴含着古老的东方哲学与博弈智慧的“一股神秘的东方力量”。在今天,无论是逢年过节的热闹团圆,还是日常小聚的茶余饭后,随时随地,凑齐四个人一桌牌就能打个热火朝天。 国际智力运动联盟在 2017 年宣布,竞技麻将成为继围棋、象棋、国际象棋、桥牌和国际跳棋之后的第六项国际正式智力运动项目。近年来,随着人工智能在象棋、围棋、德州扑克等众多棋牌类游戏中获得亮眼的成绩,AI 在麻将领域却一直有待跨越性的突破。 今年6月,由微软亚洲研究院开发的麻将 AI 系统 Suphx 成为首个在国际知名专业麻将平台“天凤”上荣升十段的 AI 系统,这是目前 AI 系统在麻将领域取得的最好成绩,其实力超越该平台公开房间顶级人类选手的平均水平。 5000 场麻将对局,Suphx 荣升天凤十段

由于长期在民间广为流传,不同地区的麻将玩法非常多样,缺乏统一的规则标准和评价体系。日本在线麻将竞技平台“天凤”,因其完善的竞技规则、专业的段位体系,成为了业界知名的高水平专业麻将平台,受到职业麻将界的广泛承认。天凤吸引了全球近 33 万名麻将爱好者,其中不乏大量的专业麻将选手。

天凤平台为高水平麻将玩家提供两种竞技房间:“特上房”对四段以上所有玩家免费开放,允许 AI 参与游戏,目前所有玩家在此房间的最高段位是十段;“凤凰房”仅对七段以上的人类付费玩家开放,目前不允许 AI 参与游戏,在该房间能够达到的最高段位是十一段,称为“天凤位”。自天凤平台在 2006 年推出以来,全平台达到四人麻将天凤位的麻将高手仅有13位,曾经达到过十段的选手约有 180 位,而现役十段的人类选手也仅有十几位。

微软亚洲研究院开发的麻将 AI 系统 Suphx(Super Phoenix,意为“超级凤凰”)于 2019 年 3 月登陆天凤平台,在 AI 能够参与的公开竞技房“特上房”,Suphx 与人类选手展开了 5000 余场精彩激烈的四人麻将对局。6 月,Suphx 成为了首个成功达到天凤十段的 AI 系统。

由于单局麻将的输赢并不仅仅取决于实力,从发牌到抽牌,4 位玩家的手牌组合都充满了不确定性,机遇也会对结果产生重要的影响。因此麻将的对局数越多,越能够真实地反应一位雀士的稳定水平,于是,天凤平台通过计算稳定段位(Stable Rank)来衡量雀士的真实实力水平。玩家的段位越高,在比赛中排位第四受到的点数惩罚也越多,点数扣除到一定程度会导致降段,因此取得一个高而稳定的稳定段位是非常不易的。

在这 5000 余场对局中,Suphx的 稳定段位超过了 8.7。这样的稳定段位是一个极高的数字。据统计,天凤平台的所有顶级人类选手在取得十段后,在“特上房”共参加过近万场比赛,整体稳定段位为 7.4。与所有取得过天凤十段的顶级人类玩家相比,Suphx 在特上房的稳定水平要领先约 1.3 个段位。此前,天凤平台还活跃着另外两个麻将 AI 系统,由东京大学在 2015 年开发的“爆打”和 Dwango 公司于 2018 年开发的基于深度学习模型的“NAGA25”,二者的稳定段位均在 6.5 左右。

“我看了 Suphx 的比赛,”天凤 ID 为“ASAPIN”的朝仓康心在社交媒体上表示,“我感觉它好像比我更强大!”“ASAPIN” 是在日本麻将玩家中无人不知晓的一个神级的存在,他是全世界天凤玩家中率先到达“天凤位”的第一人,是公认的天凤位中的最强玩家之一。

Suphx 的杰出表现也获得了天凤平台官方的认可与青睐:“毫无疑问,Suphx 是迄今为止段位最高的麻将 AI。我们在考虑归档 Suphx 的所有比赛录像,以共享给全平台的其他麻将选手进行参考和学习。我们也正在和麻将社区里的广大玩家讨论,是否可以破例允许 Suphx 进入只有人类玩家参与的‘凤凰房’进行比赛。这样,我们将有机会欣赏到更加激烈和精彩纷呈的比赛。”

天凤平台开发公司 C-EGG 的 CEO 角田真吾表示:“这是一项巨大的突破,Suphx 不仅帮助我们用更智能的方式发展传统文化,更展示了拓展 AI 能力边界的可能性,我想这对天凤平台、麻将社区乃至社会都是一个令人振奋的事情。”

全新预测探索与自我博弈策略,破解非完美信息游戏

与象棋、围棋、德州扑克等棋牌类游戏相比,麻将具有更复杂的隐藏信息和更高的难度。总体而言,麻将 AI 主要面临以下挑战:

巨大的状态空间:与只有 52 张牌的德州扑克相比,136 张麻将牌的排列组合可能性更多。同时,麻将中同一个玩家两次出牌之间,夹杂了其他 3 个玩家的出牌和自己摸的底牌,可能出现的不同局面数目非常巨大。值得特别指出的是,在麻将中,4 位玩家的出牌顺序是不固定的,任意一位玩家的“吃碰杠”都可能使出牌顺序突然改变,导致游戏树不规则、且动态变化。这些特点使麻将很难直接利用 AlphaGo 等棋盘游戏 AI 常用的蒙特卡洛树搜索算法

非完美信息博弈:象棋和围棋属于完美信息游戏,玩家可以看到棋局中对方玩家的落子。麻将则存在大量的隐藏信息。具体而言,麻将中每个玩家可以有 13 张手牌,另外还有 84 张底牌。对于一个玩家而言,他只知道自己手里的 13 张牌和之前已经打出来的牌,却无法知道别人的手牌和没有翻出来的底牌,所以最多可以有超过 120 张未知的牌。 这么多的未知信息使得麻将的难度非常高。一方面,由于随机性太大,玩家即便在出牌决策中估计对方玩家手牌、底牌等不可见的牌,也无法避免不确定性对于游戏走向的影响。这将对 AI 模型的训练带来很大挑战:AI 模型很难发现已知牌面信息和最优打法之间的逻辑链路。另一方面,丰富的隐藏信息导致游戏树的宽度非常大,对树搜索算法的可行性提出了进一步的挑战。

复杂的奖励机制:日本麻将的规则是“无役不能和牌”,多样的特殊牌面构成了复杂的“役种”和番数计算规则。一轮游戏共包含 8 局,单局得分与役种和番数相关,最后根据 8 局的得分总和进行排名,来形成最终影响段位的点数奖惩。因此有时麻将高手会策略性输牌,例如,在第 8 轮时如果 A 玩家已经大比分领先第二名,他可能会故意放炮给排名第四的玩家,来防止总分被排名第二的玩家反超,保证自己在最终结算时获得最大的点数奖励。这为构建高超的麻将 AI 策略带来了额外的挑战,AI 需要审时度势,把握进攻与防守的时机。

“面对麻将游戏的巨大挑战,AI 仅靠强大的计算力无法从根本上解决问题,而需要更强的直觉、预测、推理和模糊决策能力,”微软亚洲研究院副院长、机器学习领域负责人刘铁岩博士表示。

为了让 Suphx 高效地学习麻将的复杂状态和策略,微软亚洲研究院针对麻将的特点与难点尝试了一系列基于强化学习的新算法,希望通过技术层面的创新,让 Suphx 具备有效的状态表达机制和强大的策略学习能力,同时具有大局意识,能从游戏的全局角度做出策略性的判断,确保统计意义上总分的领先地位。

比如,为了应对巨大的状态空间,研究团队引入了全新的机制对探索过程的多样性进行动态调控,让 Suphx 可以比传统算法更加充分地试探牌局状态的不同可能;另一方面,一旦某一轮的底牌给定,其状态子空间会大幅缩小;所以研究团队让 Suphx 在推理阶段根据本轮的牌局来动态调整策略,对缩小了的状态子空间进行更有针对性的探索,从而更好地根据本轮牌局的演进做出自适应的决策。

其次,针对非完美信息博弈的挑战,Suphx 创新性地尝试了先知教练技术来提升强化学习的效果。其基本思想是在自我博弈的训练阶段利用不可见的一些隐藏信息来引导 AI 模型的训练方向,使其学习路径更加清晰、更加接近完美信息意义下的最优路径,从而倒逼 AI 模型更加深入地理解可见信息,从中找到有效的决策依据。

另外,对于麻将复杂的牌面表达和计分机制,研究团队还利用全盘预测技术搭建起每轮比赛和 8 轮过后的终盘结果之间的桥梁。这个预测器通过精巧的设计,可以理解每轮比赛对终盘的不同贡献,从而将终盘的奖励信号合理地分配回每一轮比赛之中,以便对自我博弈的过程进行更加直接而有效的指导,并使得 Suphx 可以学会一些具有大局观的高级技巧。

得益于以上新技术和其他方面的创新,自今年 3 月进入天凤平台以来,Suphx 在与人类玩家的对局中学得非常快。目前,在平衡攻击和防御方面,Suphx 表现出了比许多顶尖人类玩家更明智的策略,能够战略性地完成短期损失与长期收益之间的权衡,并根据已有的模糊信息进行快速决策。

Suphx 一直在不断学习与进步,研究团队也一直在对 Suphx 背后核心算法的价值进行评估、反思和迭代,从而实现进一步的改进和提升。刘铁岩表示,“ 虽然 Suphx 根据麻将的独特挑战进行了针对性的设计,也取得了不错的战绩,但我们的创新从未停止。我们期待在不久的将来发明出更新颖、更强大的 AI 技术,使得 Suphx 的能力有更大幅度的提升。纵观历史,游戏 AI 的进化始终与 AI 研究进展相生相伴,很多关于人工智能的研究都起源于研究如何构建能够完成游戏的智能体。我们希望通过对 Suphx 的研究来探索及扩展已有AI技术的边界,不断推动人工智能领域的进步。”

突破AI研究的边界,解决更复杂的现实挑战

麻将这类不完美信息游戏,与围棋、象棋等完美信息游戏相比,对人工智能来说具有更大的挑战性,因此为开发新的人工智能算法提供了理想的环境。

我们生活的世界是由许许多多的随机事件构成的,而且在很多情况下,无法知晓的信息也许远多于我们能够掌握的信息,而我们仍然要在这样信息不完全的条件下做出大大小小的决策。

而麻将游戏中复杂的推理策略和带有随机性的博弈过程,比完美信息游戏更加贴近人类复杂的真实生活。AI 在不完美信息游戏中的突破,将有助于协助人类应对更多高度复杂的现实问题,尤其是在智能交通、金融投资等容易受到随机突发状况影响的场景中。

就麻将本身而言,Suphx 可以说是“另辟蹊径”,风格自成一派,创造了许多新的策略和打法,许多观看 Suphx 比赛的玩家都表示在观战过程中受到了启发,甚至有麻将爱好者将 Suphx 称作“麻将教科书”、“Suphx 老师”,通过学习 Suphx 的打法,帮助他们进一步提升和丰富自己的麻将技巧。

“我已经看了 300 多场 Suphx 的比赛,我甚至不再观看人类玩家的比赛了。我从 Suphx 身上学到很多新技术,它们对于我的三人麻将打法有着非常大的启发意义,”麻将选手太くないお在社交媒体上表示。今年 6 月太くないお刚刚成为世界上第 15 位三人麻将天凤位获得者,也是第一位在四人麻将和三人麻将中均取得天凤位的顶级玩家。

刘铁岩表示,“我们期待 Suphx 能够成为众多麻将爱好者的良师益友,帮助人类玩家学习和提升麻将技巧。未来,我们希望 Suphx 能获得与‘天凤位’的顶级麻将高手进行切磋和学习的机会,进一步提升和精进 AI 在麻将领域的推理和决策水平。同时,我们也期待通过游戏 AI 的研究推动人工智能技术的创新发展,让人工智能真正走进人类的生活,帮助我们解决更加错综复杂的现实挑战。”

Suphx 仍在天凤平台上继续着自己的竞技之旅,研究员们希望给予它更加宽松的环境来充分学习、不断提高、自我演化;也希望在整个麻将社区的共同帮助和呵护下,Suphx 可以取得更大的进步,与麻将社区共同成长。未来,在合适的时机,研究员将会把 Suphx 的技术总结成为一篇论文,与大家分享更多技术细节。敬请期待!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6753

    浏览量

    108085
  • AI
    AI
    +关注

    关注

    91

    文章

    41156

    浏览量

    302620
  • 强化学习
    +关注

    关注

    4

    文章

    273

    浏览量

    11997

原文标题:微软超级麻将雀神荣升十段!AI Suphx横扫“天凤”领先人类1.3个段位

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    威高国际研究院 × 爱博精电|以智慧电力监控,护航国家级科研创新平台

    高端科研与智能制造深度融合的时代,稳定、安全、智能、高效的电力保障,已成为顶尖科研机构核心竞争力的重要组成。威高(上海)国际研究院,作为威高集团面向全球布局的国家级战略创新
    的头像 发表于 04-22 10:53 262次阅读

    沐曦股份北京AI研究院暨企业开源中心正式揭牌启动

    3月20日,沐曦股份北京AI研究院暨“企业开源中心”正式揭牌启动。活动以“沐曦芯生,开源共创”为主题,标志着沐曦股份生态建设的战略布局全面升级。
    的头像 发表于 03-24 10:11 328次阅读

    MediaTek携手微软研究院联合开发有源光缆技术

    MediaTek、微软研究院以及其他供应商所组成的研发团队,成功设计出新一代由微型化 MicroLED 光源驱动的有源光缆(AOC)。这一革命性的有源 MicroLED 光缆设计,相较于现有技术能够
    的头像 发表于 03-19 14:20 282次阅读

    汇诚仪器与中科微电子苏州研究院合作,热重分析仪助力科研创新

    双方资源互补的体现,也是汇诚仪器深耕科研领域的重要突破。中科微电子苏州研究院聚焦高端集成电路芯片、微系统开发,深耕科研成果转化与关键技术攻关,5G通讯、人工智能
    的头像 发表于 02-05 16:20 1110次阅读
    汇诚仪器与中科微电子苏州<b class='flag-5'>研究院</b>合作,热重分析仪助力科研创新

    诚迈科技携手应急管理大学、中铁十九局共建智慧应急科技创新研究院

    1月25日,由诚迈科技、应急管理大学、中铁十九局共同组建的智慧应急科技创新研究院(以下简称“研究院”)应急管理大学南校区正式启动。应急管理大学党委书记赵峰华,中铁十九局党委常委、副总经理赵琦,诚迈
    的头像 发表于 01-27 11:51 713次阅读
    诚迈科技携手应急管理大学、中铁十九局共建智慧应急科技创新<b class='flag-5'>研究院</b>

    广电计量与长沙三大研究院达成战略合作

    11月26-27日,广电计量与长沙北斗产业安全技术研究院集团股份有限公司(简称“长沙北斗研究院”)、长沙量子测量产业技术研究院有限公司(简称“长沙量子研究院”)、湖南大学长沙半导体技术
    的头像 发表于 12-04 14:36 670次阅读

    霍尔元件麻将机中的应用:以迪仕科技DH44E赋能智能洗牌精准控制

    现代自动麻将机中,智能化、高速化与高可靠性已成为衡量产品品质的核心标准。作为实现自动洗牌、理牌、升牌等复杂动作的关键设备,麻将机内部集成了大量精密传感器,其中 霍尔元件 凭借其非接触
    的头像 发表于 11-25 15:00 1205次阅读
    霍尔元件<b class='flag-5'>在</b><b class='flag-5'>麻将</b>机中的应用:以迪仕科技DH44E赋能智能洗牌精准控制

    广电计量携手南山研究院打造大健康产业新生态

    10月19日, “南山研究院南海四周年系列活动”广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单
    的头像 发表于 10-23 17:42 1301次阅读

    京东方首个材料研究院项目开工

    2025年8月20日,BOE(京东方)材料研究院项目开工仪式山东省烟台市黄渤海新区八角片区成功举办。
    的头像 发表于 08-22 09:12 1462次阅读

    今日看点丨亚马逊上海AI研究院解散;索尼拟出售以色列芯片部门

          1、 亚马逊上海AI研究院解散! 据报道,AWS亚马逊云科技上海AI研究院的首席应用科学家王敏捷发朋友圈称,他们收到通知,AWS亚马逊云科技上海
    发表于 07-24 09:42 1461次阅读
    今日看点丨亚马逊上海<b class='flag-5'>AI</b><b class='flag-5'>研究院</b>解散;索尼拟出售以色列芯片部门

    中软国际入选中国信通AI Agent智能体产业图谱1.0

    近日,中国信息通信研究院(以下简称“中国信通”)《AI Agent智能体产业图谱1.0》正式发布。该图谱是国内系统性梳理智能体产业生态的重要成果,聚焦“基础底座、智能体
    的头像 发表于 07-14 14:55 1826次阅读

    勇艺达人工智能研究院迎大咖加盟

    近日,深圳勇艺达总部隆重举行 “数智融合 聚贤赋能 —— 勇艺达人工智能研究院高端人才聘任仪式”,正式聘请黄道权先生与吴准先生加盟,为研究院注入顶尖智慧力量,此举标志着勇艺达人工智
    的头像 发表于 07-10 18:04 1079次阅读

    商汤大装置万象大模型开发平台获得中国信通最高评级

    近日,中国信息通信研究院(以下简称“中国信通”)完成可信AI《大模型推理平台通用能力成熟度》首轮评估。
    的头像 发表于 07-01 10:48 1131次阅读

    全球首个AI设计芯片系统诞生,来自中科

    基础软件的全流程自动化设计,标志着 AI 设计芯片成为现实,且其设计多项关键指标上达到人类专家手工设计水平。相关研究成果已发布于预印本网站 arXiv。  
    的头像 发表于 06-16 00:11 3501次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 1222次阅读