0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI棋牌应用的现实意义

bzSh_drc_iite 来源:YXQ 2019-07-29 11:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI在棋牌类游戏的应用,将促进博弈决策的研究,以棋牌类AI应用为基础的相关AI博弈工具,在经济金融领域的风险预测、军事领域的战局预测等方向有着广泛的应用前景。

半个多世纪以来,棋牌类游戏一直是人工智能(AI)发展创新的舞台。利用AI在被视作智力游戏的棋牌中打败人类,也一直是AI研究所追求的目标。从1997年IBM的超级电脑“深蓝”击败国际象棋世界冠军卡斯帕罗夫,到2016年谷歌开发的AI机器人AlphaGo战胜围棋世界冠军李世石,AI在棋牌类比赛中屡获突破。2019年7月,卡耐基梅隆大学与Facebook公司共同开发的AI机器人“Pluribus”,在无限制德州扑克6人对决比赛中战胜5名专家级人类玩家,AI在德州扑克战场再下一城。

Pluribus概况

Pluribus与人类的比赛分为两种模式:1个AI与5个人类玩家和5个AI与1个人类玩家,Pluribus在这两种模式中都取得了胜利。而为了战胜人类,Pluribus在策略、算法和能耗上进行了多次优化。

Pluribus研发的核心策略是运用改进版本的蒙特卡洛遗憾最小化算法(Monte Carlo Counter factual Regret Minimization,MCCFR),通过自我博弈的方式学习。Pluribus首先随机地选择玩法,通过蛮力计算得到收敛的结果,并对这些行动拟合概率分布,使得其实力在不断自我博弈中逐步变强。在整个学习过程中,AI机器人和自己进行对战,不使用任何人类游戏数据作为输入。

算法上,为了解决6名玩家的额外复杂性,Pluribus整合了新的在线搜索算法,使AI能够在游戏中向前预测并决定下一步该做什么,这种机制被称为搜索功能。以往的棋牌类算法的每一步决策都需要计算到游戏结束,而在线搜索算法只需搜索前面的几步即可。此外,Pluribus还利用了速度更快的新型self-play非完美信息游戏算法。基于上述两种算法,使得凭借极少的处理能力和内存来训练Pluribus成为可能。

能耗上,研究人员使用一个64核的服务器,利用不大于512GB的内存,在8天时间里完成了Pluribus的自我博弈训练,其成本大约为150美元,同其他自我对弈的AI研究相比,成本极低。而且算法上的进步,让研究人员可凭借较少的资源消耗实现极大的性能提升。

扑克AI和其他棋牌类AI的对比

扑克AI与棋类AI的基本原理相同,都采用蒙特卡洛搜索树算法作为基本算法,不依赖人类所提供的策略,在不断迭代的过程中实现自我学习。不同的是,棋类游戏中的棋子都展现在棋盘上,结果种类有限,所有的结果都是可推算的,这种情况被称为“完美信息博弈”;牌类游戏中无法知道对手的底牌,含有隐藏信息,结果可能是多样的,导致其计算难度和计算量大大增加,被称为“不完美信息博弈”。

棋类AI

棋类游戏包括西洋双陆棋、国际象棋、围棋等,比赛中所有的信息和决策公开,并且游戏对于玩家来说只有赢或输两种可能的结果,从某种意义上说,这使得训练AI变得更容易。棋类在理论上可通过计算机模拟出每一种可能的情况,从而进行完美信息动态博弈。这类完美信息博弈中AI机器人往往使用实时搜索。例如,当模型在决定下一步该如何走时,国际象棋AI通常会考虑以后的一些移动步骤,直到算法的前瞻到达深度上限。而围棋的棋盘变化可能性比可观测宇宙范围的原子总数还多,因此围棋AI主要通过深度学习技术训练用于判断结果输赢概率的价值网络,来增强AI对弈能力。

麻将AI

麻将AI的策略需要更多地增加得点的期望值,尽量增大和大牌的可能性,同时尽量避免对手的大牌点炮,这一打牌策略显然是有最优解的。为了有更大的可能性和大牌,AI需要通过手牌和弃牌池里的牌,计算进张(摸到有效牌)和鸣牌(吃、碰、杠)使手牌有进展的概率,进而计算和牌得分的期望值。目前最强的麻将AI机器人是日本东京大学开发的“暴打”。

扑克AI

以德州扑克为例,由于在游戏中,玩家无法获取已发生事件的全部信息(如对手的底牌等),因此这个游戏属于“不完美信息”(Imperfect Information)类游戏。德州扑克一直是人工智能领域最难以攻克的重大问题之一,因为和棋类游戏不同,扑克AI必须推理隐藏的信息,并慎重平衡自己策略。同时,相比棋类比赛,在扑克游戏中需要使用Bluff(吓唬)等更多游戏策略。

在Pluribus之前,AI机器人曾在两个参与者的完美信息零和博弈中取得了多次引人注目的成功,但大多数真实世界中的策略交互都涉及隐藏信息,且并非两个参与者的零和博弈。Pluribus的成功表明,在复杂的多参与者场景中,基于自我博弈和搜索算法的AI能够获得很好的效果。

AI棋牌应用的现实意义

Pluribus提出了在大型状态空间、隐藏信息中有效地解决博弈论推理挑战的方法,所开发出的技术很大程度上独立于扑克领域,可用于大量不完美信息博弈。Pluribus处理的诸多问题,与真实世界中的通用问题相对应,“不知道对手的牌”对应现实中的“不完整信息”,“下注策略和由此带来的结果”对应现实中的“风险管理”,“确认对手的模式,并进行利用”对应现实中的“智能体建模”,“Bluffing(扑克中的恐吓技巧)”对应现实中的“欺骗”,“处理对手欺骗的牌”对应现实中的“不可靠信息”。

事实上,棋牌类游戏的本质是竞争和对抗,由游戏规则定义其目标(评价标准),玩家使用各种策略达成目标,其中涉及数量可观的博弈过程。AI在棋牌类游戏的应用,将促进博弈决策的研究。以棋牌类AI应用为基础的相关AI博弈工具,在经济金融领域的风险预测、军事领域的战局预测等方向有着广泛的应用前景。

在经济金融领域,不论对经济发展的总体趋势预测,还是银行、保险、股市等细分行业的风险模型建立,都需要依靠大量“不完美信息”来决策。AI博弈工具可通过处理不完美信息来获得最佳决策。政府可利用AI博弈工具对社会行业的未来趋势进行预测,判断供需关系,合理有序引导行业健康发展。银行、保险公司可利用AI工具判断短期行业走势,高效评估企业风险,以决定是否达成交易。

在军事领域,具有自主学习功能的AI博弈工具与兵棋推演相结合,将爆发出极强的战斗力,帮助军队获取制胜先机。从上个世纪70年代初开始,美国陆军就按照“全自动兵棋”概念建立起“地面作战模拟系统”。20世纪90年代初,美军在海湾战争爆发前就使用兵棋游戏对整个战争进行了推演,而战争的过程几乎和美军事前的推演如出一辙。随着技术的进步,算法不断成熟使得算力需求进一步降低,同时计算技术朝着系统微型化和处理高速化方向发展,具备超强自主学习和计算能力的AI系统与作战模拟系统相结合,将提升对战局的预测和把控。未来,AI系统将有希望直接与战场指挥系统对接,其快速战局推演能力、高效制定作战方案的能力,将主导战争的胜负走向。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    30580

    浏览量

    219583
  • AI
    AI
    +关注

    关注

    89

    文章

    38099

    浏览量

    296621

原文标题:人工智能技术在棋牌中的应用“Pluribus”及其现实意义

文章出处:【微信号:drc_iite,微信公众号:全球技术地图】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    源网荷储:从概念到实践的全面解析

    能源生产、传输、消费、存储全链条的系统工程。本文将从概念内核、核心价值、实践场景到发展路径,带你全面读懂源网荷储的“前世今生”与现实意义
    的头像 发表于 11-21 10:23 331次阅读

    通用接口芯片国产替代进程:以ASM1042为例看自主可控的现实意义

    摘要 :在全球科技竞争日益激烈的背景下,芯片国产替代对于保障国家安全及推动科技自主化具有重要意义。通用接口芯片作为诸多关键领域不可或缺的硬件组件,其国产化进程备受瞩目。本文以厦门国科安芯科技有限公司
    的头像 发表于 09-15 17:31 831次阅读

    ChatGPT 智能体发布的观点解析及对科义相关系统的现实意义

    7月18日凌晨,OpenAI 发布通用人工智能代理 ChatGPT 智能体。这一事件蕴含着多层面的深刻意义,同时也为科义巡检机器人和科义视频行为分析系统带来了诸多现实影响。 从技术层面来看,这标志着
    的头像 发表于 07-18 16:31 9070次阅读

    基于FPGA YOLO算法的扫描式SMT焊点缺陷检测系统设计

    作为电子产品最重要的组成部分,印刷电路板(PCB)的设计日趋复杂和器件尺寸的缩小,促使对 SMT 可靠性提出了更高的要求。因此对于 SMT 电路板的检测研究具有深刻的现实意义和经济价值。
    的头像 发表于 07-16 11:16 3113次阅读
    基于FPGA YOLO算法的扫描式SMT焊点缺陷检测系统设计

    森瑟传感器在风电叶片监测行业的应用

    通过风机叶片在线监测系统及早发现叶片振动超限、载荷过大等问题,通过实时监测 和超限报警及时调整风机运行状态,防止出现叶片发生事故,这对风机安全有非常重要的现实意义
    的头像 发表于 07-15 10:02 369次阅读
    森瑟传感器在风电叶片监测行业的应用

    巨头押宝AI眼镜,DPVR AI Glasses将成“现实助手”?

    VR同期曝光的战略级产品DPVR AI Glasses,其技术架构与功能设计理念同样指向更广阔的现实应用场景,展现出国产科技企业在智能穿戴领域的前瞻性战略布局。 影像技术预研突破,定义沉浸式记录新标准 DPVR AI Glass
    的头像 发表于 05-30 10:49 603次阅读

    开关柜防误可视化顺控操作为什么有必要做?

    蜀瑞创新科普:开关柜防误可视化顺控操作(通常指基于可视化技术的顺序控制防误操作)即使在已有传统五防系统的基础上,仍然具有重要的现实意义和必要性,主要原因如下:
    的头像 发表于 05-29 09:22 414次阅读
    开关柜防误可视化顺控操作为什么有必要做?

    【「零基础开发AI Agent」阅读体验】+读《零基础开发AI Agent》掌握扣子平台开发智能体方法

    Agent的开发基本过程和应该具备的知识有了一个认识,具有相当的现实实在意义,希望您也能读一读它,也希望的的分享对您有意义。 感谢电子发烧友!!!
    发表于 05-14 19:51

    安防智能制造有了新的指引

    安防行业正向智能化、数字化方向发展,而2025年以DeepSeek为代表的大模型技术让安防+AI2.0更具现实意义
    的头像 发表于 05-09 09:21 383次阅读
    安防智能制造有了新的指引

    隧道调频广播覆盖的实现路径:隧道无线广播技术赋能行车安全升级

    实施,该系统不仅能够解决隧道内的广播盲区问题,还能在安全应急、交通管理等方面发挥重要作用。因此,实现隧道调频广播全覆盖具有重要的现实意义和安全价值。
    的头像 发表于 04-23 18:24 419次阅读
    隧道调频广播覆盖的实现路径:隧道无线广播技术赋能行车安全升级

    基于RV1126开发板的人脸姿态估计算法开发

    )、左右旋转(yaw)以及平面内角度旋转(roll)。因此,姿态估计在多姿态人脸的识别和司机行为检测等应用场景,具有巨大的现实意义和实用价值。
    的头像 发表于 04-14 17:21 2035次阅读
    基于RV1126开发板的人脸姿态估计算法开发

    蛙跳算法驱动,重塑电动汽车有序充电革新路径

    挑战。因此,研究电动汽车有序充电策略具有重要的现实意义。 近年来,国内外学者在电动汽车有序充电领域开展了广泛研究。主要方法包括基于电价引导的策略、分层优化方法和智能算法等。其中,智能算法因其强大的全局搜索能力
    的头像 发表于 04-08 14:04 702次阅读
    蛙跳算法驱动,重塑电动汽车有序充电革新路径

    智慧路灯的成本是多少

    叁仟智慧路灯的成本构成,对推动智慧城市建设的高质量发展,有着极为重要的现实意义。 叁仟智慧路灯成本究竟几何?下面将从设备采购、安装调试与运营维护这三个维度,为大家揭开谜底。 集成了多种先进设备的叁仟智慧路灯 一、
    的头像 发表于 03-27 22:50 776次阅读
    智慧路灯的成本是多少

    医院能耗监测节能管理系统方案

    的能源监测与节能管理有重要的现实意义。 医院的主要能耗包括水、电、天然气、暖气等,主要来源于医疗设备、灯光照明、数据机房、动力设备以及供水用暖等民生设施。通过将这些能源数据采集起来,进行监测和管理,能够实现
    的头像 发表于 01-08 14:09 709次阅读