0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind又出AI大招

机器人技术与应用 来源:机器人技术与应用 作者:机器人技术与应用 2021-03-11 15:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

DeepMind 公司因为研制出会下棋的人工智能AlphaGo和AlphaZero而声名鹊起,如今他们将注意力转向了另一种棋盘游戏:强权外交(Diplomacy),也被称为外交或者外交风云,是经典的桌面游戏之一。该游戏与围棋不同,它是七人游戏,需要游戏玩家既竞争又合作,并且每回合玩家都会同时进行移动,因此,每个玩家都必须推理其他玩家的想法,非常复杂。

研制一个能玩外交游戏的人工智能软件,DeepMind公司的计算机专家Andrea Tacchetti表示:“与游戏Go或国际象棋相比,这是一个本质上不同的问题。” 去年12月,Tacchetti和合作者在NeurIPS会议上就其系统发表了一篇论文,该论文介绍了能玩外交游戏的AI系统策略。

“外交”是一种策略游戏,在欧洲地图上划分为75个省。玩家建立并动员军队占领各省,直到控制了大部分补给中心的玩家获胜。玩家每回合写下自己的行动,然后执行。他们可以攻击或防御对方玩家,或者支援对方玩家的进攻和防御,建立联盟。在完整版中,玩家可以协商,为了方便人工智能研究,DeepMind公司使用了简单版的“No Press”策略,不需要人工智能软件发布策略与其他玩家进行沟通。

从历史上看,人工智能使用人工制定的策略来发挥决策作用。2019年,蒙特利尔研究所的Mila通过使用深度学习系统取得了胜利。他们基于150000个人类游戏的数据集,训练了一个称为DipNet的神经网络来模仿人类。DeepMind从DipNet版本开始,使用强化学习(一种反复试验)来完善它。但是,仅通过反复试验来探索可能性会带来问题。因此,他们调整了强化学习算法。在训练过程中,他们在每一步中都对对手的可能举动进行采样,计算出在这些情况下平均效果最佳的行动,然后训练自己的权重以偏向于此行动。经过训练,它跳过了采样过程,仅根据其学习的知识进行工作。Tacchetti说:“我们论文的信息是:我们可以在这样的环境中进行强化学习。” 他们设计的一个AI玩家与六个DipNet的AI赢了30%的时间(有14%的机会)。一个DipNet对抗他们的七个,仅赢得了3%的时间。

今年4月,Facebook将在ICLR会议上发表一篇论文,描述他们在“No Press”版本的外交游戏中的研究成果。他们建立了类似DipNet的网络,但是没有添加强化学习的元素,而是添加了一个“SearchBot”搜索玩家策略,SearchBot通过玩几回合来评估玩家的每种潜在策略(假设每个人都根据神经网络的首选选择后续行动)。策略不是一个最佳行动组合,而是由50个可能行动组成的一组概率(由神经网络建议)。

在真实游戏中进行这样的探索会减慢SearchBot的速度,但可以使它更优于DipNet。SearchBot在外交游戏网站上与人类进行了匿名比赛,在玩家中排名前2%。Facebook的计算机专家、论文的共同作者亚当·勒勒(Adam Lerer)说:“这是第一个被证明具有能与人类竞争的机器人。”

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50585

    浏览量

    268099
  • 强化学习
    +关注

    关注

    4

    文章

    275

    浏览量

    12023
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    12476

原文标题:DeepMind又出AI大招

文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    完结AI 全栈开发实战营 (讠果xingkeit-top)#人工智能 #AI

    AI
    jf_98563832
    发布于 :2026年05月27日 17:39:19

    AI编程实战营 (讠果xingkeit-top)#AI编程

    AI
    jf_39340687
    发布于 :2026年05月25日 17:26:29

    【极客时间】AI编程实战营 -陈天(学:97it-top)# AI编程

    AI
    jf_97408443
    发布于 :2026年05月25日 14:08:47

    AI 编程实战营(完结) (讠果xingkeit-top)#AI编程

    AI
    jf_76631595
    发布于 :2026年05月11日 14:37:42

    哈萨比斯 3:带领DeepMind实现技术反超,重回AI 牌桌

    AI
    江苏易安联
    发布于 :2026年04月14日 11:40:36

    使用NORDIC AI的好处

    Nordic 的 Edge AI 主要有以下几个好处(基于官方资料总结): 极低功耗、延长电池寿命 在本地运行 AI,减少无线传输次数,而无线收发是最耗电的部分。设备只需上传“结果/事件”,而不是
    发表于 01-31 23:16

    纯4G?血版AI小智产品方案 #小智AI #AI方案商 #4G通话 #AI终端产品

    AI
    不太正经的攻城狮
    发布于 :2025年12月21日 14:36:55

    融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件

    *附件:ai study.zip*附件:融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件.pdf 基于开源鸿蒙编写的ai辅助学习软件
    发表于 11-12 15:38

    VS680 HDMI AI分析解决方案 #目标识别 #视频翻译 #AI #芯片

    AI
    深蕾半导体
    发布于 :2025年11月12日 10:29:33

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验科学、理论科学、计算科学、数据驱动科学一起构成
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    当今社会,AI已经发展很迅速了,但是你了解AI的发展历程吗?本章作者将为我们打开AI的发展历程以及需求和挑战的面纱。 从2017年开始生成式AI开创了新的时代,经历了三次热潮和两次低谷
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑在本质上就是一台湿润的软组织
    发表于 09-06 19:12

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、腾讯
    发表于 07-09 18:30