0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind的最新AI无需知晓规则就能掌握游戏

IEEE电气电子工程师 来源:IEEE电气电子工程师学会 作者:IEEE电气电子工程师 2021-01-05 09:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最佳Go players。一年后,该子公司继续完善其工作,创建了AlphaGo Zero。 在AlphaGo Zero的前身通过观察业余和专业比赛学会了围棋的过程中,AlphaGo Zero通过简单地与自己对战来掌握了古老的游戏。 然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋,象棋和将棋(日本象棋)。将所有这些AI捆绑在一起的是,他们知道在训练中必须掌握的游戏规则。 而DeepMind的最新AI MuZero,不需要去被告知如何下棋等游戏规则即可掌握。取而代之的是,该AI独自学习了游戏的相关内容,并且与DeepMind以前的任何算法一样,更加有能力,或者说更胜一筹。

创建一种可以适应情况的算法是人工智能研究人员试图解决的一个挑战,该算法虽然不知道控制仿真的所有规则,但仍然可以找到一种规划成功的方法。DeepMind一直尝试使用称为超前搜索的方法来解决该问题。使用这种方法,算法将考虑未来状态以规划行动计划。解决这个问题的最好方法是考虑如何玩象棋或星际争霸II这样的策略游戏。在采取行动之前,将考虑到对手的反应并尝试做出相应的计划。以几乎相同的方式,利用前瞻方法的AI将尝试预先计划几个动作。即使是像国际象棋这样相对简单的游戏,也无法考虑所有可能的未来状态,因此AI会优先考虑最有可能赢得比赛的游戏。

DeepMind

这种方法的问题在于,大多数现实情况,甚至某些游戏,都没有一套简单的规则来管理操作方式。因此,一些研究人员试图通过使用一种方法来解决该问题,该方法试图对特定游戏或场景环境将如何影响结果进行建模,然后使用该知识制定计划。该系统的缺点是某些域是如此复杂,以至于几乎不可能对各个方面进行建模。例如,事实证明,大多数Atari游戏都是这种情况。

在某种程度上,MuZero结合了两个方面的优势。它没有尝试对所有模型进行建模,而只是尝试考虑那些对决策至关重要的因素。正如DeepMind所指出的,这是作为人类所做的事情。当大多数人看着窗外,看到地平线上形成乌云时,他们通常不会被凝结和压力前沿之类的事情所困扰。相反,他们思考如果出门应该如何穿着以不被雨水淋湿。MuZero做的也是类似的事情。

在必须做出决定时,它考虑了三个因素。它将考虑其先前决定的结果,它目前所处的位置以及下一步的最佳行动方案。这种看似简单的方法使MuZero成为迄今为止DeepMind最有效的算法。在测试中,它发现MuZero在国际象棋,围棋和将棋中的表现都和AlphaZero一样好,并且比Atari游戏中包括Agent57在内的所有以前的算法都要好。它还发现,MuZero考虑动作的时间越长,执行效果就越好。DeepMind还进行了测试,在那些测试中,它发现MuZero仍然能够取得良好的结果。

在Atari游戏中获得高分固然很好,但是DeepMind最新研究的实际应用又如何呢?总之,它们可能是开创性的。虽然还没有找到,但MuZero是最接近研究人员来开发通用算法的。该子公司表示,MuZero的学习能力有一天可以帮助它解决没有简单规则的机器人领域的复杂问题。

原文标题:DeepMind最新AI - 无需提前知晓规则 也可以掌握游戏

文章出处:【微信公众号:IEEE电气电子工程师学会】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296602
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261521

原文标题:DeepMind最新AI - 无需提前知晓规则 也可以掌握游戏

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    主要步骤: ①溯因②假说③实验 1、科学推理的类型 ①演绎②归纳 2、自动化科学发现框架 AI-笛卡儿-----自动化科学发现框架,利用数据和知识来生成和评估候选的科学假说。 4项规则:三、直觉
    发表于 09-17 11:45

    AI Coding + TuyaOpen,1小时快速打造AI女友和2048游戏

    七夕快到了,涂鸦本次准备教大家用AI给自己做个虚拟女友,它能根据对话情绪显示不同表情;在你游戏瘾上来的时候,还能秒变2048游戏机,让你一边玩游戏,一边和
    的头像 发表于 08-21 18:53 1214次阅读
    <b class='flag-5'>AI</b> Coding + TuyaOpen,1小时快速打造<b class='flag-5'>AI</b>女友和2048<b class='flag-5'>游戏</b>

    AI开启更逼真的游戏时代

    本文编译自semiengineering神经网络负责图形渲染,AI智能体指导玩法,而‘幻觉’则用于填补缺失的细节,让游戏世界更加完整。随着处理性能和内存的大幅提升,以及数据传输速度的显著加快
    的头像 发表于 08-20 11:22 991次阅读
    <b class='flag-5'>AI</b>开启更逼真的<b class='flag-5'>游戏</b>时代

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14

    2025 职场新规则:不会AI智能体,可能连面试都过不了

    在当下这个科技飞速发展的时代,人工智能(AI)已经不再是科幻电影里的遥远想象,而是切切实实地融入到了我们生活和工作的方方面面。2025年,职场的格局正因为AI智能体发生着翻天覆地的变化,掌握A
    的头像 发表于 06-23 14:16 530次阅读
    2025 职场新<b class='flag-5'>规则</b>:不会<b class='flag-5'>AI</b>智能体,可能连面试都过不了

    【「零基础开发AI Agent」阅读体验】+读《零基础开发AI Agent》掌握扣子平台开发智能体方法

    收到发烧友网站寄来的《零基础开发AI Agent》这本书已经有好些天了,这段时间有幸拜读了一下全书,掌握了一个开发智能体的方法。 该书充分从零基础入手,先阐述了Agent是什么,它的基本概念和知识
    发表于 05-14 19:51

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    10.AI Agent开发模式走向了零代码可视化模式(需要我们程序员对此有着观念上的转变),但是掌握编程技术,有助于AI Agent的开发进阶
    发表于 05-02 09:26

    《零基础开发AI Agent——手把手教你用扣子做智能体》

    《零基础开发AI Agent——手把手教你用扣子做智能体》是一本为普通人量身打造的AI开发指南。它不仅深入浅出地讲解了Agent的概念和发展,还通过详细的工具介绍和实战案例,帮助读者快速掌握
    发表于 03-18 12:03

    一夜爆火的DeepSeek一体机,如何改写AI游戏规则

    一夜爆火的DeepSeek一体机,如何改写AI游戏规则? 过去一个多月,科技圈有个“新晋顶流”C位出道,名字叫DeepSeek一体机。 它火到什么程度? 朋友圈不断刷屏,有人调侃:“没抢到
    的头像 发表于 03-11 15:52 1007次阅读
    一夜爆火的DeepSeek一体机,如何改写<b class='flag-5'>AI</b><b class='flag-5'>游戏规则</b>?

    【「AI Agent应用与项目实战」阅读体验】书籍介绍

    ,相当于我们说的“专家”吧。我们通过Prompt进行限定,然后给他灌输专业领域的知识库,就能了专业的AI Agent了,听起来感觉很神奇了,接下来我们一起看一下到底是怎么搞出来的。 二.大纲 本书整体章节
    发表于 03-05 20:40

    ADS1211如何给四通个道的初始化、四个通道又是如何轮流进行A/D转换?

    使用的。 而我设计的板卡中,ADS1211是四通道轮流工作。在此,小弟急需知晓ADS1211如何给四通个道的初始化、四个通道又是如何轮流进行A/D转换?具体的流程是怎样的?恳切希望TI的ADC达人帮忙解惑,小弟不甚感激
    发表于 02-13 07:53

    DeepMind创始人预计年内有AI设计药物进入临床试验

    近日,英国人工智能公司DeepMind的创始人兼首席执行官德米斯·哈萨比斯(Demis Hassabis)透露,预计在今年年底前,将有人工智能(AI)设计的药物进入临床试验阶段。
    的头像 发表于 01-24 15:46 2575次阅读

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    近日,谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露,谷歌已将AI Studio团队整体转移至DeepMi
    的头像 发表于 01-13 14:40 1137次阅读

    巨人网络发布“千影”大模型,加速“游戏+AI”布局

    近日,巨人网络在2024年度中国游戏产业年会上,正式推出了名为“千影 QianYing”的有声游戏生成大模型。这一创新举措标志着巨人网络在“游戏+AI”赛道上的又一重要布局。 “千影
    的头像 发表于 12-16 09:45 1939次阅读