DeepMind的最新AI无需知晓规则就能掌握游戏-电子发烧友网

2016年，Alphabet的DeepMind与AlphaGo一起问世，该AI一直领先于人类最佳Go players。一年后，该子公司继续完善其工作，创建了AlphaGo Zero。在AlphaGo Zero的前身通过观察业余和专业比赛学会了围棋的过程中，AlphaGo Zero通过简单地与自己对战来掌握了古老的游戏。然后，DeepMind创建了AlphaZero，该AlphaZero可以使用单一算法玩围棋，象棋和将棋（日本象棋）。将所有这些AI捆绑在一起的是，他们知道在训练中必须掌握的游戏规则。而DeepMind的最新AI MuZero，不需要去被告知如何下棋等游戏规则即可掌握。取而代之的是，该AI独自学习了游戏的相关内容，并且与DeepMind以前的任何算法一样，更加有能力，或者说更胜一筹。

创建一种可以适应情况的算法是人工智能研究人员试图解决的一个挑战，该算法虽然不知道控制仿真的所有规则，但仍然可以找到一种规划成功的方法。DeepMind一直尝试使用称为超前搜索的方法来解决该问题。使用这种方法，算法将考虑未来状态以规划行动计划。解决这个问题的最好方法是考虑如何玩象棋或星际争霸II这样的策略游戏。在采取行动之前，将考虑到对手的反应并尝试做出相应的计划。以几乎相同的方式，利用前瞻方法的AI将尝试预先计划几个动作。即使是像国际象棋这样相对简单的游戏，也无法考虑所有可能的未来状态，因此AI会优先考虑最有可能赢得比赛的游戏。

DeepMind

这种方法的问题在于，大多数现实情况，甚至某些游戏，都没有一套简单的规则来管理操作方式。因此，一些研究人员试图通过使用一种方法来解决该问题，该方法试图对特定游戏或场景环境将如何影响结果进行建模，然后使用该知识制定计划。该系统的缺点是某些域是如此复杂，以至于几乎不可能对各个方面进行建模。例如，事实证明，大多数Atari游戏都是这种情况。

在某种程度上，MuZero结合了两个方面的优势。它没有尝试对所有模型进行建模，而只是尝试考虑那些对决策至关重要的因素。正如DeepMind所指出的，这是作为人类所做的事情。当大多数人看着窗外，看到地平线上形成乌云时，他们通常不会被凝结和压力前沿之类的事情所困扰。相反，他们思考如果出门应该如何穿着以不被雨水淋湿。MuZero做的也是类似的事情。

在必须做出决定时，它考虑了三个因素。它将考虑其先前决定的结果，它目前所处的位置以及下一步的最佳行动方案。这种看似简单的方法使MuZero成为迄今为止DeepMind最有效的算法。在测试中，它发现MuZero在国际象棋，围棋和将棋中的表现都和AlphaZero一样好，并且比Atari游戏中包括Agent57在内的所有以前的算法都要好。它还发现，MuZero考虑动作的时间越长，执行效果就越好。DeepMind还进行了测试，在那些测试中，它发现MuZero仍然能够取得良好的结果。

在Atari游戏中获得高分固然很好，但是DeepMind最新研究的实际应用又如何呢？总之，它们可能是开创性的。虽然还没有找到，但MuZero是最接近研究人员来开发通用算法的。该子公司表示，MuZero的学习能力有一天可以帮助它解决没有简单规则的机器人领域的复杂问题。

原文标题：DeepMind最新AI - 无需提前知晓规则也可以掌握游戏

文章出处：【微信公众号：IEEE电气电子工程师学会】欢迎添加关注！文章转载请注明出处。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
26442

浏览量
264036
人工智能

人工智能

+关注

关注
1776

文章
43845

浏览量
230590

原文标题：DeepMind最新AI - 无需提前知晓规则也可以掌握游戏

文章出处：【微信号：IEEE_China，微信公众号：IEEE电气电子工程师】欢迎添加关注！文章转载请注明出处。

谷歌DeepMind推出SIMI通用AI智能体

近日，谷歌的DeepMind团队发布了其最新研究成果——SIMI（Scalable Instructable Multiworld Agent），这是一个通用人工智能智能体，能够在多种3D虚拟环境

发表于 03-18 11:39 •367次阅读

谷歌DeepMind推新AI模型Genie，能生成2D游戏平台

据报道，谷歌公司的DeepMind团队近期发布了AI模型Genie，此模型拥有多达110亿个参数，能够依据用户提供的图片及提示词创建出相当完整的2D游戏场景。

发表于 02-27 14:53 •344次阅读

谷歌DeepMind资深AI研究员创办AI Agent创企

近日，刚从谷歌DeepMind离职的资深AI研究员Ioannis Antonoglou宣布创办了一家名为“AI Agent”的创企。Ioannis Antonoglou常驻伦敦，此前曾担任谷歌

发表于 02-04 10:02 •368次阅读

工程师需知道的50个路由器知识要点

电子发烧友网站提供《工程师需知道的50个路由器知识要点.pdf》资料免费下载

发表于 11-02 09:38 •1次下载

无需任何操作，通过BMI（脑机接口）就能像自己的手脚一样操纵机器

无需任何操作，通过BMI（脑机接口）就能像自己的手脚一样操纵机器

发表于 10-16 17:45 •353次阅读

恒温恒湿试验箱掌握好这几点就能选择对的

恒温恒湿试验箱掌握好这几点就能选择对的

发表于 09-21 17:30 •520次阅读

山东省大力发展元宇宙产业，DeepMind创始人访谈：AI像把双刃剑

大家好，欢迎收看河套IT WALK第102期。今天，我们为大家带来两则科技新闻。首先，我们将深入探讨DeepMind创始人对AI技术的看法，他认为AI技术就像一把双刃剑，既有巨大的潜力，也存在不少

发表于 09-08 21:00 •346次阅读

PCB设计必须掌握的规律和规则汇总

无论设计的PCB大小形状如何，高速信号还是低速信号，高密度多层走线还是低密度单层走线，总有一部分规则是共通的，熟练掌握这些规律，可以大大提高画板的效率

发表于 09-05 15:09 •238次阅读

GPT-5正秘密训练！DeepMind联创爆料，这模型比GPT-4大100倍

另外，采访中，Suleyman还爆出了很多自己在DeepMind和Inflection AI工作时的内部信息，包括了谷歌当时收购DeepMind和之后的抓马，某种程度上解释了为什么DeepMi

发表于 09-04 16:28 •463次阅读

AI如何对抗Dota人类游戏高手

AI如何对抗Dota人类游戏高手？OpenAI这样回答

发表于 08-01 15:01 •373次阅读

语言模型做先验，统一强化学习智能体，DeepMind选择走这条通用AI之路

体的发展，从最早的 AlphaGo、AlphaZero 到后来的多模态、多任务、多具身 AI 智能体 Gato，智能体的训练方法和能力都在不断演进。从中不难发现，随着大模型越来越成为人工智能发展的主流趋势，DeepMind 在智能体的开发中不断尝试将强化学习与自然语言处

发表于 07-24 16:55 •331次阅读

PCB板材分类需知

PCB板材分类需知

发表于 06-20 08:41 •1957次阅读

谷歌DeepMind发现更快排序算法，已集成到C++库

AlphaDev 基于 AlphaZero。DeepMind 向来以开发能自学游戏规则的 AI 软件而闻名。这种思路被证明效果拔群，也先后攻克了国际象棋、围棋和《星际争霸》等诸多游戏难

发表于 06-09 17:11 •551次阅读

谷歌DeepMind用AI改进数据排序

　　人工智能研究所谷歌Google DeepMind推出了三种ai工具AlphaZero、MuZero、AlphaDev，这些工具提高数据中心的资源利用率，提高视频压缩效率，更快的算法发现，整个计算优化生态系统。

发表于 06-09 10:30 •679次阅读

大敌当前，Google Brain与DeepMind合并！

Google 旗下的 Brain 团队和 DeepMind 都是各自研究各自的 AI，基本没有什么紧密合作。DeepMind 也只是提供一些技术来帮助 Google 改进产品和服务（比如

发表于 04-27 14:56 •610次阅读