0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind的最新AI无需知晓规则就能掌握游戏

IEEE电气电子工程师 来源:IEEE电气电子工程师学会 作者:IEEE电气电子工程师 2021-01-05 09:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2016年,Alphabet的DeepMind与AlphaGo一起问世,该AI一直领先于人类最佳Go players。一年后,该子公司继续完善其工作,创建了AlphaGo Zero。 在AlphaGo Zero的前身通过观察业余和专业比赛学会了围棋的过程中,AlphaGo Zero通过简单地与自己对战来掌握了古老的游戏。 然后,DeepMind创建了AlphaZero,该AlphaZero可以使用单一算法玩围棋,象棋和将棋(日本象棋)。将所有这些AI捆绑在一起的是,他们知道在训练中必须掌握的游戏规则。 而DeepMind的最新AI MuZero,不需要去被告知如何下棋等游戏规则即可掌握。取而代之的是,该AI独自学习了游戏的相关内容,并且与DeepMind以前的任何算法一样,更加有能力,或者说更胜一筹。

创建一种可以适应情况的算法是人工智能研究人员试图解决的一个挑战,该算法虽然不知道控制仿真的所有规则,但仍然可以找到一种规划成功的方法。DeepMind一直尝试使用称为超前搜索的方法来解决该问题。使用这种方法,算法将考虑未来状态以规划行动计划。解决这个问题的最好方法是考虑如何玩象棋或星际争霸II这样的策略游戏。在采取行动之前,将考虑到对手的反应并尝试做出相应的计划。以几乎相同的方式,利用前瞻方法的AI将尝试预先计划几个动作。即使是像国际象棋这样相对简单的游戏,也无法考虑所有可能的未来状态,因此AI会优先考虑最有可能赢得比赛的游戏。

DeepMind

这种方法的问题在于,大多数现实情况,甚至某些游戏,都没有一套简单的规则来管理操作方式。因此,一些研究人员试图通过使用一种方法来解决该问题,该方法试图对特定游戏或场景环境将如何影响结果进行建模,然后使用该知识制定计划。该系统的缺点是某些域是如此复杂,以至于几乎不可能对各个方面进行建模。例如,事实证明,大多数Atari游戏都是这种情况。

在某种程度上,MuZero结合了两个方面的优势。它没有尝试对所有模型进行建模,而只是尝试考虑那些对决策至关重要的因素。正如DeepMind所指出的,这是作为人类所做的事情。当大多数人看着窗外,看到地平线上形成乌云时,他们通常不会被凝结和压力前沿之类的事情所困扰。相反,他们思考如果出门应该如何穿着以不被雨水淋湿。MuZero做的也是类似的事情。

在必须做出决定时,它考虑了三个因素。它将考虑其先前决定的结果,它目前所处的位置以及下一步的最佳行动方案。这种看似简单的方法使MuZero成为迄今为止DeepMind最有效的算法。在测试中,它发现MuZero在国际象棋,围棋和将棋中的表现都和AlphaZero一样好,并且比Atari游戏中包括Agent57在内的所有以前的算法都要好。它还发现,MuZero考虑动作的时间越长,执行效果就越好。DeepMind还进行了测试,在那些测试中,它发现MuZero仍然能够取得良好的结果。

在Atari游戏中获得高分固然很好,但是DeepMind最新研究的实际应用又如何呢?总之,它们可能是开创性的。虽然还没有找到,但MuZero是最接近研究人员来开发通用算法的。该子公司表示,MuZero的学习能力有一天可以帮助它解决没有简单规则的机器人领域的复杂问题。

原文标题:DeepMind最新AI - 无需提前知晓规则 也可以掌握游戏

文章出处:【微信公众号:IEEE电气电子工程师学会】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41964

    浏览量

    303057
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267726

原文标题:DeepMind最新AI - 无需提前知晓规则 也可以掌握游戏

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    [完结15章]Java转 AI高薪领域必备-从0到1打通生产级AI Agent开发

    必须转Python”。事实上,在企业级生产环境中,Python往往只停留在算法训练阶段,真正让AI能力落地并产生商业价值的,必然依赖Java强大的高并发处理与微服务治理能力。 转型的第一步,是掌握
    发表于 04-30 13:46

    Java转 AI高薪领域必备 从0到1打通生产级AI Agent开发 教程资料

    Java开发者一旦掌握了Agent的编排逻辑(如LangChain4j、Spring AI等框架的应用),就能成为连接“先进AI能力”与“厚重企业资产”的唯一桥梁。这种懂工程又懂智能的
    发表于 04-29 17:08

    AI大模型微调企业项目实战课

    成长为该领域的资深专家。通过将企业积累的高质量业务问答对、专业文档输入给模型,调整其内部的极小部分参数,就能让模型在保持原有通用能力的基础上,精准掌握企业的特定语感和输出规范。这不仅将训练成本从千万级拉
    发表于 04-16 18:48

    Vibe Coding AI全栈开发实战

    门槛 Vibe Coding的核心在于自然语言驱动开发。开发者无需掌握复杂的编程语法和框架细节,只需用日常语言描述需求,AI就能理解并生成相应的代码。这种交互方式极大地降低了技术门槛,
    发表于 04-15 16:02

    哈萨比斯 3:带领DeepMind实现技术反超,重回AI 牌桌

    AI
    江苏易安联
    发布于 :2026年04月14日 11:40:36

    嵌入式AI开发必看:杜绝幻觉,才是工业级IDE的核心底气

    验机制,通过自动化测试用例对生成代码进行持续验证,结合工业场景规则库进行自我修正。 无需人工干预即可完成多轮校验,确保代码符合工业控制系统“可预测、可验证、可交付”的核心要求,从根源杜绝 AI 幻觉
    发表于 03-18 13:49

    使用NORDIC AI的好处

    CPU 快 15× 能效最高可比最近的竞品 NPU 好 8×,推理速度快 7×。[Axon NPU 技术页] 开发门槛低、工具链完整 Nordic Edge AI Lab :只需准备好数据集,无需
    发表于 01-31 23:16

    脑海里AI8051U数据级联的过程

    CLR DEV2_CS; 选中设备2 LJMP 0000H; 跳转到设备2 0x00 ; ===================== 设备2:带音乐的RPG游戏AI交互简化
    发表于 01-24 06:49

    无需安装!在浏览器里就能玩转ESP32/ESP8266,这个神器绝了!

    无需安装!在浏览器里就能玩转ESP32/ESP8266,这个神器绝了!【往期精选】十年嵌入式最深的痛,不是Bug,而是抓不到日志!vivo宣布原生支持HomeAssistant生态设备接入(含
    的头像 发表于 01-10 10:01 1762次阅读
    <b class='flag-5'>无需</b>安装!在浏览器里<b class='flag-5'>就能</b>玩转ESP32/ESP8266,这个神器绝了!

    在Termux环境下实现康威生命游戏

    你想要在Termux环境下实现康威生命游戏,并专门展示经典的“滑翔机”模式,构建一个能持续运行的二维世界,同时需要完整的程序代码和调试说明。 一、实现思路康威生命游戏的核心是遵循4条规则:1. 活
    发表于 12-21 18:36

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    主要步骤: ①溯因②假说③实验 1、科学推理的类型 ①演绎②归纳 2、自动化科学发现框架 AI-笛卡儿-----自动化科学发现框架,利用数据和知识来生成和评估候选的科学假说。 4项规则:三、直觉
    发表于 09-17 11:45

    AI Coding + TuyaOpen,1小时快速打造AI女友和2048游戏

    七夕快到了,涂鸦本次准备教大家用AI给自己做个虚拟女友,它能根据对话情绪显示不同表情;在你游戏瘾上来的时候,还能秒变2048游戏机,让你一边玩游戏,一边和
    的头像 发表于 08-21 18:53 2109次阅读
    <b class='flag-5'>AI</b> Coding + TuyaOpen,1小时快速打造<b class='flag-5'>AI</b>女友和2048<b class='flag-5'>游戏</b>

    AI开启更逼真的游戏时代

    本文编译自semiengineering神经网络负责图形渲染,AI智能体指导玩法,而‘幻觉’则用于填补缺失的细节,让游戏世界更加完整。随着处理性能和内存的大幅提升,以及数据传输速度的显著加快
    的头像 发表于 08-20 11:22 1591次阅读
    <b class='flag-5'>AI</b>开启更逼真的<b class='flag-5'>游戏</b>时代

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14

    2025 职场新规则:不会AI智能体,可能连面试都过不了

    在当下这个科技飞速发展的时代,人工智能(AI)已经不再是科幻电影里的遥远想象,而是切切实实地融入到了我们生活和工作的方方面面。2025年,职场的格局正因为AI智能体发生着翻天覆地的变化,掌握A
    的头像 发表于 06-23 14:16 834次阅读
    2025 职场新<b class='flag-5'>规则</b>:不会<b class='flag-5'>AI</b>智能体,可能连面试都过不了