0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI看70000小时《我的世界》视频,能达到一个什么水平?

OpenCV学堂 来源:量子位 作者:量子位 2022-11-28 16:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI看70000小时《我的世界》视频,能达到一个什么水平?

以“钻石镐”(diamond pickaxe)为例,这个东西高级人类玩家要快速点击20分钟、约2.4万个动作才能制作完成。

而现在的AI,已然能够轻松hold住了。

哐哐找到各种材料,一步步进行各种合成:

fac3aab6-6ec8-11ed-8abf-dac502259ad0.gif

这就是来自OpenAI号称最强的《我的世界》AI——MineDojo。

它还是世界第一个能够打造“钻石工具”的AI。

不仅如此,像打造“石镐”、“简易避难所”都不在话下:

fae3cff8-6ec8-11ed-8abf-dac502259ad0.gif

当然,在《我的世界》里其它的常规操作,在MineDojo手里也游刃有余。

例如游泳、狩猎、支柱跳等等:

fb7bd0fa-6ec8-11ed-8abf-dac502259ad0.gif

至于OpenAI为什么要让AI学会这些技巧,研究人员Bowen Baker表示:

很大程度上是因为我们在模拟人类上网时的行为。

MineDojo是如何炼成的?

正如我们刚才提到的,MineDojo的“炼成之道”,就是看视频。

这些视频内容都是人类玩家发布在油管上,展示自己如何玩《我的世界》的。

然后在看完70000小时视频之后,这个AI就学会了如何执行游戏中的各种任务。

fb9940f4-6ec8-11ed-8abf-dac502259ad0.gif

这种方式一般被称为模仿学习(imitation learning),就是训练神经网络通过观察人类行为来学习。

虽然此前也有众多相关研究,但仍有一些问题尚待解决。

“贴标签”就是其中之一。

传统方式就是在每一个动作上贴上标签:这么做会发生这件事、那么做会发生那件事。

但这种方式可想而知的后果,就是工作量太大了,导致可以用来训练的数据较少。

因此,OpenAI的研究人员便另辟蹊径,想出了不一样的研究思路——视频预训练(Video Pre-Training,VPT):

fbd96b7a-6ec8-11ed-8abf-dac502259ad0.png

这个方法的核心思路,就是训练另一个神经网络,专门来处理繁琐的“贴标签”的工作。

为此,研究人员先是找来一批玩家让他们先玩《我的世界》,当然,娱乐的同时也要记录下键盘、鼠标的点击次数。

如此一来,研究人员先是得到了2000小时带标记的一些数据。

在这基础上,他们便开始训练一个模型,来匹配键盘、鼠标动作和屏幕上的结果——

例如在什么情况下点下鼠标,会让游戏中的角色挥舞斧头。

把这个模型训练出来之后,就要引入70000小时没有标签的视频了;在它的加持下,庞大且可用的数据集就诞生了。

再接下来,就是回到之前模仿学习的思路,用这些新数据来训练AI。

fbf0e520-6ec8-11ed-8abf-dac502259ad0.png

虽说模仿学习可以说是强化学习的一个分支,但OpenAI的研究人员发现,VPT训出来的AI,能够完成单靠强化学习无法完成的任务。

比如制作木板并把它们变成一张桌子(大约需要970个连续动作)。

不仅如此,研究人员还发现,若是把模仿学习和强化学习做个结合,那么效果是最好的。

而由《我的世界》这次的研究拓展开来,OpenAI的研究人员还表示:

我们的AI还可以执行其它任务,例如鼠标浏览网站、预订航班或在线购物。

《我的世界》已经成为AI技术试验田

其实OpenAI这次研究的亮点,刨除VPT方法本身,其研究的两大要素——《我的世界》和视频,也成为人们热议的焦点。

《我的世界》这款游戏的一大特点就是开放性,玩家可以在这个虚拟世界里做出许多意想不到的杰作。

不同于以往强化学习训练AI的游戏环境,大多都是以“输赢”为结果而终止了,但往往AI后期训练出来的能力可能是超越这种“限制”的。

但《我的世界》就没有“输赢”之说了,AI可以在这里尽情的发挥。因此OpenAI研究人员表示:

《我的世界》是训练AI很好的试验田。

而这也赢得了NeurIPS的认可——MineDojo拿下了今年这个顶会的一个奖项。

至于这项研究第二个热议点“视频”,正如索尼执行董事Peter Stone所述:

视频是一种潜力巨大的培训资源。

但似乎OpenAI的研究人员还不满足此次的成果,他们认为,收集100万小时《我的世界》的视频,会让它们的AI变得更加出色。

当然,这项研究也引来不少网友们的围观,也有一些比较有意思的讨论:

人们想让AI有意识,但它们有意识之后才发觉,自己需要被迫看这么久的视频,有够累的。

fc1f847a-6ec8-11ed-8abf-dac502259ad0.png

论文地址: https://openai.com/blog/vpt/

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38225

    浏览量

    297073
  • ai技术
    +关注

    关注

    1

    文章

    1313

    浏览量

    25606

原文标题:AI看了70000小时《我的世界》视频学会人类高级技巧,网友:它好痛苦

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI6G与卫星通信:开启智能天网新时代

    需求?传统网络会因流量激增而拥堵,而AI的6G网络则能提前预测流量模式,动态调整资源分配。 AI算法能够实时分析海量数据,包括用户位置、网络负载、历史流量模式等。在2025年上海世界
    发表于 10-11 16:01

    嵌入式达到什么水平才能就业?

    很多想入行嵌入式的朋友,都在纠结:自己得学到啥水平,才能找到工作?要是现在还没达到这种水平/刚想入行嵌入式,现在开始学还来得及嘛?别慌,今天就来好好聊聊~ 嵌入式就业,需要达到这些
    发表于 09-15 10:20

    杰理科技关键技术达到国际领先水平

    2025年9月4日,广东省高新技术企业协会组织召开“自适应ANC低延时无线通信端侧AI芯片关键技术研发与应用”科技成果评价会。经评审,专家组致认定杰理科技该技术成果在综合技术领域已达到国际领先
    的头像 发表于 09-10 13:53 807次阅读

    一个N型连接器,都是与这世界握手的方式

    如你所见,只是名在江门工厂上班的工程师。可正是这颗颗N型接头,让把工作当修行,把连接当信仰。 ——Ken|连接器工程师,持续打磨信号世界
    的头像 发表于 08-07 16:42 592次阅读
    每<b class='flag-5'>一个</b>N型连接器,都是<b class='flag-5'>我</b>与这<b class='flag-5'>世界</b>握手的方式

    德州仪器(TI)的工程技术如何构建更美好的世界

    长期以来的追求,而这源于他在印度的成长经历。 "小时候,曾目睹贫困地区的人们为获取食物所经历的艰辛", 德州仪器 (TI) 技术与制造集团高级副总裁 Yunus  说,"而今在我们生活的社区,依然能看见相似的困境。这些经历让
    的头像 发表于 06-23 14:26 931次阅读
    <b class='flag-5'>看</b>德州仪器(TI)的工程技术如何构建更美好的<b class='flag-5'>世界</b>?

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布,为 AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性能、低功耗和灵活扩展的需求。 []() 领先的计算
    发表于 03-19 17:54

    《零基础开发AI Agent——手把手教你用扣子做智能体》

    Agent开发的核心技能。即使没有编程基础,也通过本书轻松上手,设计出属于自己的智能体。无论是个人兴趣还是企业应用,这本书都能为打开AI世界的大门,抓住
    发表于 03-18 12:03

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发视频应用。AI Agent是
    发表于 03-05 19:52

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    近期,DeepSeek这个名字在AI圈彻底炸开了锅并且关于DeepSeek的消息网络铺天盖地,短视频,朋友圈随处可见不少网友留言称其是“来自东方的神秘力量”又次震撼海外人士心脏“这太疯狂了
    发表于 03-03 11:21

    启明智显AI解决方案,用AI生活助手角度打开AI智能体的

    启明智显AI解决方案打造AI生活助手,用AI智能体的角度AI解决方案实现哪些功能
    的头像 发表于 02-26 14:43 1015次阅读
    启明智显<b class='flag-5'>AI</b>解决方案,用<b class='flag-5'>AI</b>生活助手角度打开<b class='flag-5'>AI</b>智能体的<b class='flag-5'>一</b>天

    DLP3021LEQ1EVM进行视频烧录,有办法提升烧录速度吗?

    在用官方文档推荐SPI 5M烧录速度进行视频烧录,大概30s的视频,大概花了半个多小时
    发表于 02-18 07:49

    AI边缘网关:开启智能时代的新蓝海

    在数字化转型的浪潮中,AI与边缘计算的结合正掀起场深刻的产业变革。边缘网关作为连接物理世界与数字世界的桥梁,在AI技术的加持下,正从简单的
    发表于 02-15 11:41

    NVIDIA推出加速物理AI开发的Cosmos世界基础模型

    经数百万小时的驾驶和机器人视频数据训练的先进模型,可用于普及物理 AI 开发,并以开放模型许可形式提供。
    的头像 发表于 01-09 11:05 1326次阅读

    在ARM上实现模拟视频的实时解码,模拟相机的速度为1080p 30fps,TVP5150达到这个速度吗?

    最近需要在ARM上实现模拟视频的实时解码,模拟相机的速度为1080p 30fps, 在这里想咨询下TVP5150达到这个速度吗
    发表于 12-20 07:57

    ADS1232增益无法达到64或者128怎么解决?

    将GAIN0设置成1就可以增加两倍在将GIAN1设置成1就无法达到64或者128.原采样值28000,两倍后56000. 128倍好70000
    发表于 12-17 06:58