0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI看70000小时《我的世界》视频,能达到一个什么水平?

OpenCV学堂 来源:量子位 作者:量子位 2022-11-28 16:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI看70000小时《我的世界》视频,能达到一个什么水平?

以“钻石镐”(diamond pickaxe)为例,这个东西高级人类玩家要快速点击20分钟、约2.4万个动作才能制作完成。

而现在的AI,已然能够轻松hold住了。

哐哐找到各种材料,一步步进行各种合成:

fac3aab6-6ec8-11ed-8abf-dac502259ad0.gif

这就是来自OpenAI号称最强的《我的世界》AI——MineDojo。

它还是世界第一个能够打造“钻石工具”的AI。

不仅如此,像打造“石镐”、“简易避难所”都不在话下:

fae3cff8-6ec8-11ed-8abf-dac502259ad0.gif

当然,在《我的世界》里其它的常规操作,在MineDojo手里也游刃有余。

例如游泳、狩猎、支柱跳等等:

fb7bd0fa-6ec8-11ed-8abf-dac502259ad0.gif

至于OpenAI为什么要让AI学会这些技巧,研究人员Bowen Baker表示:

很大程度上是因为我们在模拟人类上网时的行为。

MineDojo是如何炼成的?

正如我们刚才提到的,MineDojo的“炼成之道”,就是看视频。

这些视频内容都是人类玩家发布在油管上,展示自己如何玩《我的世界》的。

然后在看完70000小时视频之后,这个AI就学会了如何执行游戏中的各种任务。

fb9940f4-6ec8-11ed-8abf-dac502259ad0.gif

这种方式一般被称为模仿学习(imitation learning),就是训练神经网络通过观察人类行为来学习。

虽然此前也有众多相关研究,但仍有一些问题尚待解决。

“贴标签”就是其中之一。

传统方式就是在每一个动作上贴上标签:这么做会发生这件事、那么做会发生那件事。

但这种方式可想而知的后果,就是工作量太大了,导致可以用来训练的数据较少。

因此,OpenAI的研究人员便另辟蹊径,想出了不一样的研究思路——视频预训练(Video Pre-Training,VPT):

fbd96b7a-6ec8-11ed-8abf-dac502259ad0.png

这个方法的核心思路,就是训练另一个神经网络,专门来处理繁琐的“贴标签”的工作。

为此,研究人员先是找来一批玩家让他们先玩《我的世界》,当然,娱乐的同时也要记录下键盘、鼠标的点击次数。

如此一来,研究人员先是得到了2000小时带标记的一些数据。

在这基础上,他们便开始训练一个模型,来匹配键盘、鼠标动作和屏幕上的结果——

例如在什么情况下点下鼠标,会让游戏中的角色挥舞斧头。

把这个模型训练出来之后,就要引入70000小时没有标签的视频了;在它的加持下,庞大且可用的数据集就诞生了。

再接下来,就是回到之前模仿学习的思路,用这些新数据来训练AI。

fbf0e520-6ec8-11ed-8abf-dac502259ad0.png

虽说模仿学习可以说是强化学习的一个分支,但OpenAI的研究人员发现,VPT训出来的AI,能够完成单靠强化学习无法完成的任务。

比如制作木板并把它们变成一张桌子(大约需要970个连续动作)。

不仅如此,研究人员还发现,若是把模仿学习和强化学习做个结合,那么效果是最好的。

而由《我的世界》这次的研究拓展开来,OpenAI的研究人员还表示:

我们的AI还可以执行其它任务,例如鼠标浏览网站、预订航班或在线购物。

《我的世界》已经成为AI技术试验田

其实OpenAI这次研究的亮点,刨除VPT方法本身,其研究的两大要素——《我的世界》和视频,也成为人们热议的焦点。

《我的世界》这款游戏的一大特点就是开放性,玩家可以在这个虚拟世界里做出许多意想不到的杰作。

不同于以往强化学习训练AI的游戏环境,大多都是以“输赢”为结果而终止了,但往往AI后期训练出来的能力可能是超越这种“限制”的。

但《我的世界》就没有“输赢”之说了,AI可以在这里尽情的发挥。因此OpenAI研究人员表示:

《我的世界》是训练AI很好的试验田。

而这也赢得了NeurIPS的认可——MineDojo拿下了今年这个顶会的一个奖项。

至于这项研究第二个热议点“视频”,正如索尼执行董事Peter Stone所述:

视频是一种潜力巨大的培训资源。

但似乎OpenAI的研究人员还不满足此次的成果,他们认为,收集100万小时《我的世界》的视频,会让它们的AI变得更加出色。

当然,这项研究也引来不少网友们的围观,也有一些比较有意思的讨论:

人们想让AI有意识,但它们有意识之后才发觉,自己需要被迫看这么久的视频,有够累的。

fc1f847a-6ec8-11ed-8abf-dac502259ad0.png

论文地址: https://openai.com/blog/vpt/

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41077

    浏览量

    302574
  • ai技术
    +关注

    关注

    1

    文章

    1315

    浏览量

    25807

原文标题:AI看了70000小时《我的世界》视频学会人类高级技巧,网友:它好痛苦

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    ” 。 随着DeepSeek、LLaMA等开源模型的轻量化演进,以及具身智能、工业质检对实时性的严苛要求,AI计算正在从云数据中心扩散到离数据源头最近的物理世界。在这背景下,AI M
    发表于 03-10 14:19

    瑞芯微SOC智能视觉AI处理器

    能力。核心升级: 增加了高规格的视频编码能力,支持H.264/H.265格式的4K@60fps编码。目标: 解决了RK1126只“分析”不能“录制”的短板,成为
    发表于 12-19 13:44

    AI助手的那些事儿:小老板的数字化转型日记

    本文记录了——传统行业小老板,如何从对AI窍不通,到成为Flexus AI智能体重度用户
    的头像 发表于 12-18 13:42 394次阅读

    AI眼镜控车!理想杀入AI眼镜赛道,首发Deep Research功能

    的人工智能企业”。理想AI智能眼镜Livis的发布,也成为理想汽车向“全场景智能体”的战略跨越的关键环,更在AI硬件与汽车生态深度融合的赛道上,掀起新的水花。         0.7秒抓拍+18
    的头像 发表于 12-05 09:22 9822次阅读
    <b class='flag-5'>AI</b>眼镜<b class='flag-5'>能</b>控车!理想杀入<b class='flag-5'>AI</b>眼镜赛道,首发Deep Research功能

    AI6G与卫星通信:开启智能天网新时代

    需求?传统网络会因流量激增而拥堵,而AI的6G网络则能提前预测流量模式,动态调整资源分配。 AI算法能够实时分析海量数据,包括用户位置、网络负载、历史流量模式等。在2025年上海世界
    发表于 10-11 16:01

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、现阶段更智能、更接近AGI的6中算法与模型 1、MoE模型 MoE模型作为Transfomer模型的后继者,代表着AI技术的项重大创新和发展。 优势: 在于处理庞大的参数规模,显著减少内存占用
    发表于 09-18 15:31

    嵌入式达到什么水平才能就业?

    很多想入行嵌入式的朋友,都在纠结:自己得学到啥水平,才能找到工作?要是现在还没达到这种水平/刚想入行嵌入式,现在开始学还来得及嘛?别慌,今天就来好好聊聊~ 嵌入式就业,需要达到这些
    发表于 09-15 10:20

    杰理科技关键技术达到国际领先水平

    2025年9月4日,广东省高新技术企业协会组织召开“自适应ANC低延时无线通信端侧AI芯片关键技术研发与应用”科技成果评价会。经评审,专家组致认定杰理科技该技术成果在综合技术领域已达到国际领先
    的头像 发表于 09-10 13:53 1350次阅读

    声智科技声学模型赋予AI感知物理世界

    在科技浪潮的尖端,新时代正悄然开启。NVIDIA创始人黄仁勋曾预言,未来通用人工智能(AGI)将不再局限于虚拟世界,而是能够与物理世界深度交互的“物理
    的头像 发表于 09-02 17:46 1596次阅读

    一个N型连接器,都是与这世界握手的方式

    如你所见,只是名在江门工厂上班的工程师。可正是这颗颗N型接头,让把工作当修行,把连接当信仰。 ——Ken|连接器工程师,持续打磨信号世界
    的头像 发表于 08-07 16:42 902次阅读
    每<b class='flag-5'>一个</b>N型连接器,都是<b class='flag-5'>我</b>与这<b class='flag-5'>世界</b>握手的方式

    AI视频分析系统

    方案背景人工智能大时代背景下,视频应用领域相关的行业应用方式已经发生了深刻的变化,各论安防监控还是各类垂直行业视频应用,都需要AI视觉分析与识别技术助力,而且需求广泛而迫切。在应用层面,以AI
    的头像 发表于 08-06 14:39 1058次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视频</b>分析系统

    AI玩具或成为下一个万亿新赛道

    如果你将拥有家庭新成员,你首先会想到什么?是孩子还是宠物?如果说你下一个家庭成员,或许是
    的头像 发表于 07-29 10:15 1257次阅读

    德州仪器(TI)的工程技术如何构建更美好的世界

    长期以来的追求,而这源于他在印度的成长经历。 "小时候,曾目睹贫困地区的人们为获取食物所经历的艰辛", 德州仪器 (TI) 技术与制造集团高级副总裁 Yunus  说,"而今在我们生活的社区,依然能看见相似的困境。这些经历让
    的头像 发表于 06-23 14:26 1358次阅读
    <b class='flag-5'>看</b>德州仪器(TI)的工程技术如何构建更美好的<b class='flag-5'>世界</b>?

    4K、多模态、长视频AI视频生成的下一个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型,支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频
    的头像 发表于 06-16 00:13 7545次阅读

    关于范例fifosync5bit在使用EP1-8共有16通道时,其最大速度达到多少K?

    您好,想问下关于范例fifosync5bit在使用EP1-8共有16通道时,其最大速度达到多少K?
    发表于 05-22 06:57