0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind全新AI项目曝光:可控制各类机器人,数据集有望开源

jf_WZTOguxH 来源:AI前线 2023-10-09 15:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

DeepMind 的新项目是什么?

开发机器人技术的一大挑战,就在于必须投入大量精力来为每台机器人、每项任务和每种环境训练机器学习模型。近日,谷歌 DeepMind 团队及其他 33 个研究机构正共同发起新项目,旨在创建一套通用 AI 系统来应对这个挑战。据称该系统能够与不同类型的物理机器人协同运作,成功执行多种任务。

谷歌机器人部门高级软件工程师 Pannag Sanketi 在采访中表示,“我们观察到,机器人在专项领域表现极佳,但在通用领域却缺乏灵性。一般来讲,大家需要为每项任务、每台机器人和每种环境分别训练一套模型,从零开始调整每一个变量。”

为了克服这个问题,让机器人的训练和部署变得更加轻松、快捷,谷歌 DeepMind 在名为 Open X-Embodiment 的大型共享数据库项目中引入了两大关键组件:一套包含了 22 种机器人类型数据的数据集,外加一系列能够跨多种任务进行技能迁移的模型 RT-1-X(这是一个源自 RT-1 的机器人变压器模型)。为了开发 Open X-Embodiment 数据集,研发人员在超过 100 万个场景中展示了 500 多种技能和 150,000 项任务,因此,该数据集也是同类中最全面的机器人数据集。

此外,研究人员还在机器人实验室和不同类型的物理装置之上对模型进行了测试,并发现与传统机器人训练方法相比,新方案确实能取得更好的成绩。

139c5730-666d-11ee-939d-92fbcf53809c.png

来自 Open X-Embodiment 数据集的样本展示了 500 多种技能和 150,000 项任务。

13b3be70-666d-11ee-939d-92fbcf53809c.png

Open X-Embodiment 数据集结合了跨实施例、数据集和技能的数据。

结合机器人数据

通常来讲,不同类型的机器人往往拥有独特的传感器和执行器,所以需要配合专门的软件模型。这就类似于不同生物体的大脑和神经系统需要专门进化,从而适应该生物的身体结构与所处环境。

但 Open X-Embodiment 的诞生却出于这样一条先验性的假设:将来自不同机器人和任务的数据结合起来,就能创建一套优于专用模型的通用模型,足以驱动所有类型的机器人。这个概念在一定程度上受到大语言模型(LLM)的启发,即在使用大型通用数据集进行训练时,模型成果的匹配度甚至可以优于在特定数据集上训练的小型针对性模型。而研究人员惊喜地发现,此项原理果然也适用于机器人领域。

为了创建 Open X-Embodiment 数据集,研究团队收集了来自不同国家 20 个机构的 22 台机器人具身的真实数据。该数据集包含超 100 万种情节(所谓情节,是指机器人每次尝试执行任务时所采取的一系列动作),其中具体涉及 500 多种技能和 15 万个任务示例。

随附的各模型均基于 Transformer,一套在大语言模型中也得以应用的深度学习架构。RT-1-X 建立在 Robotics Transformer 1(简称 RT-1)之上,是一套适用于在真实环境下实现机器人技术规模化的多任务模型。RT-2-X 则建立在 RT-1 后继者 RT-2 的基础之上——RT-2 是一种视觉语言动作(VLA)模型,能够从机器人和网络数据中学习,并具备响应自然语言命令的能力。

研究人员在五所不同研究实验室的五台常用机器人上测试了 RT-1-X 对各类任务的执行能力。与针对这些机器人开发的专用模型相比,RT-1-X 在拾取和移动物体、以及开门等任务上的成功率高出 50%。该模型还能将技能迁移至多种不同环境,这也是在特定视觉场景下训练出的专用模型所做不到的。由此可见,由不同示例集训练而成的模型在大多数任务中都优于专用模型。论文还提到,此模型适用于从机械手臂到四足动物在内的多种机器人。

加州大学伯克利分校副教授、论文联合作者 Sergey Levine 写道,“对于任何曾有机器人研究经验的朋友来说,都能意识到这是多么了不起:这类模型「从来」就没能第一次就尝试成功,但这个模型却做到了。”

13c8a75e-666d-11ee-939d-92fbcf53809c.png

值得注意的是,即使是规模较小的 RT-1-X 模型,也实现了对各实验室内部专用模型的超越!对于任何曾有机器人研究经验的朋友来说,都能意识到这是多么了不起:这类模型“从来”就没能第一次就尝试成功,但这个模型却做到了。

在应急技能和处理训练数据集中未涉及的新任务方面,RT-2-X 的成功率可达 RT-2 的 3 倍。具体来讲,RT-2-X 在需要空间认知的任务上表现出更好的性能,例如理解“将苹果放到布旁边”和“将苹果放到布上”两种要求间的区别。

研究人员在 Open X 和 RT-X 的发布博文中写道,“我们的结果表明,与其他平台的数据进行联合训练之后,RT-2-X 获得了原始数据集中并不具备的额外技能,使其能够执行前所未见的新任务。”

步步迈向机器人研究的新未来

展望未来,科学家们正在考虑将这些进展与 DeepMind 开发的自我改进模型 RoboCat 的见解相结合,希望探索出新的研究方向。RoboCat 能够学会在不同机械臂上执行各种任务,然后自动设计出新的训练数据以提高自身性能。

Sanketi 认为,另一个潜在的研究方向,也可能是进一步研究不同数据集间的混合会如何影响跨机器人具身的能力泛化与改进效果。

该团队目前已经开源了 Open X-Embodiment 数据集和小型 RT-1-X 模型,但并未公开 RT-2-X 模型。

Sanketi 总结道,“我们相信,这些工具将改变机器人的训练方式,并加速该领域的研究进展。我们希望开源相关数据,并提供安全但受限的模型以减少障碍、加速研究。机器人技术的未来离不开机器人之间的相互学习,而这一切的前提,首先要求研究人员之间能够相互学习。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31432

    浏览量

    223603
  • AI
    AI
    +关注

    关注

    91

    文章

    41059

    浏览量

    302563
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    12431

原文标题:DeepMind 全新 AI 项目曝光:可控制各类机器人,数据集有望开源

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    杰和科技亮相机器人大会,边缘AI驱动机器人场景落地

    、多传感器数据融合、工业级标准的全面支持等行业前沿需求热点,带来覆盖全场景机器人的嵌入式控制器解决方案,精准对接机器人产业链上下游需求,展示杰和在
    的头像 发表于 04-22 16:39 289次阅读
    杰和科技亮相<b class='flag-5'>机器人</b>大会,边缘<b class='flag-5'>AI</b>驱动<b class='flag-5'>机器人</b>场景落地

    你好,我是StackChan,超可爱的社区共创开源AI桌面机器人

    StackChan登场MeetStackChanStackChan是一款开源AI桌面机器人。它可以陪你玩,陪你聊,还支持开源共创与DIY扩展,配合App与
    的头像 发表于 12-26 17:28 3235次阅读
    你好,我是StackChan,超可爱的社区共创<b class='flag-5'>开源</b><b class='flag-5'>AI</b>桌面<b class='flag-5'>机器人</b>!

    探索RISC-V在机器人领域的潜力

    应用,特别是机器人操作系统领域的可行性。MUSE Pi Pro以其强大的K1 AI CPU和官方对主流开源软件栈的积极适配,成为了一个非常有吸引力的选择。 二、 硬件初窥:性能小钢炮 MUSE Pi Pro
    发表于 12-03 14:40

    高精度机器人控制的核心——基于 MYD-LT536 开发板的精密运动控制方案

    ISP多媒体接口,适合构建机器人视觉-运动融合系统,实现工件识别与动态定位。 3. 支持闭环控制与误差校正 可结合高分辨率编码器反馈数据,运行机器人闭环
    发表于 11-14 15:48

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展
    的头像 发表于 11-06 11:49 1268次阅读

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    、远程作业机器人、特种检测机器人· 多摄像头输入:通过多路摄像头无死角监控作业现场,实现精准操作与安全监控。· 多屏显示:将不同视角的画面、传感器数据控制界面分别显示,帮助操作员远程
    发表于 10-29 16:41

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

    科研人员及开发者打造功能更强大、适应性更强的机器人。   全新的 NVIDIA Isaac GR00T 开源基础模型将为机器人赋予接近人类的推理能力,使其能够拆解复杂指令,并借助已有知
    的头像 发表于 09-30 09:52 3204次阅读
    NVIDIA 利用<b class='flag-5'>全新开源</b>模型与仿真库加速<b class='flag-5'>机器人</b>研发进程

    机器人竞技幕后:磁传感器芯片激活 “精准感知力”

    2025 世界人形机器人运动会于 8 月 17 日圆满收官,赛场上机器人在跑步、跳跃、抓取等项目中的精彩表现,背后是运动控制、环境感知等技术的迭代升级。而在这些技术中,磁传感器芯片凭借
    发表于 08-26 10:02

    开源鸿蒙驱动机器人AI产业生态发展,M-Robots OS正式开源

    M-RobotsOS项目发布仪式等重要环节,汇聚全球开发者智慧,全力打造机器人领域的新生态,促进产业链上下游企业的协同创新发展。开放原子开源基金会理事长程晓明程晓明
    的头像 发表于 07-26 14:20 1369次阅读
    <b class='flag-5'>开源</b>鸿蒙驱动<b class='flag-5'>机器人</b>与<b class='flag-5'>AI</b>产业生态发展,M-Robots OS正式<b class='flag-5'>开源</b>

    全国首个开源鸿蒙机器人操作系统 M-Robots OS 正式开源

    机器人操作系统M-RobotsOS,推动机器人行业生态融合、能力复用、智能协同。构建机器人共通语言解决产业协同难题机器人行业正面临两大关键挑战:一方面,传统通用操
    的头像 发表于 07-24 10:56 1198次阅读
    全国首个<b class='flag-5'>开源</b>鸿蒙<b class='flag-5'>机器人</b>操作系统 M-Robots OS 正式<b class='flag-5'>开源</b>

    盘点#机器人开发平台

    Athena机器人****开发平台思岚推出Athena机器人开发平台,有望主导机器人开发平台未来市场-电子发烧友网AUTO CUBEROS机器人
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速开发
    发表于 04-30 01:05

    自制一个支持AI 控制的无刷平衡车机器人开源项目D-BOT全攻略

    今天给大家介绍一款创意桌面机器人——D-BOT!它不仅是一个功能强大的平衡车机器人,也是一个融合了AI控制、3D建模与PCB设计的开源
    发表于 04-28 11:45

    【「# ROS 2智能机器人开发实践」阅读体验】+内容初识

    、Gazebo仿真(含RGBD相机/激光雷达仿真)、实物机器人运动控制,实现\"仿真→实物\"的无缝衔接 高阶应用篇(7-9章) 聚焦视觉SLAM、自主导航等前沿场景,提供完整项目链路(如
    发表于 04-27 11:24

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    末端执行器。 全栈开源 从RISC-V指令、芯片SDK到机器人控制代码100%开放,开发者可自由定制算法与控制逻辑。 官方apt仓库提供d
    发表于 04-25 17:59