0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepMind全新AI项目曝光:可控制各类机器人,数据集有望开源

jf_WZTOguxH 来源:AI前线 2023-10-09 15:41 次阅读

DeepMind 的新项目是什么?

开发机器人技术的一大挑战,就在于必须投入大量精力来为每台机器人、每项任务和每种环境训练机器学习模型。近日,谷歌 DeepMind 团队及其他 33 个研究机构正共同发起新项目,旨在创建一套通用 AI 系统来应对这个挑战。据称该系统能够与不同类型的物理机器人协同运作,成功执行多种任务。

谷歌机器人部门高级软件工程师 Pannag Sanketi 在采访中表示,“我们观察到,机器人在专项领域表现极佳,但在通用领域却缺乏灵性。一般来讲,大家需要为每项任务、每台机器人和每种环境分别训练一套模型,从零开始调整每一个变量。”

为了克服这个问题,让机器人的训练和部署变得更加轻松、快捷,谷歌 DeepMind 在名为 Open X-Embodiment 的大型共享数据库项目中引入了两大关键组件:一套包含了 22 种机器人类型数据的数据集,外加一系列能够跨多种任务进行技能迁移的模型 RT-1-X(这是一个源自 RT-1 的机器人变压器模型)。为了开发 Open X-Embodiment 数据集,研发人员在超过 100 万个场景中展示了 500 多种技能和 150,000 项任务,因此,该数据集也是同类中最全面的机器人数据集。

此外,研究人员还在机器人实验室和不同类型的物理装置之上对模型进行了测试,并发现与传统机器人训练方法相比,新方案确实能取得更好的成绩。

139c5730-666d-11ee-939d-92fbcf53809c.png

来自 Open X-Embodiment 数据集的样本展示了 500 多种技能和 150,000 项任务。

13b3be70-666d-11ee-939d-92fbcf53809c.png

Open X-Embodiment 数据集结合了跨实施例、数据集和技能的数据。

结合机器人数据

通常来讲,不同类型的机器人往往拥有独特的传感器和执行器,所以需要配合专门的软件模型。这就类似于不同生物体的大脑和神经系统需要专门进化,从而适应该生物的身体结构与所处环境。

但 Open X-Embodiment 的诞生却出于这样一条先验性的假设:将来自不同机器人和任务的数据结合起来,就能创建一套优于专用模型的通用模型,足以驱动所有类型的机器人。这个概念在一定程度上受到大语言模型(LLM)的启发,即在使用大型通用数据集进行训练时,模型成果的匹配度甚至可以优于在特定数据集上训练的小型针对性模型。而研究人员惊喜地发现,此项原理果然也适用于机器人领域。

为了创建 Open X-Embodiment 数据集,研究团队收集了来自不同国家 20 个机构的 22 台机器人具身的真实数据。该数据集包含超 100 万种情节(所谓情节,是指机器人每次尝试执行任务时所采取的一系列动作),其中具体涉及 500 多种技能和 15 万个任务示例。

随附的各模型均基于 Transformer,一套在大语言模型中也得以应用的深度学习架构。RT-1-X 建立在 Robotics Transformer 1(简称 RT-1)之上,是一套适用于在真实环境下实现机器人技术规模化的多任务模型。RT-2-X 则建立在 RT-1 后继者 RT-2 的基础之上——RT-2 是一种视觉语言动作(VLA)模型,能够从机器人和网络数据中学习,并具备响应自然语言命令的能力。

研究人员在五所不同研究实验室的五台常用机器人上测试了 RT-1-X 对各类任务的执行能力。与针对这些机器人开发的专用模型相比,RT-1-X 在拾取和移动物体、以及开门等任务上的成功率高出 50%。该模型还能将技能迁移至多种不同环境,这也是在特定视觉场景下训练出的专用模型所做不到的。由此可见,由不同示例集训练而成的模型在大多数任务中都优于专用模型。论文还提到,此模型适用于从机械手臂到四足动物在内的多种机器人。

加州大学伯克利分校副教授、论文联合作者 Sergey Levine 写道,“对于任何曾有机器人研究经验的朋友来说,都能意识到这是多么了不起:这类模型「从来」就没能第一次就尝试成功,但这个模型却做到了。”

13c8a75e-666d-11ee-939d-92fbcf53809c.png

值得注意的是,即使是规模较小的 RT-1-X 模型,也实现了对各实验室内部专用模型的超越!对于任何曾有机器人研究经验的朋友来说,都能意识到这是多么了不起:这类模型“从来”就没能第一次就尝试成功,但这个模型却做到了。

在应急技能和处理训练数据集中未涉及的新任务方面,RT-2-X 的成功率可达 RT-2 的 3 倍。具体来讲,RT-2-X 在需要空间认知的任务上表现出更好的性能,例如理解“将苹果放到布旁边”和“将苹果放到布上”两种要求间的区别。

研究人员在 Open X 和 RT-X 的发布博文中写道,“我们的结果表明,与其他平台的数据进行联合训练之后,RT-2-X 获得了原始数据集中并不具备的额外技能,使其能够执行前所未见的新任务。”

步步迈向机器人研究的新未来

展望未来,科学家们正在考虑将这些进展与 DeepMind 开发的自我改进模型 RoboCat 的见解相结合,希望探索出新的研究方向。RoboCat 能够学会在不同机械臂上执行各种任务,然后自动设计出新的训练数据以提高自身性能。

Sanketi 认为,另一个潜在的研究方向,也可能是进一步研究不同数据集间的混合会如何影响跨机器人具身的能力泛化与改进效果。

该团队目前已经开源了 Open X-Embodiment 数据集和小型 RT-1-X 模型,但并未公开 RT-2-X 模型。

Sanketi 总结道,“我们相信,这些工具将改变机器人的训练方式,并加速该领域的研究进展。我们希望开源相关数据,并提供安全但受限的模型以减少障碍、加速研究。机器人技术的未来离不开机器人之间的相互学习,而这一切的前提,首先要求研究人员之间能够相互学习。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    206

    文章

    27052

    浏览量

    201437
  • AI
    AI
    +关注

    关注

    87

    文章

    26472

    浏览量

    264106
  • 数据集
    +关注

    关注

    4

    文章

    1179

    浏览量

    24356
  • DeepMind
    +关注

    关注

    0

    文章

    126

    浏览量

    10713

原文标题:DeepMind 全新 AI 项目曝光:可控制各类机器人,数据集有望开源

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开源作品】基于树莓派4B、ESP32制作的桌面机器人、气象站、立方光!

    ;gt;>点此查看全文 基于树莓派 4B DIY 能笑会动的桌面机器人 Emo是一款基于树莓派4做的个人伴侣机器人时尚与创新于一身。它不仅仅是一款机器人,更是一个活生生的存在
    发表于 03-05 16:52

    开源项目】Emo:基于树莓派 4B DIY 能笑会动的桌面机器人

    Emo是一款基于树莓派4做的个人伴侣机器人时尚与创新于一身。它不仅仅是一款机器人,更是一个活生生的存在,与其他机器人不同,它拥有独特的个性和情感。 硬件部分 树莓派 4B
    发表于 12-26 15:18

    开源项目!教你如何复刻自平衡赛车机器人、智能家居中控、竞技机器人先进模糊控制器等

    开源项目作品 为了方便大家更好提升自己,电子发烧友小编为大家整理了一些工程师大佬设计的开源项目作品,供大家可以参考学习,希望对广大工程师有所帮助。 1.用全志R128复刻自平衡赛车
    发表于 12-26 09:17

    LabVIEW的六轴工业机器人运动控制系统

    环境中,对机器人进行了正逆运动学仿真测试。接着,对单轴和多轴伺服系统进行了控制测试,最终实现了机器人的轨迹规划实体控制。 在整个项目中,La
    发表于 12-21 20:03

    高动态人形机器人“夸父”通过OpenHarmony 3.2 Release版本兼容性测评

    、雷达传感器等设备的数据,夸父人形机器人能够更加灵活和高效地完成各种任务。同时,通过KaihongOS的链接,夸父人形机器人构建全场景生态,实现在科研教育、特种行业、工业应用、家庭场景、智慧康养等
    发表于 12-20 09:31

    开源作品!稚晖君超迷你低成本开发板、超酷机器人、智能手环等参考方案

    单片机用于处理蓝牙模块接收到的数据,对电机驱动电路发送信号控制电机,超声波模块用于测量距离,TFT显示屏用于显示机器人当前电量。 由于内容较多,先展示一下效果图给大家看看,点击下面查看原文即可查看全文
    发表于 12-12 10:28

    ROS让机器人开发更便捷,基于RK3568J+Debian系统发布!

    ROS系统是什么 ROS(Robot Operating System)是一个适用于机器人开源的元操作系统。它提供了操作系统应有的服务,包括硬件抽象,底层设备控制,常用函数的实现,进程间消息传递
    发表于 11-30 16:01

    教你做个PID控制巡线机器人

    在本项目中,我们将学习如何使用带PID控制器的线跟随机器人使用Arduino Nano来解决迷宫。
    发表于 09-25 06:54

    开源资料】使用ESP32C3超简单制作迷你四足机器人

    用esp8266做过小四足机器人,这次用esp32C3重制了,主要的原因是C3有蓝牙可以用蓝牙遥控非常方便边,随时连接随时玩不占用手机WiFi。 而且esp32C3虽然管脚不多,但在8路舵机的控制
    发表于 09-21 11:15

    ai人工智能机器人

    的运营成本、人力成本还在不断提高(如:办公场地的租金、员工的工资、社保公积金、节假日福利等)。 如今的智能电话机器人,每天的电话拨打量可达800-1000通,相比人工提高了3-5倍,大大缩短了名单的筛选
    发表于 09-21 11:09

    ai智能机器人

    机器人AI
    jf_86111705
    发布于 :2023年08月21日 15:59:56

    ai语音机器人

    机器人AI
    jf_86111705
    发布于 :2023年08月18日 15:05:25

    手势控制机器人开源项目

    电子发烧友网站提供《手势控制机器人开源项目.zip》资料免费下载
    发表于 07-12 11:18 0次下载
    手势<b class='flag-5'>控制</b><b class='flag-5'>机器人</b><b class='flag-5'>开源</b><b class='flag-5'>项目</b>

    WiFi控制机器人开源项目

    电子发烧友网站提供《WiFi控制机器人开源项目.zip》资料免费下载
    发表于 06-15 14:31 0次下载
    WiFi<b class='flag-5'>控制</b><b class='flag-5'>机器人</b><b class='flag-5'>开源</b><b class='flag-5'>项目</b>

    浅谈儿童陪护机器人

    儿童陪护机器人越来越受到人们的关注,其中转动控制是其重要组成部分之一。步进电机芯片作为一种常用的控制芯片,被广泛应用于儿童陪护机器人中的转动控制
    发表于 05-11 15:12