0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

加强模拟的更大价值 —— 给真实机器人一双灵巧的“手”

NVIDIA英伟达企业解决方案 来源:未知 2022-12-09 01:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人类的手是数百万年进化过程中最了不起的成果之一。我们能够拿起各种物体并将它们作为工具使用,这是我们与其他动物的最大区别之一,这也使我们能够改变周围的世界。

要想让机器人在人类的日常生活中工作,机器人必须能够与我们的工具和周围的环境进行灵巧的互动。如果没有这种能力,它们就只能继续留在工厂、仓库等专门的领域发挥作用。

虽然有腿的机器人只需要一段时间就可以学会如何行走,但实践证明有手的机器人控制起来的难度要大得多。带有手指的机器人手有更多的关节,它们的运动必须经过特定的协调后才能完成指定的任务。传统的机器人控制方法需要预先对抓取和运动进行精确的编程,因此无法实现人类认为理所当然的那种“普通”精细运动控制技能。

解决这些问题的方法之一是采用深度强化学习(RL)技术训练一个控制机器人关节的神经网络。通过深度强化学习,机器人能够从试验和错误中学习,并在成功完成指定任务后得到奖励。然而学习这种技术可能需要数百万甚至数十亿样本,因此它几乎不可能直接应用于现实中的机器人。

7c0270ca-7717-11ed-8abf-dac502259ad0.gif

DeXtreme 将模拟环境中的灵巧操作转移到现实世界

模拟的应用

NVIDIA 的 Isaac 机器人模拟器能够创造一个用于训练机器人的模拟空间,这个空间的运行速度比现实世界快 1 万多倍,但是遵守物理法则。

从事 DeXtreme 项目的 NVIDIA 研究者们,利用 RL 机器人训练模拟器 Isaac Gym 教机器人手如何将一个立方体摆放到指定的目标位置和方向或姿态。神经网络大脑可以在模拟中学会这一操作之后,再被移植到现实世界中控制机器人。

之前,只有 OpenAI 的研究者们展示过一次类似的工作。不过,他们的工作需要一个更复杂、更昂贵的机器人手,一个带有精确运动控制传感器的立方体,而且需要使用由数百台计算机组成的超级计算集群进行训练。

灵巧性训练的大众化

为了使世界各地的研究者都能够复制我们的实验,DeXtreme 项目选择了尽可能简单、便宜的硬件。机器人本身是一台 Allegro Hand,其成本只有其他一些机器人的 1/10,它有四根手指并且没有可以移动的手腕。我们使用现成的 RGB 摄像头作为追踪立方体的“眼睛”,这样就可以在不使用特殊硬件的情况下根据需要轻松移动立方体。立方体是 3D 打印的,每个面都有贴纸。

7ca8a95e-7717-11ed-8abf-dac502259ad0.png

一个简单、可负担的现成系统是实现可复制性的关键。DeXtreme 使用的是三个 RGB 摄像头、一个 3D 打印的立方体和一个高性价比的机器人手,所以大家也应该可以轻松尝试。

DeXtreme 使用 Isaac Gym 进行训练,该模拟器可提供一个用于强化学习的端到端 GPU 加速模拟环境。NVIDIA PhysX 在 GPU 上模拟出场景。在深度学习控制策略网络的训练过程中,结果会保留在 GPU 内存中。因此,这项训练可以在一台 Omniverse OVX 服务器上进行。在这个系统上训练一个好的策略大约需要 32 小时,相当于一个机器人在现实世界中 42 年的经验。

由于不需要单独的 CPU 集群进行模拟,因此在目前的云租赁价格下,训练所产生的计算成本降低了 10-200 倍。使用 Isaac Gym 训练模型大大减少了训练的时间和成本。

感知和合成数据

为了让机器人知道它所持的立方体的位置和方向,需要为机器人加上一个感知系统。为了控制成本并为将来操控其他物体留出余地,DeXtreme使用了三个现成的摄像头和一个可以解释立方体姿态的神经网络。

该网络通过使用 Omniverse Replicator 生成的约 500 万帧合成数据训练而成,没有使用任何真实的图像。它学习了如何在具有挑战性的真实环境中执行任务。为了使训练更加有效,我们使用了一种叫做域随机化的技术来改变照明和摄像机的位置,同时使用数据增强技术添加随机裁剪、旋转和背景。

7cd80b5e-7717-11ed-8abf-dac502259ad0.gif

DeXtreme NVIDIA Omniverse Replicator 合成数据通过随机改变背景、照明和摄像机角度来训练一个强大的感知网络

DeXtreme 姿态估计系统非常可靠,即便是在目标物体被部分遮挡或者图像有明显运动模糊的情况下也能准确感知到姿态。

7d0a5424-7717-11ed-8abf-dac502259ad0.gif

DeXtreme 姿态估计器的计算机视觉模型在立方体的一部分被人手遮挡时的输出结果

现实世界中的机器人训练依然困难重重

使用模拟的主要原因之一是直接在现实世界中训练机器人会产生各种难题。例如机器人硬件在过度使用后容易损坏、实验的迭代周期和周转时间可能很长等。

7f1e0918-7717-11ed-8abf-dac502259ad0.gif

除了模拟之外,机器人还必须解决所有现实中的机械和物理学问题

我们在实验中经常发现在长期使用后需要对机械手进行修理,例如拧紧松动的螺丝、更换带状电缆、在进行 10-15 次试验后需要让机械手休息并等待它冷却等。在模拟中,我们是在一个不会损坏的机器人上进行训练,所以能够避开许多这样的问题,同时还能获得学习高难度任务所需的大量数据。而且模拟的运行速度比实时训练快得多,所以迭代周期大幅缩短。

在模拟环境中训练的最大问题是需要缩小模拟和现实世界之间的差距。为了解决这个问题,DeXtreme 对模拟器中设置的物理属性使用了域随机化,可一次在超过十万个模拟环境中大规模地改变物体的质量、摩擦水平和其他属性。

随机化所带来的好处之一是让我们可以使用各种不常见的场景组合来训练人工智能,这能保证机器人在现实世界执行任务时的稳健性。例如,我们在现实机器人上的大部分实验都是在由于电路板上的连接松动而导致拇指轻微失灵的情况下进行的。尽管如此,我们还是对这些策略能够从模拟可靠地转移到现实世界而感到惊讶。

7fa01110-7717-11ed-8abf-dac502259ad0.gif

经过超过 32 小时的强化学习,DeXtreme 机器人能够在根据指定目标旋转立方体的任务中反复取得成功

从模拟到现实

未来机器人操作领域的突破将催生出新一批不仅限于传统工业用途的机器人应用。DeXtreme 项目所传达的核心信息是:模拟可以成为训练复杂机器人系统的一个非常有效的工具,包括需要不断接触环境中的物体的机器人系统。我们使用成本相对较低的硬件来证明这一点是为了鼓励大家使用我们的模拟工具并在此基础上继续努力。

关于 DeXtreme 项目的更多细节,请查看论文并访问项目网页:https://dextreme.org/


原文标题:加强模拟的更大价值 —— 给真实机器人一双灵巧的“手”

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97669

原文标题:加强模拟的更大价值 —— 给真实机器人一双灵巧的“手”

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人形机器人灵巧手”,正在接近27个自由度的人手

    电子发烧友网报道(文/黄晶晶)灵巧手是人形机器人核心零部件之,以人类的来看通常被认为具有27个自由度,自由度越高,其动作越精细。特斯拉二代Optimus的
    的头像 发表于 04-21 09:04 4204次阅读
    人形<b class='flag-5'>机器人</b>“<b class='flag-5'>灵巧</b>手”,正在接近27个自由度的人手

    人形机器人市场火爆!雷赛智能重磅推出“20自由度”灵巧手方案

    63.39亿元;到2035年中国机器人市场规模将突破3000亿元,复合增长率高达62.6%。 灵巧手是人形机器人中成本最高的核心部件之,比如特斯拉 Optimus 的 22 自由度
    的头像 发表于 11-17 07:48 1w次阅读
    人形<b class='flag-5'>机器人</b>市场火爆!雷赛智能重磅推出“20自由度”<b class='flag-5'>灵巧</b>手方案

    时识科技类脑视触觉方案破解机器人灵巧操作难题

    当前,机器人要实现如人类般灵巧的操作,其触觉感知系统正面临三大核心瓶颈:功耗高导致续航受限,数据量大引发延迟响应,以及系统复杂制约集成部署。这些因素共同限制了机器人在精细操作、人机安全交互等场景下的应用深度与广度。
    的头像 发表于 11-08 15:39 1829次阅读
    时识科技类脑视触觉方案破解<b class='flag-5'>机器人</b><b class='flag-5'>灵巧</b>操作难题

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    更多"、"互动更流畅"是开发者面临的核心挑战。传统的单屏幕和有限的视觉输入已成为提升机器人智能化水平的瓶颈。而瑞芯微RK3576高性能处理器的出现
    发表于 10-29 16:41

    年均增长64.6%,机器人灵巧手赛道高燃爆发

    64.6%。这预测充分反映出灵巧手作为人形机器人核心部件的高增长潜力。   近年来,机器人多指灵巧手在结构设计、驱动方式、感知能力等领域
    的头像 发表于 08-29 09:15 6455次阅读
    年均增长64.6%,<b class='flag-5'>机器人</b><b class='flag-5'>灵巧</b>手赛道高燃爆发

    机器人电子皮肤,五大技术方向

    电子发烧友网报道(文/梁浩斌)灵巧手作为人形机器人价值量最高的部件之,也是人形机器人实现精细化工作的关键部件。
    的头像 发表于 08-27 08:26 8633次阅读

    我国发布全球首款轻量化重载机器人仿生灵巧

    8月9日,2025世界机器人大会(WRC)现场,深圳赛博格机器人有限公司正式发布全球首款轻量化仿生灵巧手Cyborg-H01。这款仅重500克却能承载10公斤负载的核心部件,举打破重
    的头像 发表于 08-11 10:08 1163次阅读
    我国发布全球首款轻量化重载<b class='flag-5'>机器人</b>仿生<b class='flag-5'>灵巧</b>手

    工业机器人的特点

    机器人是关键。工业互联网是通过端上的数据传输,经过大数据分析和云计算处理,再进行智能化决策的整个过程,其中端的数据传输是基础。工业互联网的端包括机器人、传感器等切线下连接端口。因此
    发表于 07-26 11:22

    价值量占人形机器人超30%,十大国产灵巧手方案汇总

    电子发烧友网报道(文 / 吴子鹏)日前,华西证券研报指出,灵巧手是人形机器人落地的关键所在,但其后续的更新迭代仍面临较高技术难度。具备灵巧手本体设计与生产能力的厂商,有望在产业链中占据较大
    的头像 发表于 05-30 00:08 7586次阅读

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    现场直击:马拉松明星“天工机器人”、兆威机电灵巧手等受热捧

    。除了天工机器人之外,宇树人形机器人/机器狗、夏澜S01机器人,以及多家厂商的灵巧手等悉数展示。   天工
    的头像 发表于 04-27 07:59 3665次阅读
    现场直击:马拉松明星“天工<b class='flag-5'>机器人</b>”、兆威机电<b class='flag-5'>灵巧</b>手等受热捧

    LD Gen2 Lite激光雷达:赋予机器人 “感知力” 的关键

    机器人的感知世界里,激光雷达宛如一双敏锐的“慧眼”,赋予机器人“看”清周围环境、自主决策的能力。亮道智能最新推出的纯固态Flash短距激光雷达LD Gen2 Lite,凭借其独特的技术优势,在
    的头像 发表于 04-25 10:42 518次阅读

    EtherCAT科普系列(4):EtherCAT技术在人形机器人灵巧手领域应用

    人形机器人又称仿生机器人,是种模仿人类外形的机器人,除具备人形和模拟人类动作外还兼具智慧化和可交互性等特点。人形
    的头像 发表于 04-02 16:56 2709次阅读
    EtherCAT科普系列(4):EtherCAT技术在人形<b class='flag-5'>机器人</b><b class='flag-5'>灵巧</b>手领域应用

    机器人灵巧手进入规模量产时刻!4款新品亮相

    方面,除了活动能力之外,人形机器人真正能够完成通用任务的关键,是拥有一双灵活的灵巧手目前也是各大
    的头像 发表于 03-28 00:07 4133次阅读
     <b class='flag-5'>机器人</b><b class='flag-5'>灵巧</b>手进入规模量产时刻!4款新品亮相

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    提供了对机器人环境和动作的统和详细的理解。只有在这些过程之后,数据才能有效地用于训练 EAI 系统。 目前,应用 Sim2Real 技术的主要障碍是“现实差距”,即模拟环境与现实世界之间的差异,包括物理
    发表于 12-24 00:33