0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助NVIDIA OSMO扩展AI机器人开发工作负载

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-04-12 11:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

自主机器开发是一个数据生成和收集、模型训练和部署的迭代过程,其特点是跨异构计算资源的复杂的多阶段、多容器工作流。

这其中涉及多个团队,每个团队都需要共享和异构计算。此外,团队希望将某些工作负载扩展到云中,这通常需要 DevOps 专业知识,还需要在本地维护其他工作负载。

到目前为止,还没有一个统一的平台可供开发者轻松提交所需计算的工作负载。

在最近的 GTC 大会上,NVIDIA 发布了OSMO,这是一个云原生工作流编排平台,它提供一个单一界面,用于跨异构共享计算环境调度和管理各种自主机器工作负载。这些工作负载包括:

合成数据生成 (SDG)

DNN 训练和验证

强化学习

SIL 或 HIL 中的机器人 (再) 仿真

基于 SIM 或真实数据的感知评估

9d689706-f87d-11ee-a297-92fbcf53809c.gif

跨异构共享计算部署复杂的工作流

借助 OSMO 统一计算资源调度,您可以轻松地在 Kubernetes 集群上部署和协调多阶段工作负载。这包括共享的异构多节点计算资源,例如 aarch64 和 x86-64,可确保跨不同架构的灵活性和兼容性。

您可以轻松设置基于 YAML 的多阶段、多节点任务,并简化从 SDG 、训练到模型验证的端到端开发流程。OSMO 还可以集成到现有的 CI/CD 工作流中,动态调度夜间回归测试、基准测试和模型验证等任务。

该服务还利用 OIDC 等开放标准进行身份验证,并支持通过一键式密钥轮换实现凭据和数据集安全性的最佳实践。在合规性方面,团队可以通过开发中的版本管理和追踪用于模型训练的所有数据。这一功能对于可重复性来说也非常有价值。

协调本地部署和云 SDG 工作负载

合成数据生成尤其受益于分布式环境,因为它通常从本地开始生成较小批量的数据,但当需要生成大量数据时,则需要利用云来进行规模的扩展。OSMO 使用弹性资源调配,在降低 SDG 等离线批量流程的成本方面发挥着关键作用,从而实现高效且经济的大规模数据生成。

高效运行 SIL 和 HIL 测试

OSMO 支持的另一个重要工作负载是软件在环 (SIL) 机器人测试,涉及仿真多传感器和多机器人场景,或是一系列测试场景。这些场景最适合易于访问计算资源的云环境。OSMO 能够跨分布式环境调度和管理工作负载,确保利用云资源的可扩展性和可访问性,从而高效地执行 SIL 测试。

另一方面,由于特定机器人或机器硬件的可用性,硬件在环 (HIL) 测试需要本地部署。

异构计算对于 HIL 测试来说是必需的,因为仿真和调试等工作负载需要 x86,并且需要在 aarch64 上运行针对测试的软件,以提供其他方式无法提供的准确性能和硬件功能。直接在目标硬件上运行 HIL 还可以减少对昂贵的仿真器的需求。

同时生成和训练基础模型

OSMO 支持GR00T这种基础模型,该模型需要在 NVIDIA DGX 上进行模型训练,同时在 OVX 上进行实时强化学习。该工作负载包括在一个循环中以迭代方式生成和训练模型。

OSMO 可以跨分布式环境管理和调度工作负载,从而实现 DGX 和 OVX 系统的无缝协调,从而实现高效的迭代模型开发。

9d7a4be0-f87d-11ee-a297-92fbcf53809c.jpg

图 1. NVIDIA OSMO 用于 GR00T 基础模型

跟踪数据沿袭

数据沿袭和管理对于模型审计和确保整个开发过程的可追溯性来说至关重要。借助 OSMO,您可以追溯从来源到经过训练的模型的数据沿袭,从而提供透明性和可靠性。

借助 OSMO,您还可以轻松地管理大型数据集和创建数据集,从而实现高效的数据组织和分类。这包括管理真实数据集、合成数据集或混合数据集的能力,从而灵活地控制用于模型训练和评估的数据集。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2577

    文章

    55510

    浏览量

    793965
  • 机器人
    +关注

    关注

    213

    文章

    31449

    浏览量

    223674
  • NVIDIA
    +关注

    关注

    14

    文章

    5690

    浏览量

    110118
  • 仿真器
    +关注

    关注

    14

    文章

    1052

    浏览量

    88198

原文标题:借助 NVIDIA OSMO 扩展 AI 机器人开发工作负载

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA 携手全球机器人领导者,将物理 AI 带入现实世界

    新闻摘要: 全球物理 AI 领域的领导者——包括机器人“大脑”开发商、工业与手术机器人巨头、人形机器人先锋企业,如 ABB Robotics
    的头像 发表于 03-17 11:22 604次阅读
    <b class='flag-5'>NVIDIA</b> 携手全球<b class='flag-5'>机器人</b>领导者,将物理 <b class='flag-5'>AI</b> 带入现实世界

    基于NVIDIA模组与软件套件推动边缘与机器人AI推理

    1200 FP4 TFLOPs 的 AI 算力和 64 GB 内存,在性能、能效和可扩展性之间实现了理想平衡。凭借高能效设计和量产就绪的形态规格,T4000 让先进 AI 技术更容易被新一代智能
    的头像 发表于 01-14 09:46 790次阅读
    基于<b class='flag-5'>NVIDIA</b>模组与软件套件推动边缘与<b class='flag-5'>机器人</b><b class='flag-5'>AI</b>推理

    借助NVIDIA Isaac Sim与World Labs Marble加速机器人仿真环境构建

    一直以来,为机器人仿真构建逼真的 3D 环境是一项非常耗费人力的工作,往往需要数周的手动建模与配置。如今,借助生成式世界模型,开发者只需输入文本提示,就能在极短时间内生成一个逼真、可直
    的头像 发表于 12-24 10:28 1699次阅读

    强生医疗科技携手NVIDIA推进手术机器人开发

    借助物理 AI 和模拟技术,强生医疗科技正在推进 MONARCH 平台的开发,这是一种机器人辅助支气管镜检查领域首个投放市场的创新技术,在美国也已获准用于
    的头像 发表于 11-03 15:03 1010次阅读

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    瑞芯微RK3576 AIoT处理器处理器凭借其卓越的多屏异显与8路摄像头接入能力,为机器人领域带来革新。米尔电子MYD-LR3576开发板实测数据显示,在高负载下CPU占用仅34%,完美实现多路视觉
    发表于 10-29 16:41

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

    科研人员及开发者打造功能更强大、适应性更强的机器人。   全新的 NVIDIA Isaac GR00T 开源基础模型将为机器人赋予接近人类的推理能力,使其能够拆解复杂指令,并
    的头像 发表于 09-30 09:52 3209次阅读
    <b class='flag-5'>NVIDIA</b> 利用全新开源模型与仿真库加速<b class='flag-5'>机器人</b>研发进程

    NVIDIA三台计算机解决方案如何协同助力机器人技术

    NVIDIA DGX、基于 NVIDIA RTX PRO 服务器的 Omniverse 和 Cosmos,以及 Jetson AGX Thor,正全面加速从人形机器人机器人工厂等基于
    的头像 发表于 08-27 11:48 2609次阅读

    基于 NVIDIA Blackwell 的 Jetson Thor 现已发售,加速通用机器人时代的到来

    ·专为物理 AI机器人打造的机器人计算机 NVIDIA Jetson AGX Thor 开发者套件和量产级模组,现已发售。 ·超过 20
    发表于 08-26 09:28 1356次阅读
    基于 <b class='flag-5'>NVIDIA</b> Blackwell 的 Jetson Thor 现已发售,加速通用<b class='flag-5'>机器人</b>时代的到来

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临一个关键挑战:机器人需要大量的训练
    的头像 发表于 07-14 11:49 1277次阅读
    通过<b class='flag-5'>NVIDIA</b> Cosmos模型增强<b class='flag-5'>机器人</b>学习

    NVIDIA技术助力欧洲厂商推出机器人系统与平台

    基于 NVIDIA 安全的全栈机器人开发平台,Agile Robots、Humanoid、Neura Robotics、Universal Robots、Vorwerk 和 Wandelbots 等公司推出
    的头像 发表于 06-16 13:54 1825次阅读

    借助NVIDIA技术实现机器人装配和接触密集型操作

    本期 NVIDIA 机器人研究与开发摘要 (R²D²) 将探讨 NVIDIA 研究中心针对机器人装配任务的多种接触密集型操作
    的头像 发表于 06-04 13:51 997次阅读
    <b class='flag-5'>借助</b><b class='flag-5'>NVIDIA</b>技术实现<b class='flag-5'>机器人</b>装配和接触密集型操作

    NVIDIA 通过云端至机器人计算平台驱动人形机器人技术,赋能物理 AI

    。   包括 Agility Robotics、波士顿动力、傅利叶、Foxlink、银河通用、Mentee Robotics、NEURA Robotics、General Robotics、Skild AI 和小鹏机器人在内的多家人形
    发表于 05-19 17:53 1839次阅读
    <b class='flag-5'>NVIDIA</b> 通过云端至<b class='flag-5'>机器人</b>计算平台驱动人形<b class='flag-5'>机器人</b>技术,赋能物理 <b class='flag-5'>AI</b>

    盘点#机器人开发平台

    图,电子技术资料网站具身智能机器人****开发平台——Fibot广和通发布机器人开发平台-电子发烧友网NVIDIA Isaac 英伟达综合性
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速
    发表于 04-30 01:05

    借助NVIDIA技术提升机器人的移动和全身控制能力

    我们通过在自身平台上经过验证的先进研究来应对这些挑战。我们的方法将前沿研究与工程工作流相结合,并在我们的 AI机器人平台(包括 NVIDIA Omniverse、Cosmos、Is
    的头像 发表于 04-27 15:14 1604次阅读
    <b class='flag-5'>借助</b><b class='flag-5'>NVIDIA</b>技术提升<b class='flag-5'>机器人</b>的移动和全身控制能力