0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用NVIDIA Cosmos开放世界基础模型加速物理AI开发

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-12-01 09:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVIDIA Omniverse 库和 Cosmos,开发者可以大规模生成基于物理学的合成数据。

Cosmos Predict 2.5现在将 Text2World、Image2World 和 Video2World 三个独立的模型统一为一个轻量级架构,能够从单个图像、视频或提示生成一致且可控的多机位视频世界。

Cosmos Transfer 2.5能够实现高保真、空间可控的世界间风格转换,以增加数据多样性。开发者可以在多机位的仿真环境中添加新的天气、光照和地形条件。Cosmos Transfer 2.5 的体积缩小到上一代的 1/3.5,性能更快的同时,在提示对齐和物理精度方面都有所提升。

这些 WFM 可以集成到在 NVIDIA Isaac Sim 开源机器人仿真框架中运行的合成数据流程中,该框架基于 NVIDIA Omniverse 平台构建,以生成逼真的视频,缩小仿真与现实之间的差距。开发者可以参考由四部分构成的合成数据生成流程:

NVIDIA Omniverse NuRec 神经重建库,可通过智能手机拍摄的图像,在 OpenUSD 环境中重建真实世界的数字孪生。

SimReady 资产,用于为数字孪生填充物理精确的 3D 模型。

Isaac Sim 中的 MobilityGen 工作流,用于生成合成数据。

NVIDIA Cosmos,用于扩充生成数据。

从仿真到现实世界,了解企业与开发者如何使用合成数据:Skild AI,Serve Robotics,Zipline,光轮智能,FS Studio,Robots for Humanity 等领先的机器人和 AI 公司及开发者已经在使用这些技术来加速物理 AI 开发。

文是洞悉Omniverse系列文章。“洞悉 Omniverse”重点介绍开发者、3D 从业者与企业如何使用OpenUSD和NVIDIA Omniverse的最新进展深入改变他们的工作流。

驱动机器人、辅助驾驶车辆和其他智能机器的物理 AI模型必须具备安全性、能够适应动态场景,以及实时感知、推理和操作的能力。与可基于互联网海量数据集训练的大型语言模型不同,物理 AI 模型必须从基于现实世界中的数据中学习。

然而,要收集足够多的涵盖现实世界各种场景的数据是极其困难的,在某些情况下甚至存在危险。基于物理学的合成数据生成,为解决这一问题提供了关键途径。

NVIDIA 最近发布了NVIDIA Cosmos开放世界基础模型 (WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助NVIDIA Omniverse库和 Cosmos,开发者可以大规模生成基于物理学的合成数据。

Cosmos Predict 2.5现在将 Text2World、Image2World 和 Video2World 三个独立的模型统一为一个轻量级架构,能够从单个图像、视频或提示生成一致且可控的多机位视频世界。

Cosmos Transfer 2.5能够实现高保真、空间可控的世界间风格转换,以增加数据多样性。开发者可以在多机位的仿真环境中添加新的天气、光照和地形条件。Cosmos Transfer 2.5 的体积缩小到上一代的 1/3.5,性能更快的同时,在提示对齐和物理精度方面都有所提升。

这些 WFM 可以集成到在NVIDIA Isaac Sim开源机器人仿真框架中运行的合成数据流程中,该框架基于NVIDIA Omniverse平台构建,以生成逼真的视频,缩小仿真与现实之间的差距。开发者可以参考由四部分构成的合成数据生成流程:

NVIDIA Omniverse NuRec 神经重建库,可通过智能手机拍摄的图像,在OpenUSD环境中重建真实世界的数字孪生。

SimReady 资产,用于为数字孪生填充物理精确的 3D 模型。

Isaac Sim 中的 MobilityGen 工作流,用于生成合成数据。

NVIDIA Cosmos,用于扩充生成数据。

从仿真到现实世界

领先的机器人和 AI 公司已经在使用这些技术来加速物理 AI 开发。

Skild AI致力于打造通用机器人的大脑,他们正利用 Cosmos Transfer,通过添加新变体来扩充现有数据,以便测试和验证在NVIDIA Isaac Lab训练的机器人策略。

Skild AI 使用 Isaac Lab 创建可扩展的仿真环境,让其机器人可以在不同的形态和应用场景中训练。通过将 Isaac Lab 的机器人仿真能力和 Cosmos 的合成数据生成相结合,Skild AI 能够在各种条件下训练机器人智能体,避免了现实世界数据采集所面临的时间和成本限制。

Serve Robotics在 NVIDIA Isaac Sim 中从数千个仿真场景中生成合成数据,然后结合真实数据与合成数据,用于物理 AI 模型训练。该公司已构建起全球规模最大的公共空间自主机器人车队之一,并在城市地区完成了超过 10 万次“最后一英里”送餐。Serve 的机器人每月收集 100 万英里的数据,包含近 1700 亿张图像与激光雷达样本,这些数据被用于仿真训练以持续优化机器人模型。

除了给人送餐,Serve 最近还使用其机器人来运送算力——将全新的NVIDIA DGX Spark个人 AI 超级计算机交付给 Refik Anadol、Will.I.AM 和 Ollama。DGX Spark 提供 1 petaflop 的 AI 性能,为开发者提供了桌面级计算能力,支持从 AI 模型原型设计、模型微调到推理及机器人开发等全流程工作。

自主无人机送货公司 Zipline 也参与了 DGX Spark 的交付,首席硬件官 Jo Mardall 在加利福尼亚州半月湾的公司总部和测试场地通过无人机接收了 DGX Spark。Zipline 使用NVIDIA Jetson边缘 AI 和机器人平台为其无人机配送系统提供支持。

了解开发者如何使用合成数据

光轮智能作为一家仿真优先的机器人解决方案提供商,正利用 SimReady 资产和大规模合成数据集帮助公司弥合仿真到现实的差距。凭借基于 OpenUSD 构建的高质量合成数据和仿真环境,光轮智能的解决方案有助于确保在仿真中训练的机器人能够在从工厂车间到家庭场景的真实环境中高效运作。

数据科学家、Omniverse 社区成员Santiago Villa正运用合成数据结合Omniverse 库与 Blender 软件,通过识别阻碍作业的大型岩块来优化采矿作业。

未被检测到的岩石进入破碎机可能会导致每次事故延误七分钟或更久,每年给矿山造成高达 65 万美元的生产损失。利用 Omniverse 在不同光照和天气条件下生成数千张自动标注的合成图像能够显著降低培训成本,同时使矿业公司能够改进岩石检测系统,避免设备停机。

FS Studio与一家全球物流领导者合作,利用Omniverse 库 (如 Replicator)创建了数千种在不同光照条件下的逼真包裹变体,以改善 AI 驱动的包裹检测。合成数据集显著提高了目标检测精度,减少了误报,为客户物流网络中的吞吐速度和系统性能带来了可衡量的提升。

Robots for Humanity 为一家石油和天然气客户在 Isaac Sim 中使用 Omniverse 库构建了完整的仿真环境,生成合成数据,包括深度、分割和 RGB 图像,同时通过遥操作从 Unitree G1 机器人收集关节和运动数据。

Omniverse 大使Scott Dempsey正在开发一个合成数据生成合成器,根据现实世界制造商的规格构建各种电缆,使用 Isaac Sim 生成经过 Cosmos Transfer 增强的合成数据,为检测和处理电缆的应用创建逼真的训练数据集。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5732

    浏览量

    110361
  • AI
    AI
    +关注

    关注

    91

    文章

    42233

    浏览量

    303251
  • 模型
    +关注

    关注

    1

    文章

    3882

    浏览量

    52374

原文标题:洞悉 Omniverse:开放世界基础模型为物理 AI 开发生成合成世界

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA携手微软加速机器人和物理AI的发展

    在 GTC 大会上,微软宣布了其代理式和物理 AI 系统统一平台的更新,加速从实验到生产落地的进程。将 Microsoft Foundry 与 NVIDIA
    的头像 发表于 03-23 15:21 1121次阅读

    NVIDIA 携手全球机器人领导者,将物理 AI 带入现实世界

    基于 NVIDIA 技术,大规模开发并部署物理 AINVIDIA 发布全新 NVIDIA
    的头像 发表于 03-17 11:22 843次阅读
    <b class='flag-5'>NVIDIA</b> 携手全球机器人领导者,将<b class='flag-5'>物理</b> <b class='flag-5'>AI</b> 带入现实<b class='flag-5'>世界</b>

    NVIDIA 发布开放物理 AI 数据工厂 Blueprint,加速机器人、视觉 AI 智能体和智能汽车开发

    Systems、Skild AI、Uber 和 Teradyne Robotics 等领先的物理 AI 开发商,正基于该蓝图加速机器人、视
    的头像 发表于 03-17 11:03 472次阅读
    <b class='flag-5'>NVIDIA</b> 发布<b class='flag-5'>开放</b><b class='flag-5'>物理</b> <b class='flag-5'>AI</b> 数据工厂 Blueprint,<b class='flag-5'>加速</b>机器人、视觉 <b class='flag-5'>AI</b> 智能体和智能汽车<b class='flag-5'>开发</b>

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    。 ●NVIDIA Isaac GR00T N1.7、NVIDIA Alpamayo 1.5 和 NVIDIA Cosmos 3 模型突破了
    的头像 发表于 03-17 09:18 649次阅读
    <b class='flag-5'>NVIDIA</b> 扩展<b class='flag-5'>开放</b><b class='flag-5'>模型</b>系列,推动代理式、<b class='flag-5'>物理</b>和医疗 <b class='flag-5'>AI</b> 下一阶段发展

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行
    的头像 发表于 03-16 16:27 812次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    NVIDIA技术助力光轮智能加速物理AI落地

    机器人正加速走向真实世界。从实验室到工业现场,从结构化环境到开放空间,物理 AI 对数据规模、物理
    的头像 发表于 12-13 10:03 2497次阅读

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA) NVIDIA DRI
    的头像 发表于 12-13 09:50 1686次阅读

    NVIDIA 利用全新开源模型与仿真库加速机器人研发进程

    。   借助全新的 NVIDIA Cosmos 世界基础模型开发者可以生成多样化数据,从而大规模加速
    的头像 发表于 09-30 09:52 3288次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>利用</b>全新开源<b class='flag-5'>模型</b>与仿真库<b class='flag-5'>加速</b>机器人研发进程

    什么是AI模型的推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该
    的头像 发表于 09-23 15:19 1651次阅读

    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型AI计算基础设施,为机器人领域开启新篇章

    NVIDIA DGX Cloud 让开发者能够在任何地方运行需求严苛的仿真 · 物理 AI 领先者 Amazon Devices Services 正在使用它们来支持新的制造解决方
    的头像 发表于 08-12 11:29 2120次阅读
    <b class='flag-5'>NVIDIA</b>通过全新 Omniverse库、<b class='flag-5'>Cosmos</b><b class='flag-5'>物理</b><b class='flag-5'>AI</b><b class='flag-5'>模型</b>及<b class='flag-5'>AI</b>计算基础设施,为机器人领域开启新篇章

    利用NVIDIA Cosmos模型训练通用机器人

    机器人领域的一大核心挑战在于如何让机器人掌握新任务,而无需针对每个新任务和环境耗费大量精力收集和标注数据集。NVIDIA 的最新研究方案通过生成式 AI世界基础模型(如
    的头像 发表于 08-05 16:22 2372次阅读
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> <b class='flag-5'>Cosmos</b><b class='flag-5'>模型</b>训练通用机器人

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临一个关键挑战:机器人需要大量的训练数据来掌握诸如组装和检查之类的技能,而手动演示的方式难以
    的头像 发表于 07-14 11:49 1442次阅读
    通过<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Cosmos</b><b class='flag-5'>模型</b>增强机器人学习

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——
    的头像 发表于 07-09 10:17 1107次阅读

    NVIDIA GTC巴黎亮点:全新Cosmos Predict-2世界基础模型与CARLA集成加速智能汽车训练

    。这种向使用大模型的过渡大大增加了对用于训练、测试和验证的高质量、基于物理学传感器数据的需求。 为加速下一代辅助驾驶架构的开发NVIDIA
    的头像 发表于 06-12 10:00 1286次阅读

    在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期发布了 Cosmos Reason-1 的 7B 和 56B 两款多模态大语言模型 (MLLM),它们经过了“物理 AI
    的头像 发表于 06-04 13:43 1320次阅读