0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过Sim2SG模型生成sim-to-real转移学习场景图

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-27 09:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

场景图( scenegraphs , SGs )在计算机视觉和计算机图形学中都是一种可解释的、结构化的场景表示。场景图总结了场景中的实体以及它们之间的合理关系。 SGs 在计算机视觉、机器人、自主车辆等领域有着广泛的应用。

当前的 SG 生成技术依赖于昂贵的标记数据集的有限可用性。合成数据是解决这个问题的一个可行的选择,因为注释基本上是免费的。尽管合成数据已被用于图像分类、目标检测和语义分割等多种任务,但合成数据用于 SG 生成和视觉关系仍有待探索。由于合成数据和真实数据在外观和内容上的差异,在有标记的合成数据上训练神经网络模型,在无标记的真实数据上进行评价,这就导致了领域差距问题。

poYBAGJon0-AHI5eAABoj3cBTts544.jpg

poYBAGJon1KAMP7DAAA4XPk2shk299.jpg

图 1 场景图显示场景中的各种对象,如车辆、植被、房屋以及它们之间的关系。

Sim2SG 框架

为了克服这些挑战,我们提出了 Sim2SG ,一种可扩展的 sim-To-real 场景图生成技术。本研究的主要目的是通过在含有标记 SG 信息的模拟数据集上训练神经网络,然后将学习到的模型转换到真实数据集上,从真实世界的图像中生成场景图。

在训练过程中, Sim2SG 处理域间隙并学习生成场景图。域间隙可细分为以下间隙:

外观间隙 是两个域的外观差异,例如场景中对象的纹理、颜色、光照或反射率的差异。

内容差距 是指两个域之间的差异,包括对象数量分布的差异及其类别、位置、姿势和比例。

我们进一步分析了内容差距,并解决了其子组成部分 – 标签和预测差异。图 1 显示了 Sim2SG 为真实世界的驾驶数据集生成精确的场景图,图 2 显示了整个管道。

pYYBAGJon1OAUXLjAABejcVIreg774.jpg

图 2 Sim2SG 管道工作流。

在图 2 中, Sim2SG 管道将来自源域的带标记的合成数据和来自目标域的未标记的真实数据作为输入。使用编码器将标记的合成数据和未标记的真实数据映射到共享表示 Z 。然后,我们使用合成数据在 Z 上训练场景图预测网络 h 。我们使用基于伪统计的自学习方法来处理标签差异,生成标签对齐的合成数据以供训练。我们进一步利用梯度反转层( GRL )和域鉴别器的对抗性技术来调整两个域之间的预测差异和外观差异。

定量评价

我们使用了四种类型:汽车、行人、植被和房屋,以及四种类型的关系:前、左、右和后。所有的关系都以汽车为主题。

sim2sg_figure3.jpg-625x135.png

表 1 在人工驾驶环境下训练时对 KITTI hard 的评估。类特定的 AP 和 mAP 报告为 0 。 5iou 。

表 1 显示了与基线相比,标签对齐和外观对齐在所提出的方法中如何显著地减少域间隙。我们将 Sim2SG 与基于随机化的方法( Prakash et al 。, 2019 )、解决内容差距的方法( Kar et al 。, 2019 )、基于伪标签的自学习方法( Zou et al 。, 2018 )和用于目标检测的域自适应方法( Chen et al 。, 2018 ; Xu et al 。, 2020 ; Li et al 。, 2020 )进行了比较。通过结合标签、外观和预测对齐(最后一行),域间隙进一步减小。

定性评价

sim2sg_figure3a.jpg-625x203.png

图 3 Sim2SG 在目标域上的定性结果。

图 3 显示了 Sim2SG 在目标域上的定性结果。第一列显示仅源基线无法检测到对象或具有大量误报(错误标记),从而导致场景图不佳。我们的方法能够更好地检测对象,具有更少的误报,并最终生成更精确的场景图,分别如第二列和第三列所示。这是因为外观对齐项减少了假阳性检测。此外,标签对齐项还提高了检测性能,因为它有助于生成用于训练的合成数据,这些数据与目标域的标签对齐程度更高。图 4 显示了一些与目标域样本相对应的标签对齐的合成重建。

poYBAGJon2KAD83aAARWtgBGzbg069.png

图4 基于标签对齐的驾驶环境中目标 KITTI 样本的综合重建。基蒂样品(右)和相应的合成样品(左)。

概括

在这项工作中,我们提出了 Sim2SG ,一个模型,实现了 sim-to-real 转移学习场景图生成上未标记的真实世界数据集。我们将域间隙分解为合成域和真实域之间的标记、预测和外观差异。我们提出了解决这些差异的方法,并在所有三种环境( Clevr 、 dinning-Sim 和 Drive-Sim )中实现了基线的显著改进。

关于作者

Aayush Prakash 是多伦多人工智能实验室的高级研究员。他的研究兴趣在于机器学习、计算机视觉和计算机图形学的结合点。具体来说,他致力于模拟现实问题的感知。他想通过模拟训练有效的真实世界模型。在 NVIDIA 之前,他是多伦多 IBM 实验室的一员,在那里从事编译器的工作,这是他过去一直感兴趣的另一个领域。他于 2010 年毕业于印度哈拉格布尔印度理工学院( IIT ),获得电子 CTR 和电子 CTR 通信工程学士学位, 2013 年毕业于加拿大滑铁卢大学计算机工程硕士学位。

Shoubhik Debnath 是 NVIDIA 的研发工程师,致力于机器人技术、仿真深度学习。他于 2014 年毕业于印度曼迪印度理工学院( IIT )计算机科学与工程理学学士学位,并于 2018 年在南加州大学 Gaurav Suhkatme 教授的指导下获得计算机科学硕士学位,专注于机器人研究。此前, Shoubhik 还在微软工作了两年,专注于数据科学和基于云的技术。

Jean-Francois Lafleche 是一位充满干劲和激情的工程师,热爱用创新的解决方案解决复杂的挑战。他是一个自学成才的终身学习者,拥有广泛多样的技能,专注于机器学习和机器人应用。

Eric Cameracci 是滑铁卢大学计算机工程专业的 2015 届毕业生。

Gavriel State 是 NVIDIA 系统软件团队的高级主管。他在多伦多工作,除了为 NVIDIA SHIELD TV 平台重新制作游戏外,还负责将 AI 技术应用于游戏,反之亦然。此前, Gavriel 成立了 TransGaming , Inc ,并花了 15 年时间专注于游戏和渲染技术。

Marc T. Law 是 NVIDIA 的高级研究科学家,致力于机器学习和计算机视觉。他在加拿大多伦多人工智能实验室工作,由 Sanja Fidler 教授领导。 2015 年,他获得法国巴黎皮埃尔玛丽居里大学(现为索邦大学)计算机科学博士学位。他的博士生导师是马蒂厄·科德教授和斯蒂芬·甘萨尔斯基教授,他还受到尼古拉斯·托马斯教授的指导。 Marc 曾于 2015 ~ 2016 年在卡内基梅隆大学计算机学院任 Eric Xing 教授团队访问研究学者。 2016 年至 2019 年,他在多伦多大学和向量研究所计算机科学系(机器学习组)担任博士后研究员,由 Raquel Urtasun 教授和 Richard Zemel 教授指导。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5725

    浏览量

    110288
  • 计算机
    +关注

    关注

    19

    文章

    7851

    浏览量

    93597
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137421
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    SIM卡路由器与传统宽带

    SUNCOMM,我们曾在不同地点和情况下测试过这两种类型的互联网连接。答案并非适用于所有人。这取决于互联网网络的设置方式以及您的使用目的。  什么是SIM卡路由器?  SIM卡路由器使用电话网络连接到互联网。您只需将SIM卡插入
    的头像 发表于 04-24 11:09 221次阅读
    <b class='flag-5'>SIM</b>卡路由器与传统宽带

    SIM卡静电放电防护方案

    移动电话客户的信息、密钥等内容。当手机开机时,手机会读取SIM卡中的信息,并将其发送给网络运营商进行身份验证。验证通过后,用户即可享受网络运营商提供的各种服务。一旦SI
    的头像 发表于 03-24 11:40 263次阅读
    <b class='flag-5'>SIM</b>卡静电放电防护方案

    SGM4558:双 SIM/智能卡电源供应与接口芯片解析

    SGM4558:双 SIM/智能卡电源供应与接口芯片解析 在电子设备的设计领域,尤其是涉及多 SIM 卡应用的场景,电源供应和信号接口的稳定性与高效性至关重要。今天,我们就来深入探讨一款名为
    的头像 发表于 03-16 14:45 245次阅读

    SiM3C1xx:高性能低功耗32位MCU的卓越之选

    的性能和丰富的功能,成为了众多应用场景中的理想选择。本文将深入剖析SiM3C1xx的各项特性,为电子工程师们提供全面的参考。 文件下载: SIM3C166-B-GM.pdf 一、核心特性概览
    的头像 发表于 03-03 16:15 545次阅读

    深入解析 NVT4555:SIM 卡接口电平转换器与电源 LDO

    。NVT4555 就是这样一款专门为 SIM 卡接口设计的电平转换器和电源 LDO,它能够满足多种应用场景的需求。今天,我们就来详细解析一下 NVT4555 这款芯片。 文件下载: NVT4555UKZ.pdf
    的头像 发表于 02-27 17:15 850次阅读

    SIM卡系统设计核心技术:硬件电路与软件架构解析

    在多号码、多运营商应用场景下,双SIM卡系统的设计变得愈发重要。本文聚焦于双卡系统的核心技术,深入分析硬件电路中的电平匹配、防反接保护设计,并结合主流芯片平台,解析软件架构中的多卡管理与通信调度机
    的头像 发表于 12-30 15:31 621次阅读
    双<b class='flag-5'>SIM</b>卡系统设计核心技术:硬件电路与软件架构解析

    借助NVIDIA Isaac Sim与World Labs Marble加速机器人仿真环境构建

    的虚拟世界。将开源机器人参考框架 NVIDIA Isaac Sim生成模型,比如 World Labs 推出的 Marble 等相结合,即可通过文本或图像提示,为机器人开发创建完
    的头像 发表于 12-24 10:28 1801次阅读

    生成式AI赋能虚拟调试——fe.screen-sim的架构价值

    生成式AI赋能虚拟调试——fe.screen-sim的架构价值
    的头像 发表于 12-04 14:59 1307次阅读
    <b class='flag-5'>生成</b>式AI赋能虚拟调试——fe.screen-<b class='flag-5'>sim</b>的架构价值

    仅使用智能手机在NVIDIA Isaac Sim中重建场景

    使用 iPhone 拍摄照片,到利用 3DGUT 进行 3D 场景重建,再到将重建的场景导入 NVIDIA Isaac Sim 并添加机器人。若要跳过重建步骤(步骤 1–3),直接在 Isaac
    的头像 发表于 11-10 14:03 1258次阅读

    使用nncase模拟器验证转换效果出现报错sim.load_model(kmodel) RuntimeError怎么解决?

    =cv2.imread(img_path) # 如果模型输入要求是RGB的,则转换为RGB格式,如果要求是BGR的,则不需要转换 image_fp32=cv2.cvtColor(image_fp32
    发表于 07-23 07:44

    一种基于扩散模型的视频生成框架RoboTransfer

    在机器人操作领域,模仿学习是推动具身智能发展的关键路径,但高度依赖大规模、高质量的真实演示数据,面临高昂采集成本与效率瓶颈。仿真器虽提供了低成本数据生成方案,但显著的“模拟到现实”(Sim2Real)鸿沟,制约了仿真数据训练策略
    的头像 发表于 07-09 14:02 998次阅读
    一种基于扩散<b class='flag-5'>模型</b>的视频<b class='flag-5'>生成</b>框架RoboTransfer

    【新品发布】艾为推出SIM卡电平转换AW39103,成功通过高通平台认证

    艾为推出SIM卡电平转换产品AW39103,其凭借优异的性能,成功通过高通平台认证,并获得高通最高推荐等级(GOLD)。1高通平台认证随着手机平台处理器工艺向4nm/3nm演进,其I/O电平已降至
    的头像 发表于 07-04 18:06 1460次阅读
    【新品发布】艾为推出<b class='flag-5'>SIM</b>卡电平转换AW39103,成功<b class='flag-5'>通过</b>高通平台认证

    51Sim利用NVIDIA Cosmos提升辅助驾驶合成数据场景的泛化性

    51Sim 利用 NVIDIA Cosmos 的生成式世界基础模型,对现有的合成数据进行大规模泛化,在确保物理真实性的前提下,大幅提升了数据的丰富度。同时依托 NVIDIA Issac Sim
    的头像 发表于 06-26 09:09 1753次阅读

    NVIDIA Isaac Sim 4.5.0与lsaac Lab 2.0的安装教程

    Isaac Sim 和 Isaac Lab 目前开放下载的版本是 Isaac Sim 4.5.0 以及 Isaac Lab 2.0,本篇文章将为大家带来这两个软件的安装教程。
    的头像 发表于 06-19 15:00 3510次阅读
    NVIDIA Isaac <b class='flag-5'>Sim</b> 4.5.0与lsaac Lab 2.0的安装教程

    NVIDIA Isaac Sim与NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了机器人仿真参考应用 NVIDIA Isaac Sim 和机器人学习框架 NVIDIA Isaac Lab 的更新,以加速各种形态机器人的开发。
    的头像 发表于 05-28 10:06 2523次阅读