0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

3D视觉工坊 来源:凹非寺 2023-04-10 11:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

普通手机“随手”拍的雕像,一下就变成了精细的三维重建图。

水杯来回动的动态场景下,细节清晰可见:

38654f44-d72b-11ed-bfe3-dac502259ad0.gif

静态场景效果也同样nice,狗狗突出的肋骨都被还原了出来:

38743edc-d72b-11ed-bfe3-dac502259ad0.gif

对比来看其他方法,效果是酱婶的……

388fbc84-d72b-11ed-bfe3-dac502259ad0.png

这就是英伟达最新提出的方法BundleSDF。

这是一种可对未知物体的6D姿态追踪和三维重建的方法。

用于从单目RGBD视频序列中跟踪未知物体的6自由度运动,同时进行物体的隐式神经三维重建,方法接近于实时(10Hz)。

这种方法适用于任意刚性物体,即使视觉纹理大部分确实,仅需在第一帧中分割出物体,不需要任何额外的信息,并且不对智能体与物体的交互模式做任何假设。

目前,该方法已被CVPR 2023接收。

可处理大幅度姿态变化、有遮挡视频

该方法的关键是一个神经物体场,它与姿态图优化过程同时进行,以便将信息稳健地累积到一致的3D表示中,捕捉几何和外观。

方法自动维护了一组动态的姿态内存帧,以便这些线程之间进行通信

它能处理具有大幅度姿态变化、部分和完全遮挡、无纹理表面和高光反射等具有挑战性的视频。

作者展示了HO3D、YCBInEOAT和BEHAVE数据集上的结果,证明了我们的方法显著优于现有方法。

野外测试

用于iPhone 12 Pro Max的效果:

38a7c02c-d72b-11ed-bfe3-dac502259ad0.gif

用于Intel RealSense的效果:

38dd70a0-d72b-11ed-bfe3-dac502259ad0.gif

该方法不仅适用于更具挑战性的动态场景,还适用于此前经常被考虑的静态场景(移动相机)。

因此实现了比专门设计用于静态场景的那些方法更好或相当的结果(即文章开头展示动图)。

391d3c6c-d72b-11ed-bfe3-dac502259ad0.png

与SOTA对比

HO3D数据集上三种最具竞争力方法的定性比较。

左图:6自由度姿态跟踪可视化,其中轮廓(青色)以估计的姿态渲染。

值得注意的是,如第二列所示,我们的预测姿态有时甚至会纠正GT的错误。

右图:每种方法输出的最终3D重建的正面和背面视图。

由于手部遮挡,视频中的某些部分永远不可见。虽然从相同的视角渲染网格,但是DROID-SLAM和BundleTrack的显著漂移导致网格错误旋转。

3924d4f4-d72b-11ed-bfe3-dac502259ad0.png

定量结果对比如下:

3943413c-d72b-11ed-bfe3-dac502259ad0.png

394be404-d72b-11ed-bfe3-dac502259ad0.png

3952cb34-d72b-11ed-bfe3-dac502259ad0.png

问题设置

给定一段单目RGBD输入视频以及仅在第一帧中目标物体的分割掩码,该方法能持续追踪物体的6-DoF姿态并重建物体的3D模型。

所有处理都是在线自回归的(没有假设未来帧可用)。

处理的物体是刚性的,但不依赖其特定丰富的纹理 - 方法适用于无纹理的物体。

此外,不需要物体的实例级CAD模型,也不需要物体类别的先验知识(例如事先对同一物体类别进行预训练)。

具体框架

395af3d6-d72b-11ed-bfe3-dac502259ad0.png

首先,在连续的分割图像之间匹配特征,以获得粗略的姿态估计(第3.1节)。

其中一些带姿态的帧被存储在内存池中,以便稍后使用和精化(第3.2节)。

从内存池的子集动态创建位姿图(第3.3节);在线优化与当前姿态一起联合细化图中的所有姿态。

然后,这些更新的姿态被存储回内存池中。

最后,内存池中的所有带姿态的帧用于学习神经物体场(在单独的线程中),该场建模了物体的几何和视觉纹理(第3.4节),同时调整其先前估计的姿态,使姿态跟踪更加鲁棒。

项目地址:
https://bundlesdf.github.io/

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    3020

    浏览量

    115523
  • 三维重建
    +关注

    关注

    0

    文章

    28

    浏览量

    10222
  • 姿态
    +关注

    关注

    0

    文章

    3

    浏览量

    8052

原文标题:英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深度相机:从技术突破到全场景落地,解锁三维感知新可能

    推动各行业智能化转型的关键设备。不同于传统2D相机只能捕捉平面图像,深度相机能够精确获取场景或物体三维空间信息,输出深度图与点云数据,让设备拥有“立体视觉”,实现
    的头像 发表于 04-15 15:04 238次阅读
    深度相机:从技术突破到全场景落地,解锁<b class='flag-5'>三维</b>感知新可能

    VirtualLab:光学系统的三维可视化

    : 1.使用“光线结果配置文件”并选择“系统:三维”作为结果,然后运行模拟。 2.点击视图系统(仅三维显示组件,没有光传播)。 系统:三维(光线结果配置文件)和三维系统视图 这两种
    发表于 04-13 09:04

    地平线11篇论文强势入选CVPR 2026

    论文收录结果。地平线凭借深厚的技术积淀与前瞻的科研布局,共有11篇论文成功入选,覆盖端到端自动驾驶、3D重建、世界模型、具身智能等多个核心领域,充分彰显地平线在前沿技术领域的顶尖研发水平。
    的头像 发表于 03-18 15:18 778次阅读
    地平线11篇论文强势<b class='flag-5'>入选</b><b class='flag-5'>CVPR</b> 2026

    用于窄带匹配高速射频ADC的全新方法

    本期,为大家带来的是《用于窄带匹配高速射频 ADC 的全新方法》,介绍了一种用于窄带匹配高速射频 ADC 的全新方法,以解决高中间频率系统中 ADC 前端窄带匹配的设计难题,可在 ADC 额定带宽内应用,能提升 ADC 性能、减少模拟停机时间。
    的头像 发表于 01-04 15:56 7476次阅读
    用于窄带匹配高速射频ADC的全<b class='flag-5'>新方法</b>

    一文读懂 | 三维视觉领域国家级制造业单项冠军——先临三维的品牌布局

    ,推动高精度三维视觉技术的普及应用。2024年,先临三维营业收入超12亿元,业务遍及全球100+个国家和地区。 先临三维的高精度三维视觉技术深度应用于高精度工业3
    的头像 发表于 11-11 14:55 893次阅读
    一文读懂 | <b class='flag-5'>三维</b>视觉领域国家级制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局

    拆解3D Gaussian Splatting:原理框架、实战 demo 与自驾仿真落地探索!

    ▍文章来源于康谋自动驾驶01引言当前,三维重建技术正处于从"实验室演示"迈向"工业级应用"的关键时期。每一次对场景细节的精准还原,每一帧实时流畅的渲染效果
    的头像 发表于 10-17 17:33 3549次阅读
    拆解3<b class='flag-5'>D</b> Gaussian Splatting:原理框架、实战 demo 与自驾仿真落地探索!

    一种基于多次观测融合的可交互三维高斯场景重建框架

    在计算机视觉和机器人领域,如何完整、真实地重建一个可交互的三维场景,一直是一个难题。传统方法往往依赖复杂的多阶段流程,比如先做分割,再进行背景补全或修复,或者需要对每个物体进行密集扫描
    的头像 发表于 09-29 11:12 742次阅读
    一种基于多次观测融合的可交互<b class='flag-5'>三维</b>高斯场景<b class='flag-5'>重建</b>框架

    NVIDIA助力汤元科技突破智能驾驶数据获取与生成瓶颈

    苏州汤元科技有限公司(以下简称“汤元科技”)是一家专注于三维重建与世界模型的科技公司,为自动驾驶与具身智能提供高质量、多样化的训练数据。通过将自研的世界模型技术与 NVIDIA Cosmos 结合,实现真实物理世界的三维重建、场景泛化,并提升数据生成的效率与拟真度。
    的头像 发表于 09-06 15:16 1607次阅读

    AI 驱动三维逆向:点云降噪算法工具与机器学习建模能力的前沿应用

    数据处理效率与模型构建质量,成为行业前沿发展方向。 传统三维逆向工程的技术瓶颈 点云数据处理难题 传统点云降噪方法依赖固定阈值和人工经验,难以应对复杂场景下的数据噪声。在扫描表面纹理复杂或存在反光现象的物体时,采集的
    的头像 发表于 08-20 10:00 846次阅读
    AI 驱动<b class='flag-5'>三维</b>逆向:点云降噪算法工具与机器学习建模能力的前沿应用

    为何激光三维扫描无需喷粉也能精准测量高反光物体?—— 基于光学抗反射技术的突破

    在精密制造、文物保护等领域,高反光物体三维测量长期依赖喷粉预处理,以增强表面漫反射特性辅助测量。然而,喷粉不仅会损伤被测物体,还会影响测量数据的原始性。随着光学抗反射技术的发展,激光三维
    的头像 发表于 06-27 09:58 758次阅读
    为何激光<b class='flag-5'>三维</b>扫描无需喷粉也能精准测量高反光<b class='flag-5'>物体</b>?—— 基于光学抗反射技术的突破

    航天宏图全栈式3DGS实景三维重建系统解决方案

    表达的核心技术,通过相机、传感器等设备获取物理空间数据,并结合计算机视觉与图形学算法,将二图像转换为三维模型。目前,主流的三维重建方法包括倾斜摄影(多视角立体
    的头像 发表于 06-27 09:28 1945次阅读
    航天宏图全栈式3DGS实景<b class='flag-5'>三维重建</b>系统解决方案

    无刷直流电机反电势过零检测新方法

    新方法。在相采样等效电路上分别并联一组极管控制的电阻分压开关电路,参考电机转速线性调节控制信号占空比,以此控制极管通断,从而调节电阻分乐开关电路阻值,可以避免高速时反电势幅值高于
    发表于 06-26 13:50

    激光三维扫描技术:无喷粉条件下高反光表面三维重建的光学原理与应用

    高反光表面的三维重建是工业检测、文化遗产保护等领域的关键技术瓶颈。传统激光扫描依赖喷粉增强漫反射,但会对精密器件或文物造成不可逆损伤。本文通过融合结构光调制、偏振分析及多视角协同技术,构建无喷粉测量
    的头像 发表于 06-25 10:19 1030次阅读

    非接触式激光三维扫描应对镜面反射表面的无喷粉测量方案:原理与创新

    偏折术、多角度偏振编码与结构光动态调制的无喷粉测量方案,通过光学原理创新与算法优化,实现镜面表面的高精度三维重建。 测量原理与技术挑战 非接触式激光三维扫描的核心基于角测距原理,当激光束投射到镜面表面时,
    的头像 发表于 06-24 13:10 741次阅读
    非接触式激光<b class='flag-5'>三维</b>扫描应对镜面反射表面的无喷粉测量方案:原理与创新

    VirtualLab:光学系统的三维可视化

    配置文件”并选择“系统:三维”作为结果,然后运行模拟。 2.点击视图系统(仅三维显示组件,没有光传播)。 系统:三维(光线结果配置文件)和三维系统视图 这两种
    发表于 05-30 08:45