英伟达新方法入选CVPR 2023：对未知物体的6D姿态追踪和三维重建-电子发烧友网

普通手机“随手”拍的雕像，一下就变成了精细的三维重建图。

水杯来回动的动态场景下，细节清晰可见：

静态场景效果也同样nice，狗狗突出的肋骨都被还原了出来：

对比来看其他方法，效果是酱婶的……

这就是英伟达最新提出的方法BundleSDF。

这是一种可对未知物体的6D姿态追踪和三维重建的方法。

用于从单目RGBD视频序列中跟踪未知物体的6自由度运动，同时进行物体的隐式神经三维重建，方法接近于实时（10Hz）。

这种方法适用于任意刚性物体，即使视觉纹理大部分确实，仅需在第一帧中分割出物体，不需要任何额外的信息，并且不对智能体与物体的交互模式做任何假设。

目前，该方法已被CVPR 2023接收。

可处理大幅度姿态变化、有遮挡视频

该方法的关键是一个神经物体场，它与姿态图优化过程同时进行，以便将信息稳健地累积到一致的3D表示中，捕捉几何和外观。

方法自动维护了一组动态的姿态内存帧，以便这些线程之间进行通信。

它能处理具有大幅度姿态变化、部分和完全遮挡、无纹理表面和高光反射等具有挑战性的视频。

作者展示了HO3D、YCBInEOAT和BEHAVE数据集上的结果，证明了我们的方法显著优于现有方法。

野外测试

用于iPhone 12 Pro Max的效果：

用于Intel RealSense的效果：

该方法不仅适用于更具挑战性的动态场景，还适用于此前经常被考虑的静态场景（移动相机）。

因此实现了比专门设计用于静态场景的那些方法更好或相当的结果（即文章开头展示动图）。

与SOTA对比

HO3D数据集上三种最具竞争力方法的定性比较。

左图：6自由度姿态跟踪可视化，其中轮廓（青色）以估计的姿态渲染。

值得注意的是，如第二列所示，我们的预测姿态有时甚至会纠正GT的错误。

右图：每种方法输出的最终3D重建的正面和背面视图。

由于手部遮挡，视频中的某些部分永远不可见。虽然从相同的视角渲染网格，但是DROID-SLAM和BundleTrack的显著漂移导致网格错误旋转。

定量结果对比如下：

问题设置

给定一段单目RGBD输入视频以及仅在第一帧中目标物体的分割掩码，该方法能持续追踪物体的6-DoF姿态并重建物体的3D模型。

所有处理都是在线自回归的（没有假设未来帧可用）。

处理的物体是刚性的，但不依赖其特定丰富的纹理 - 方法适用于无纹理的物体。

此外，不需要物体的实例级CAD模型，也不需要物体类别的先验知识（例如事先对同一物体类别进行预训练）。

具体框架

首先，在连续的分割图像之间匹配特征，以获得粗略的姿态估计（第3.1节）。

其中一些带姿态的帧被存储在内存池中，以便稍后使用和精化（第3.2节）。

从内存池的子集动态创建位姿图（第3.3节）；在线优化与当前姿态一起联合细化图中的所有姿态。

然后，这些更新的姿态被存储回内存池中。

最后，内存池中的所有带姿态的帧用于学习神经物体场（在单独的线程中），该场建模了物体的几何和视觉纹理（第3.4节），同时调整其先前估计的姿态，使姿态跟踪更加鲁棒。

项目地址：
https://bundlesdf.github.io/

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

3D

3D

+关注

关注
9

文章
2756

浏览量
106456
三维重建

三维重建

+关注

关注
0

文章
24

浏览量
9840
姿态

姿态

+关注

关注
0

文章
3

浏览量
7833

原文标题：英伟达新方法入选CVPR 2023：对未知物体的6D姿态追踪和三维重建

文章出处：【微信号：3D视觉工坊，微信公众号：3D视觉工坊】欢迎添加关注！文章转载请注明出处。

【先楫HPM5361EVK开发板试用体验】06-基于MPU9250的姿态解算

采用欧拉角、四元数或旋转矩阵等方式来表示物体的姿态，欧拉角会更加直观一点。而欧拉角是一种用于描述物体在三维空间中姿态的表示

发表于 01-17 14:55

工业上常见的高精度主动式重建算法

三维重建目前是最为炙手可热的领域。摄影测量或结构光投影技术可以解决漫反射重建问题，但却无法有效应对镜面反射物体（如玻璃、积水、反光物体和汽车车身）等的

发表于 01-05 10:46 •148次阅读

基于光学计算超表面的全光学目标识别和三维重建技术

随着物体识别和三维(3D) 重建技术在各种逆向工程、人工智能、医疗诊断和工业生产领域变得必不可少，人们越来越关注与寻求可以简化处理的高效、更快的速度和更集成的方法。

发表于 12-22 10:13 •226次阅读

基于光学计算超表面的全光学目标识别和<b class='flag-5'>三维重建</b>技术

VLSI系统设计的最新方法

电子发烧友网站提供《VLSI系统设计的最新方法.pdf》资料免费下载

发表于 11-20 11:10 •0次下载

RayDF：实时渲染！基于射线的三维重建新方法

在机器视觉和机器人领域的许多前沿应用中，学习准确且高效的三维形状表达是十分重要的。然而，现有的基于三维坐标的隐式表达在表示三维形状或是渲染二维图像时，需要耗费昂贵的计算成本；

发表于 11-17 16:23 •411次阅读

RayDF：实时渲染！基于射线的<b class='flag-5'>三维重建</b><b class='flag-5'>新方法</b>

一种微小爬壁机器人三维位置测量的新方法

提出了一种微小爬壁机器人三维位置测量的新方法。笔者通过深入分析研究各种位置测控方法与系统，提出采用单目视觉方法

发表于 09-20 07:25

基于光学成像的物体三维重建技术研究

三维重建的一种重要方法，具有成本低、精度高等优点，因此越来越受到人们的关注和青睐。本文就基于光学成像的物体三维重建技术进行研究和探讨。

发表于 09-15 09:29 •531次阅读

基于光学成像的<b class='flag-5'>物体</b><b class='flag-5'>三维重建</b>技术研究

总结！三维点云基础知识

该方法具体通过六个步骤实现：图像的采集、系统相机标定、特征模板匹配、图像处理、三维仿真匹配以及三维重建。首先，通过两个相机于不同位置对待测物体进行图像信息感知获取。然后根据三角测量原理

发表于 09-01 16:12 •1223次阅读

如何实现整个三维重建过程

在计算机视觉中，三维重建是指根据单视图或者多视图的图像重建三维信息的过程。由于单视频的信息不完全，因此三维重建需要利用经验知识，而多视图的三维重建

发表于 09-01 11:06 •957次阅读

三维重建之结构光编码方案研究

接下来进入主题，正式介绍结构光编码方案。结构光三维重建按照所投影的图案一般可以分为以下三类，点结构光、线结构光和面结构光，其中面结构光按照编码原理又可以基于时域编码的结构光和基于空域编码的结构光。

发表于 08-16 16:52 •647次阅读

USBブート用ドライバ誤認識後のドライバ更新方法

USBブート用ドライバ誤認識後のドライバ更新方法

发表于 07-11 20:20 •0次下载

基于未知物体进行6D追踪和3D重建的方法

如今，计算机视觉社区已经广泛展开了对物体姿态的 6D 追踪和 3D 重建。本文中英伟达提出了同时

发表于 07-03 11:24 •337次阅读

英伟达提出了同时对未知物体进行6D追踪和3D重建的方法

一种用于新颖未知动态物体的因果 6 自由度姿态跟踪和 3D 重建的新方法。该方法利用了并发跟踪和

发表于 07-03 10:49 •310次阅读

基于深度学习的三维点云配准新方法

一、摘要本文介绍了一种基于深度学习的三维点云配准新方法。该架构由三个部分组成: (1)编码器由基于卷积图的描述符组成，该描述符对每个点的近邻进行编码，并采用注意机制对表面法线的变化进行编码，突出

发表于 06-17 09:54 •891次阅读

USBブート用ドライバ誤認識後のドライバ更新方法

USBブート用ドライバ誤認識後のドライバ更新方法

发表于 05-15 19:09 •0次下载