0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

3D视觉工坊 来源:凹非寺 2023-04-10 11:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

普通手机“随手”拍的雕像,一下就变成了精细的三维重建图。

水杯来回动的动态场景下,细节清晰可见:

38654f44-d72b-11ed-bfe3-dac502259ad0.gif

静态场景效果也同样nice,狗狗突出的肋骨都被还原了出来:

38743edc-d72b-11ed-bfe3-dac502259ad0.gif

对比来看其他方法,效果是酱婶的……

388fbc84-d72b-11ed-bfe3-dac502259ad0.png

这就是英伟达最新提出的方法BundleSDF。

这是一种可对未知物体的6D姿态追踪和三维重建的方法。

用于从单目RGBD视频序列中跟踪未知物体的6自由度运动,同时进行物体的隐式神经三维重建,方法接近于实时(10Hz)。

这种方法适用于任意刚性物体,即使视觉纹理大部分确实,仅需在第一帧中分割出物体,不需要任何额外的信息,并且不对智能体与物体的交互模式做任何假设。

目前,该方法已被CVPR 2023接收。

可处理大幅度姿态变化、有遮挡视频

该方法的关键是一个神经物体场,它与姿态图优化过程同时进行,以便将信息稳健地累积到一致的3D表示中,捕捉几何和外观。

方法自动维护了一组动态的姿态内存帧,以便这些线程之间进行通信

它能处理具有大幅度姿态变化、部分和完全遮挡、无纹理表面和高光反射等具有挑战性的视频。

作者展示了HO3D、YCBInEOAT和BEHAVE数据集上的结果,证明了我们的方法显著优于现有方法。

野外测试

用于iPhone 12 Pro Max的效果:

38a7c02c-d72b-11ed-bfe3-dac502259ad0.gif

用于Intel RealSense的效果:

38dd70a0-d72b-11ed-bfe3-dac502259ad0.gif

该方法不仅适用于更具挑战性的动态场景,还适用于此前经常被考虑的静态场景(移动相机)。

因此实现了比专门设计用于静态场景的那些方法更好或相当的结果(即文章开头展示动图)。

391d3c6c-d72b-11ed-bfe3-dac502259ad0.png

与SOTA对比

HO3D数据集上三种最具竞争力方法的定性比较。

左图:6自由度姿态跟踪可视化,其中轮廓(青色)以估计的姿态渲染。

值得注意的是,如第二列所示,我们的预测姿态有时甚至会纠正GT的错误。

右图:每种方法输出的最终3D重建的正面和背面视图。

由于手部遮挡,视频中的某些部分永远不可见。虽然从相同的视角渲染网格,但是DROID-SLAM和BundleTrack的显著漂移导致网格错误旋转。

3924d4f4-d72b-11ed-bfe3-dac502259ad0.png

定量结果对比如下:

3943413c-d72b-11ed-bfe3-dac502259ad0.png

394be404-d72b-11ed-bfe3-dac502259ad0.png

3952cb34-d72b-11ed-bfe3-dac502259ad0.png

问题设置

给定一段单目RGBD输入视频以及仅在第一帧中目标物体的分割掩码,该方法能持续追踪物体的6-DoF姿态并重建物体的3D模型。

所有处理都是在线自回归的(没有假设未来帧可用)。

处理的物体是刚性的,但不依赖其特定丰富的纹理 - 方法适用于无纹理的物体。

此外,不需要物体的实例级CAD模型,也不需要物体类别的先验知识(例如事先对同一物体类别进行预训练)。

具体框架

395af3d6-d72b-11ed-bfe3-dac502259ad0.png

首先,在连续的分割图像之间匹配特征,以获得粗略的姿态估计(第3.1节)。

其中一些带姿态的帧被存储在内存池中,以便稍后使用和精化(第3.2节)。

从内存池的子集动态创建位姿图(第3.3节);在线优化与当前姿态一起联合细化图中的所有姿态。

然后,这些更新的姿态被存储回内存池中。

最后,内存池中的所有带姿态的帧用于学习神经物体场(在单独的线程中),该场建模了物体的几何和视觉纹理(第3.4节),同时调整其先前估计的姿态,使姿态跟踪更加鲁棒。

项目地址:
https://bundlesdf.github.io/

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2991

    浏览量

    113843
  • 三维重建
    +关注

    关注

    0

    文章

    28

    浏览量

    10181
  • 姿态
    +关注

    关注

    0

    文章

    3

    浏览量

    8024

原文标题:英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一文读懂 | 三维视觉领域国家级制造业单项冠军——先临三维的品牌布局

    ,推动高精度三维视觉技术的普及应用。2024年,先临三维营业收入超12亿元,业务遍及全球100+个国家和地区。 先临三维的高精度三维视觉技术深度应用于高精度工业3
    的头像 发表于 11-11 14:55 281次阅读
    一文读懂 | <b class='flag-5'>三维</b>视觉领域国家级制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局

    一种基于多次观测融合的可交互三维高斯场景重建框架

    在计算机视觉和机器人领域,如何完整、真实地重建一个可交互的三维场景,一直是一个难题。传统方法往往依赖复杂的多阶段流程,比如先做分割,再进行背景补全或修复,或者需要对每个物体进行密集扫描
    的头像 发表于 09-29 11:12 434次阅读
    一种基于多次观测融合的可交互<b class='flag-5'>三维</b>高斯场景<b class='flag-5'>重建</b>框架

    为何激光三维扫描无需喷粉也能精准测量高反光物体?—— 基于光学抗反射技术的突破

    在精密制造、文物保护等领域,高反光物体三维测量长期依赖喷粉预处理,以增强表面漫反射特性辅助测量。然而,喷粉不仅会损伤被测物体,还会影响测量数据的原始性。随着光学抗反射技术的发展,激光三维
    的头像 发表于 06-27 09:58 382次阅读
    为何激光<b class='flag-5'>三维</b>扫描无需喷粉也能精准测量高反光<b class='flag-5'>物体</b>?—— 基于光学抗反射技术的突破

    航天宏图全栈式3DGS实景三维重建系统解决方案

    表达的核心技术,通过相机、传感器等设备获取物理空间数据,并结合计算机视觉与图形学算法,将二图像转换为三维模型。目前,主流的三维重建方法包括倾斜摄影(多视角立体
    的头像 发表于 06-27 09:28 1080次阅读
    航天宏图全栈式3DGS实景<b class='flag-5'>三维重建</b>系统解决方案

    无刷直流电机反电势过零检测新方法

    新方法。在相采样等效电路上分别并联一组极管控制的电阻分压开关电路,参考电机转速线性调节控制信号占空比,以此控制极管通断,从而调节电阻分乐开关电路阻值,可以避免高速时反电势幅值高于
    发表于 06-26 13:50

    激光三维扫描技术:无喷粉条件下高反光表面三维重建的光学原理与应用

    高反光表面的三维重建是工业检测、文化遗产保护等领域的关键技术瓶颈。传统激光扫描依赖喷粉增强漫反射,但会对精密器件或文物造成不可逆损伤。本文通过融合结构光调制、偏振分析及多视角协同技术,构建无喷粉测量
    的头像 发表于 06-25 10:19 619次阅读

    奥比中光助力创想三维登顶世界消费级3D扫描仪市场

    Lite及Raptor Pro提供基于自研多核异构三维重建芯片技术的软硬件引擎,助力战略合作伙伴创想三维登顶世界消费级3D扫描仪市场。
    的头像 发表于 04-11 11:38 1269次阅读

    一种基于基础模型对齐的自监督三维空间理解方法

    三维空间理解是推动自动驾驶、具身智能等领域中智能系统实现环境感知、交互的核心任务,其中3D语义占据预测 (Semantic Occupancy Prediction) 对三维场景进行精准的体素级建模。然而,当前主流
    的头像 发表于 03-18 15:01 747次阅读
    一种基于基础模型对齐的自监督<b class='flag-5'>三维</b>空间理解<b class='flag-5'>方法</b>

    使用DLP LightCrafter4500投影结构光进行三维重建遇到的疑问求解

    使用DLP LightCrafter4500 投影结构光进行三维重建,遇到以下问题: (1)投影自己的图片,如何使投影出的图片和原图片的亮度一致。它是可以设定LED的亮度,我投影出来的图片亮度很
    发表于 03-03 06:29

    请问DLP LightCrafter 3000在hdmi模式下如何关闭gamma?

    使用LightCrafter进行三维重建时发现有gamma现象,请问能不能控制将其关闭,还有,由于官网上找不到LightCrafter的资料了,希望技术人员能补发一些相关技术文档,比如关于投影完图像的触发信号的介绍
    发表于 02-28 07:24

    请问DLP3010投影图像DMD格栅如何模糊化?

    我们在使用500W相机采集投影条纹时,相机的采样率高,把DMD的微镜格栅也采集到,影响到我们三维重建的数据质量,会带来格栅网状的错误数据。 是否有方法可以模糊化这种格栅网格,除了使用更高分辨率的DMD方案,或者使用DLP3310这种伪1080P DMD方案是否也可以?
    发表于 02-27 07:01

    三维测量在医疗领域的应用

    三维测量在医疗领域的应用十分广泛,为医疗诊断、治疗及手术规划等提供了重要的技术支持。以下是对三维测量在医疗领域应用的分析: 一、医学影像的三维重建与分析 CT、MRI等影像的三维重建
    的头像 发表于 12-30 15:21 1093次阅读

    常见的三维测量方法和工具

    三维测量是用于获取物体三维几何信息的技术,它在工业制造、建筑、考古、医学等领域有着广泛的应用。以下是一些常见的三维测量方法和工具的概述,以及
    的头像 发表于 12-30 15:02 1927次阅读

    三维测量技术在工业中的应用

    中不可或缺的一部分。 一、三维测量技术的工作原理 三维测量技术,也称为三维扫描技术,是一种通过捕捉物体表面点的三维坐标信息来
    的头像 发表于 12-30 15:01 1167次阅读

    三维扫描与建模的区别 三维扫描在工业中的应用

    数据。这一过程是自动化的,能够快速捕捉物体三维信息。 三维建模 :则需要专业建模师使用三维建模软件,从无到有地创建三维模型。建模师可以根据
    的头像 发表于 12-19 14:55 1572次阅读