0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于多次观测融合的可交互三维高斯场景重建框架

地平线HorizonRobotics 来源:地平线HorizonRobotics 2025-09-29 11:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

IGFuse基于多次观测融合的可交互三维高斯场景重建

计算机视觉机器人领域,如何完整、真实地重建一个可交互的三维场景,一直是一个难题。传统方法往往依赖复杂的多阶段流程,比如先做分割,再进行背景补全或修复,或者需要对每个物体进行密集扫描。这些方式不仅成本高、容易出错,而且很难扩展到大规模的应用场景。

我们提出的IGFuse提供了一种新的思路:通过多次场景扫描的融合来重建三维高斯场景。在不同扫描中,物体布局的自然移动能够“揭示”那些在单次扫描里被遮挡的区域,从而帮助恢复完整的场景。为了保证重建的质量,我们构建了具有语义信息的高斯场,并在不同扫描之间保持光度和语义上的一致。同时,我们设计了一种伪中间场景状态来解决多次扫描之间的对齐问题,并通过协同剪枝策略不断优化几何结构。

概述

可交互三维场景重建是推动计算机视觉与机器人智能发展的关键。然而,真实世界的频繁遮挡使单次扫描无法完整捕捉场景信息,也因此限制了后续的全面交互。传统方法往往依赖复杂流程或逐物体扫描,难以兼顾效率与完整性。为此,我们提出IGFuse,一个基于多次观测融合的可交互三维高斯场景重建框架。它能够利用多次扫描不同物体布局下的场景揭示被遮挡区域,并通过分割感知的高斯场和一致性约束实现高保真重建。用户无需繁琐步骤,即可获得完整、可交互的三维场景。目前,IGFuse网站已上线,代码也将于近期开源,欢迎大家关注与体验。

• 项目主页:

https://whhu7.github.io/IGFuse/

• 文章链接:

https://arxiv.org/pdf/2508.13153

GitHub代码

https://github.com/whhu7/IGFuse-code

输入(左):同一个场景的多次扫描 (Multi-Scans) ,每次扫描中的物体布局都不同。

融合与分解(中):IGFuse通过一个多状态联合优化过程,将所有扫描的信息融合成一个统一的、一致的场景表示,并将其分解为独立的可动物体 (Optimized Objects) 和完整背景 (Optimized Background) 。

交互式生成(右):最终,用户可以随意地重新排列 (Object Rearrangement) 这些物体,生成全新的、高保真的场景状态。

背景方法

996ef592-97c2-11f0-8c8f-92fbcf53809c.png

在构建可交互的三维高斯场景时,不同范式有着明显差异:

(a) 传统单次扫描方法:依赖繁琐的多阶段后处理与修复操作,但往往会引入累积误差与伪影;

(b) 基于物体的重建方法:需要对场景中每个物体进行密集多视角扫描,再进行显式组合,过程复杂且成本高;

(c) 我们提出的IGFuse:则通过端到端的多次观测融合,在跨状态监督下联合优化多状态高斯场,不仅能有效补偿不同扫描视角下的遮挡,还能实现高质量的可交互三维高斯重建。

总体框架

对于N个扫描场景,我们每次从中选取两个场景扫描i和j,进行一次对齐优化。

双向对齐

IGFuse通过物体级变换矩阵99d0acb0-97c2-11f0-8c8f-92fbcf53809c.png来实现高斯状态迁移9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png。随后,利用对齐损失9a875d70-97c2-11f0-8c8f-92fbcf53809c.png将迁移后的高斯9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png的渲染图像与扫描j下的真实观测对齐,反之亦然。

伪状态引导对齐

双向对齐虽能有效约束,但仅在两个已知状态间提供监督,难以保证模型泛化到任意的、未见的中间状态。为此,IGFuse引入一个虚拟的“伪状态”,相当于一个公共的中转空间,把两个状态都分别变换到这一共享伪状态,再加上额外约束9b35545c-97c2-11f0-8c8f-92fbcf53809c.png,确保渲染结果完全一致,迫使模型学习更本质、更一致的场景表示,并提升对任意新状态的泛化能力。

协同互斥剪枝

为了消除因分割不准或状态变换不精确而产生的“伪影”和悬浮高斯,IGFuse设计了一种协同剪枝机制。当将9b8d94b4-97c2-11f0-8c8f-92fbcf53809c.png变换到9a2d98c6-97c2-11f0-8c8f-92fbcf53809c.png的状态时,对于中的每一个高斯,如果它在中9c3d3ea0-97c2-11f0-8c8f-92fbcf53809c.png找不到一个足够近的“对应点”,那么它就被认为是移动操作遗留下来的“浮动点”,需要被剪枝。这个剪枝过程是双向的,能够共同提升两个高斯场景的几何纯净度。

通过这种“成对对齐+公共空间”的方式,N个扫描场景之间的差异能被逐步消除,从而得到完整、可靠的三维场景重建。

9c9bc18c-97c2-11f0-8c8f-92fbcf53809c.gif

新状态合成结果

在新状态合成任务中,我们的方法取得了最优表现。相比之下,基于分割的算法如Gaussian Grouping容易在物体边界处产生明显的瑕疵,而DecoupledGaussian采用分割加修补的思路,但在复杂场景中修补区域与真实背景之间依然会出现不协调感。

在定量实验上,我们在训练场景扫描之外拍摄了物体随机排布的一个测试场景扫描,用作衡量高斯场在新状态合成的真实性。在虚拟数据(上)和真实数据(下)的新状态任务上,我们跟Ground Truth相比的PSNR和SSIM都显著高于对比算法。

9dfb665e-97c2-11f0-8c8f-92fbcf53809c.png

9e611d32-97c2-11f0-8c8f-92fbcf53809c.png

前背景信息融合

我们的方法融合了不同场景扫描下的前景信息,从而在小车翻滚的不同状态下实现更加逼真的模拟效果。

仅考虑背景时,我们的方法能够融合多次扫描的信息,从而重建出完整的背景。

分割与深度结果

与基线方法Gaussian Grouping在新状态下的表现相比,我们的方法能够生成更加干净的分割结果。Gaussian Grouping在二维分割中往往会在物体边界处产生空洞或多余区域;在深度层面,其基于特征的分割无法覆盖所有三维点,导致物体移动后遗留大量残余点,并在物体移出的位置留下深度空洞。

总结与展望

IGFuse通过融合多次场景扫描信息,有效提升了新状态合成的质量,打通了从场景重建到多状态真实模拟的完整流程。双向对齐设计与伪状态监督相结合,有效解决了遮挡处理和边界分割中的难题,进一步保证了新状态合成的准确性与完整性。未来,该方法将作为一种融合式重建的范式持续演进,重点拓展到更加复杂和多样的场景中,特别是面向长序列观测下的高质量融合重建。这不仅为真实环境中的持续感知与状态合成提供了坚实基础,也为具身智能体在长期交互和复杂任务中的应用开辟了新的可能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31455

    浏览量

    223688
  • 计算机
    +关注

    关注

    19

    文章

    7841

    浏览量

    93465

原文标题:“补全”被遮挡的世界:IGFuse利用场景变化照片重建可交互3D空间

文章出处:【微信号:horizonrobotics,微信公众号:地平线HorizonRobotics】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    怎样去设计一种基于RGB-D相机的三维重建无序抓取系统?

    为什么要开发一种三维重建无序抓取系统?三维重建无序抓取系统是由哪些部分组成的?三维重建无序抓取系统有哪些关键技术和创新点?
    发表于 07-02 06:29

    基于纹理映射的医学图像三维重建

    提出了一种基于纹理映射的体绘制算法,提高了图像的重建效率,增强了图像的重建效果。算法实现了对二医学图像序列的三维重建,在目前通用的个人计算
    发表于 12-14 11:10 19次下载

    三维表面粗糙度高斯滤波快速算法

    三维表面粗糙度高斯滤波快速算法:研究了三维表面粗糙度评定基准的数学模型及采用高斯滤波器得到三维表面评定基准的数字算法,提出
    发表于 09-25 15:47 24次下载

    一种新颖实用的基于视觉导航的三维重建算法

    一种新颖实用的基于视觉导航的三维重建算法 根据立体视觉在视觉导航应用中的特点,提出了由视差图重建三维场景的整套算法。首先,推导视差图里各点
    发表于 02-27 09:24 18次下载

    基于FPGA的医学图像三维重建系统设计与实现

    目前大部分的医学图像三维重建过程都是在PC机上完成的,由于PC机本身性能的限制和重建算法的复杂性,使得重建效率不高。针对这个问题,设计与实现了个基于FPGA(Field Progra
    发表于 03-15 13:52 45次下载

    一种简化的三维模糊制器_沈勇

    一种简化的三维模糊制器_沈勇
    发表于 03-19 11:46 0次下载

    基于双目立体视觉的三维拼接和融合方法

    目前,在计算机视觉领域,越来越多的高精度三维重建方法以及实时定位和地图构建(SLAM)算法正在被提出用来对三维世界进行描述和分析。在计算机图形领域,快速和精细的三维建模与逼真的人机交互
    发表于 11-03 16:46 5次下载
    基于双目立体视觉的<b class='flag-5'>三维</b>拼接和<b class='flag-5'>融合</b>方法

    如何使用单目视觉进行高精度三维场景重建技术研究

    近年来,随着计算机硬件的不断快速更新,计算机的处理能力也不断变强。同时场景三维模型的获取技术越来越成熟,我们获得场景三维模型数据的方式更多也更加方便了。而目前在基于单目和双目的
    发表于 12-24 15:55 7次下载
    如何使用单目视觉进行高精度<b class='flag-5'>三维</b><b class='flag-5'>场景</b><b class='flag-5'>重建</b>技术研究

    基于图像的三维物体重建:在深度学习时代的最新技术和趋势综述之训练

    前面几节讨论了直接从二观测重建三维对象的方法。本节展示了如何使用附加提示,如中间表示和时间相关性来促进三维重建
    发表于 01-26 19:55 5次下载
    基于图像的<b class='flag-5'>三维</b>物体<b class='flag-5'>重建</b>:在深度学习时代的最新技术和趋势综述之训练

    深度学习背景下的图像三维重建技术进展综述

    根据三维模型的表示形式可以将图像三维重建方法分类为基于体素的三维重建、基于点云的三维重建和基于网格的三维重建,其中基于网格的
    的头像 发表于 01-09 14:26 4095次阅读

    NerfingMVS:引导优化神经辐射场实现室内多视角三维重建

    既然Nerf可以表示场景三维信息,个自然的想法是能不能将NeRF应用到室内场景三维重建任务中呢。NeRF有着
    的头像 发表于 02-13 11:20 4453次阅读

    介绍一种基于图像的三维重建方法

    当前,对于场景的快速重建是重要的,目标是实现个快速的、全面的三维重建模型。可以应用于野外的林业资源保护、火灾和地震的灾后抢救、边境安防
    的头像 发表于 04-12 18:21 2494次阅读

    三维场景点云理解与重建技术

    三维场景理解与重建技术主要包含场景点云特征提取、扫描点云配准与融合场景理解与语义分割、扫描物体
    的头像 发表于 08-08 16:58 2643次阅读
    <b class='flag-5'>三维</b><b class='flag-5'>场景</b>点云理解与<b class='flag-5'>重建</b>技术

    如何实现整个三维重建过程

    在计算机视觉中,三维重建是指根据单视图或者多视图的图像重建三维信息的过程。由于单视频的信息不完全,因此三维重建需要利用经验知识,而多视图的三维重建
    发表于 09-01 11:06 2770次阅读
    如何实现整个<b class='flag-5'>三维重建</b>过程

    基于光学成像的物体三维重建技术研究

    随着计算机科学和数字成像技术的飞速发展,光学成像技术在许多领域中得到了广泛应用,其中之便是物体三维重建。物体三维重建技术是一种通过计算机处理图像数据,获得物体
    的头像 发表于 09-15 09:29 1910次阅读
    基于光学成像的物体<b class='flag-5'>三维重建</b>技术研究