0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三维高斯泼溅大规模视觉SLAM系统解析

INDEMIND 来源:INDEMIND 2025-05-27 14:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期兴起的神经辐射场(NeRF)与三维高斯泼溅(3DGS)技术在视觉SLAM中展现出令人鼓舞的突破性成果。然而,当前主流方法多依赖RGBD传感器,并且仅适用于室内环境。在大规模室外场景中的重建鲁棒性仍未得到探索。本文提出一种基于立体相机的三维高斯泼溅大规模视觉SLAM系统LSG-SLAM。通过在EuRoC数据集上的广泛评估,LSG-SLAM展示了其在大规模室外场景中的优越性能。在KITTI数据集上,LSG-SLAM达到了优于现有神经网络、基于3DGS以及传统方法的性能。

• 文章:

Large-Scale Gaussian Splatting SLAM

• 作者:

Zhe Xin, Chenyang Wu, Penghui Huang, Yanyong Zhang, Yinian Mao, Guoquan Huang*

• 论文链接:

https://arxiv.org/abs/2505.09915

• 编译:

INDEMIND

01本文核心内容

视觉SLAM是自主机器人和具身人工智能中空间智能的关键技术。从地图表示的角度来看,SLAM可分为稀疏、密集、隐式神经表示和显式体积表示。传统的稀疏和密集SLAM系统侧重于几何映射,并且严重依赖手工特征。此外,这些方法在重建(建图)过程中仅实际记录了场景中被观测到的局部区域。隐式神经表示,特别是神经辐射场(NeRF),通过可微渲染进行学习,能够生成高质量的新视角图像。然而,逐像素光线追踪仍然是渲染速度的一个重要瓶颈。此外,隐式特征由多层感知机(MLP)嵌入,可能会面临灾难性遗忘问题,且隐式场景不易于编辑。

另一方面,3D高斯泼溅(3DGS)使用高斯点显式表示场景,3D基本图形的光栅化使3DGS能够捕捉高保真度的3D场景,同时加快渲染速度。SplaTAM通过消除视图相关外观并采用各向同性高斯点来提高渲染质量。MonoGS采用以地图为中心的方法,动态分配高斯点以实现任意空间分布的建模。然而,这些方法使用简单的均匀运动模型来预测先验姿态,在视角显著变化时容易漂移。此外,它们缺乏消除累积误差的显式闭环模块,并且仅在小规模室内环境中进行了测试。

wKgZO2g1WBOATFL-AAPCu0rzXy0634.png

在本文中,我们开发了一种基于3DGS的大规模立体视觉SLAM,LSG-SLAM。这是首个专门针对大规模(室外)场景设计的3DGS-SLAM(图1)。特别是,我们采用多模态策略进行姿态跟踪,以解决帧间大视角变化的问题。在姿态优化方面,我们整合了渲染损失和特征对齐扭曲约束。前者有助于减轻由特征点引起的检测和匹配错误,而后者则缓解了外观相似性带来的不利影响。这些改进使我们的方法能够在低帧率下运行,适用于数据有限的情况。对于大规模场景中的地图构建,我们引入连续的GS子地图来处理由无界场景和有限内存引起的可扩展性问题。通过不同GS子地图中关键帧之间的位置识别,仔细检测有效的回环。利用高斯泼溅的光栅化,通过最小化渲染帧与查询关键帧之间的差异来估计回环约束,使用与跟踪相同的损失。此外,基于子地图的结构细化模块在全局姿态图和点云调整之后提高了重建质量。

本文的贡献可概括为:

• 开发了首个基于3DGS的大规模环境立体视觉SLAM系统,显著提高了跟踪稳定性、地图一致性、可扩展性和重建质量。

• 倡导高效的3DGS渲染以生成新颖视图,从而更好地进行图像/特征匹配,包括局部和全局匹配,以提升跟踪和闭环性能。

• 提出了一种基于子地图的结构细化方法,遵循全局位姿图和点云调整,以提高重建质量。

• 进行了广泛的实验验证,结果表明所提方法相较于最先进的基于3DGS的SLAM方法,能够将跟踪精度提高70%,重建质量提高50%。

02方法架构

wKgZO2g1WBOAGsw1AAPefwkdRd4682.png

所提出的LSG-SLAM是一种立体SLAM系统,它同时跟踪相机姿态并使用三维高斯点重建场景。图2描绘了整个系统架构。主要组件包括连续GS子地图的同时跟踪与建图、闭环检测以及结构优化。

03实验结果

我们使用两个知名立体数据集EuRoC和KITTI进行评估。EuRoCMAV数据集包含室内外场景,具有剧烈视角变化和大规模光照变化。大规模KITTI数据集覆盖城市、乡村和高速公路等多种场景。

A.EuRoC数据集评估

1.跟踪性能

表I显示详细对比结果,相比其他3DGS方法,LSG-SLAM在低频图像下仍显著提升跟踪精度。

wKgZPGg1WBOAeOI3AAES4kF3RfA499.png

传统模型的局限,SplaTAM与MonoGS依赖匀速运动模型,易漂移;Photo-SLAM依赖ORB特征重投影误差,但在弱纹理剧烈运动场景下易失效。

LSG-SLAM采用多模态先验估计来处理剧烈的视角变化,并将渲染损失和特征对齐扭曲约束相结合来进行位姿优化。前者减轻了由非重复特征点提取引起的误差以及弱纹理区域的影响,而后者减少了在大面积相似区域中外观相似性带来的误导效应。经过闭环优化后,LSG-SLAM不仅实现了与ORB-SLAM3相当的轨迹精度,而且在具有挑战性的场景中还表现出更高的重建成功率。

2.建图质量

表II对比渲染结果。

wKgZPGg1WBOABczDAAIF9RAgxfA459.png

我们的方法在渲染质量方面优于SplaTAM和MonoGS即使没有结构细化模块,我们的方法也能实现更精准的跟踪精度,从而减少地图结构误差。在加入结构细化模块后,重建质量有了显著提升,这表明椭球体比球体更能有效捕捉复杂的纹理细节。此外,新增的尺度正则化损失使得峰值信噪比(PSNR)高于原始的3D高斯点云法。

B.KITTI数据集评估

1.跟踪性能

表V对比位姿估计精度,我们的方法优于传统方法和基于学习的方法。

wKgZPGg1WBOAeR2pAAV_k-vQg0Q866.png

基于 3DGS 的代表性方法因内存限制无法完整处理整个序列。相比之下,通过基于连续GS子图的闭环,LSG-SLAM能够在有限资源下重建大规模场景。

在效率优势上,LSG-SLAM无需训练(PVO与DROID-SLAM需数日训练且泛化性受限)。

2.建图质量

表VI显示,我们的结构细化模块显著提高了渲染质量。

3D高斯泼溅直接优化各向异性高斯椭球体,这常常导致浮点数。相比之下,各向同性高斯球体收敛速度更快,在早期优化阶段也更不易出现浮点数。我们的方法首先使用各向同性高斯球体重建场景,学习一个良好的初始值。然后,在结构细化阶段,将球体转换为椭球体以细化物体表面细节。此过程增强了我们方法对漂浮物的抗性,从而提高了渲染质量。

04总结

本文提出了LSG-SLAM——这是首个基于3D高斯泼溅(3DGS)、专门针对大规模场景且仅使用立体相机的视觉SLAM系统。其主要组件包括连续子地图的同时跟踪与建图、闭环检测以及结构优化。所提出的LSG-SLAM显著提高了跟踪稳定性、建图一致性、可扩展性和重建质量。我们的LSG-SLAM在与传统方法和基于学习的方法的对比中达到了最先进的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2574

    文章

    54431

    浏览量

    786325
  • 机器人
    +关注

    关注

    213

    文章

    30620

    浏览量

    219698
  • 人工智能
    +关注

    关注

    1813

    文章

    49757

    浏览量

    261695
  • SLAM
    +关注

    关注

    24

    文章

    456

    浏览量

    33191

原文标题:LSG-SLAM:首个针对大规模室外场景的鲁棒视觉SLAM,超越传统与神经方法!

文章出处:【微信号:gh_c87a2bc99401,微信公众号:INDEMIND】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    三维视觉测量技术知识科普

    三维视觉测量技术按照测量过程中是否投射光源,获取被测物体三维形貌信息的方法可以分为两大类: 被动视觉测量和主动视觉测量。
    的头像 发表于 01-03 11:47 1684次阅读
    <b class='flag-5'>三维</b><b class='flag-5'>视觉</b>测量技术知识科普

    三维设计应用案例

    ,计算机三维辅助软件在机械设计的应用当中,能大大优化机械设计的质量。机械设计工作的要求比较高,通过三维辅助软件的应用就能在满足相应设计要求下,提高工作的效率。以下湃睿科技将以柳工三维辅助设计
    发表于 07-03 07:06

    基于STM32的三维旋转显示平台设计(立体成像)!!!

    暂留”( duration of vision)物体在快速运动时, 当人眼所看到的影像消失后,人眼仍能继续保留其影像0.1---0.4秒左右的图像。在空间立体物体离散化的基础上,再利用人眼视觉暂留效应,基于LED阵列的“三维
    发表于 08-27 14:59

    智能芯片的三维内存解析

    三维内存对人们生产生活方面的贡献智能芯片的三维内存
    发表于 12-24 06:54

    三维表面粗糙度高斯滤波快速算法

    三维表面粗糙度高斯滤波快速算法:研究了三维表面粗糙度评定基准的数学模型及采用高斯滤波器得到三维表面评定基准的数字算法,提出一种新的用于
    发表于 09-25 15:47 24次下载

    三维立体视觉技术的应用及其三维恢复方法介绍

    三维立体视觉与人眼立体视觉相比,具有不可替代的优点,主要体现在精度高、扩展能力强大,连续工作时间长、不易损坏、保密性好、没有培训成本、结果易于保存和复制等。因此三维立体
    发表于 10-20 11:51 5次下载

    基于双目立体视觉三维拼接和融合方法

    目前,在计算机视觉领域,越来越多的高精度三维重建方法以及实时定位和地图构建(SLAM)算法正在被提出用来对三维世界进行描述和分析。在计算机图形领域,快速和精细的
    发表于 11-03 16:46 5次下载
    基于双目立体<b class='flag-5'>视觉</b>的<b class='flag-5'>三维</b>拼接和融合方法

    基于视觉词典BOW的三维SLAM算法

    针对传统滤波器方法解决机器人同时定位与地图创建( SLAM)时的误差积累问题,提出了一种基于视觉词典(BOW)的三维SLAM算法,以有效解决机器人长时间运动下误差积累的问题。相比图优化
    发表于 12-22 14:58 2次下载

    近日奥比中光Workshop举行展示 商业空间三维数字化大规模应用前景

    近日,奥比中光Workshop系列之新商业沙龙在深圳举行,北京众趣科技创始人、CEO高翔发表了题为《商业空间三维数字化的大规模应用》演讲,展示了商业空间三维数字化的大规模应用前景。
    的头像 发表于 07-26 11:06 3730次阅读

    基于三维激光数据的层级式SLAM方法

    课题组已将该研究成果应用于智能驾驶即时定位与建图(SLAM)任务中,提出了基于三维激光数据的层级式SLAM方法,实现了无GNSS环境下智能无人系统的高精度自主定位定姿,在智能驾驶国际著
    的头像 发表于 04-20 09:19 2694次阅读
    基于<b class='flag-5'>三维</b>激光数据的层级式<b class='flag-5'>SLAM</b>方法

    其域创新手持激光雷达手持SLAM灵光Lixel,为地下停车场进行三维建模

    手持激光雷达手持SLAM设备灵光LixeL L1可通过激光点云,在光线条件较差的条件下快速进行大规模复杂地下空间采集,准确还原区域结构。光线允许的情况下还可采用视觉辅助,生成真彩三维
    的头像 发表于 01-05 11:27 3964次阅读
    其域创新手持激光雷达手持<b class='flag-5'>SLAM</b>灵光Lixel,为地下停车场进行<b class='flag-5'>三维</b>建模

    三维计算视觉研究分析

    三维计算视觉研究内容包括: 1)三维匹配 :两帧或者多帧点云数据之间的匹配,因为激光扫描光束受物体遮挡的原因,不可能通过一次扫描完成对整个物体的三维点云的获取。因此需要从不同的位置和角
    的头像 发表于 06-19 11:06 1239次阅读

    三维立体视觉三维恢复方法

    电子发烧友网站提供《三维立体视觉三维恢复方法.doc》资料免费下载
    发表于 11-03 09:31 0次下载
    <b class='flag-5'>三维</b>立体<b class='flag-5'>视觉</b>之<b class='flag-5'>三维</b>恢复方法

    多功能三维高斯

    一款YC-663三维高斯计,同时测量X、Y、Z轴方向的磁场强度分布情况。 YC-663高斯计是应用数字化集成电路技术,结合先进的模拟电子技术精心设计而成的高精度、智能型三维
    的头像 发表于 02-06 14:28 649次阅读
    多功能<b class='flag-5'>三维</b><b class='flag-5'>高斯</b>计

    一文读懂 | 三维视觉领域国家级制造业单项冠军——先临三维的品牌布局

    先临三维科技股份有限公司成立于2004年,是三维视觉领域国家级制造业单项冠军、国家专精特新“小巨人”企业。公司专注于高精度三维视觉软、硬件的
    的头像 发表于 11-11 14:55 295次阅读
    一文读懂 | <b class='flag-5'>三维</b><b class='flag-5'>视觉</b>领域国家级制造业单项冠军——先临<b class='flag-5'>三维</b>的品牌布局