0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种适用于动态环境的自适应先验场景-对象SLAM框架

INDEMIND 来源:INDEMIND 2025-08-19 14:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

由于传统视觉SLAM在动态场景中容易会出现严重的定位漂移,本文提出了一种新颖的基于场景-对象的可靠性评估框架,该框架通过当前帧质量指标以及相对于可靠参考帧的场景变化,全面评估SLAM的稳定性。同时,针对现有系统在姿态估计不可靠时缺乏误差校正机制的问题,我们采用了一种姿态精修策略,利用来自可靠帧的信息优化相机姿态估计,有效减轻动态干扰带来的不利影响。在TUM RGB-D数据集上的大量实验表明,我们的方法在具有挑战性的动态场景中,显著提高了定位精度和系统鲁棒性。

• 文章:

Adaptive Prior Scene-Object SLAM for Dynamic Environments

• 作者:

Haolan Zhang, Thanh Nguyen Canh, Chenghao Li, Nak Young Chong

• 论文链接:

https://arxiv.org/abs/2507.21709

• 编译:

INDEMIND

01 本文核心内容

目前,传统视觉SLAM已发展出两种方法:基于特征的方法,这类方法提取并匹配独特的关键点;直接法,这类方法直接对像素强度进行处理,无需中间的特征提取步骤。尽管这些方法在静态环境中效果显著,但在动态场景中,由于存在移动物体和突然的视角变化,对它们往往有着极大挑战,进而导致定位漂移。

对于动态场景导致的特征匹配错误和定位漂移。早期的解决方案侧重于几何方法,例如基于RANSAC的滤波、概率置信度评分以及基于相关性的图分割。近年来出现了更多基于运动的方法,包括结合光流和粒子滤波的PFDSLAM,以及应用K均值聚类进行静态概率估计的StaticFusion和Joint-VO-SF。这些方法在轻度动态场景中虽有效果,但难以处理大规模的动态变化。

为克服这些局限性,研究人员将深度学习技术融入其中。DS-SLAM利用SegNet进行语义滤波,DynaSLAM将Mask R-CNN与几何验证相结合。Blitz-SLAM采用两阶段方法,首先通过深度学习解析场景,然后进行几何验证。CFP-SLAM基于目标检测和运动分类进行分层处理,SG-SLAM则在基于图的框架中整合了语义理解与几何约束。

在这些方法的基础上,近期的研究探索了以目标为中心和以场景为中心的策略。研究人员提出了一种以目标为中心的方法,该方法基于不确定性、观测质量和先验信息评估质量,并实施双重耦合——高质量目标有助于相机姿态估计,而低质量目标仅在后续进行跟踪。

然而,以目标为中心的方法存在一些问题:固定的质量阈值无法适应场景变化;逐帧评估忽略了时间一致性;且缺乏误差校正机制。又有研究人员提出了一种以场景为中心的方法,该方法利用先验运动信息来增强时间一致性,但它难以应对突然的运动变化,由于依赖前一帧而存在跳过关键帧的风险,并且可能将低运动场景误分类为静态场景。

为克服以目标为中心和以场景为中心这两种方法的局限性,我们基于ORB-SLAM3提出了一种适用于动态环境的自适应先验场景-对象SLAM框架。

本文的贡献可概括为:

一种场景-对象质量评估机制,该机制整合了基于帧的指标和动态变化评估,以实现可靠的场景评估。

一种自适应基准更新策略,该策略基于场景质量不断优化参考标准。

一种直接融合方法,用于修正问题帧中的姿态估计误差,从而增强鲁棒性。

在TUM RGB-D数据集上进行了大量实验验证,证明该方法在定位精度和鲁棒性方面有显著提升。

02 方法架构

我们提出的流程(图1)通过一个自适应框架处理RGB-D图像,以在动态环境中实现稳健定位。该框架结合特征提取、语义分割和Lucas-Kanade光流来识别动态对象。我们的方法包含两个关键组件:场景-对象质量评估机制和姿态精修策略。质量评估用于建立基准标准,根据基准对帧进行评估,并随着环境条件的变化动态更新基准。当帧不可靠时,精修策略采用直接法来校正姿态估计,从而在动态场景中保持稳健性。

f2f978b8-796c-11f0-a18e-92fbcf53809c.png

A. 场景-对象质量评估机制

1) 初始化:场景-对象质量评估机制以初始化阶段为开端,旨在建立可靠的基准标准。我们的系统使用四个指标来量化帧质量:对象置信度得分(Sconf),用于衡量所有对象的检测置信度;空间分布得分(Sspatial),用于评估对象在帧内的大小和位置;特征质量得分(Sfeature),用于评估特征响应强度和分布均匀性;以及深度质量得分(Sdepth),用于分析深度覆盖范围、一致性和平滑度。初始整体质量的计算公式为:

f306f9f2-796c-11f0-a18e-92fbcf53809c.png

初始化阶段通过分析初始帧中的对象置信度、空间分布、特征质量和深度信息,为场景评估建立基准。得分最高的帧将成为我们的参考基准,同时设置自适应初始化阈值,可随环境条件的变化进行调整以保持相关性。

2) 场景决策:初始化之后,我们的系统会对每个输入帧进行评估,以确定场景的可靠性。最终的场景质量得分结合了当前帧质量评估(Stotal)和相对于参考帧的变化评估(Schange):

f3136e44-796c-11f0-a18e-92fbcf53809c.png

B. 姿态精修策略

当某一帧根据我们的质量评估被归类为问题帧时,我们会采用直接法来精修相机姿态估计。与依赖稀疏对应关系的基于特征的方法不同,我们的方法利用来自强度图像和深度图像的稠密信息,使其在具有挑战性的场景中更具鲁棒性。

03 实验结果

我们在TUM RGB-D数据集上对所提方法进行了评估,该数据集广泛用于动态环境下SLAM系统的基准测试。

A. 场景-对象质量评估机制的评估

在fr3/w/rpy序列的900帧中,我们的评估机制识别出30帧问题帧。如图2所示,这些问题帧出现在相机朝向特征稀少的天花板(a)或快速滚转旋转时(b)。这些结果表明,我们的评估机制能够有效识别传统基于特征的方法容易失效的帧。所提出的质量指标成功捕捉到了几何约束(如天花板视图中的稀疏特征)和动态挑战(如快速旋转导致的运动模糊),验证了我们方法的鲁棒性。

f31e395a-796c-11f0-a18e-92fbcf53809c.png

B. 与最先进方法的比较

图3展示了我们的系统与ORB-SLAM3在TUM RGB-D数据集上的结合效果。左图呈现了当前帧以及正在运行的场景-对象质量评估,其中动态对象(如人)被检测到(绿色边界框)、分割(红色掩码),并使用Lucas-Kanade光流进行估计,以减轻其对姿态估计的影响。场景质量得分(0.36)和帧评估结果(GOOD SCENE)显示在左上角,同时还有各项质量指标:置信度(Sconf)、空间分布(Sspatial)和特征质量(Sfeature),以白色文本显示。右图展示了ORB-SLAM3的稀疏建图结果,包括三维点云和相机姿态。这一可视化结果凸显了我们的框架如何通过改进场景质量评估和处理动态对象来增强ORB-SLAM3的性能,使其在复杂环境中能够实现更稳健的跟踪。

f3305a86-796c-11f0-a18e-92fbcf53809c.png

我们将所提系统与几种基于ORB-SLAM2的动态环境下最先进的SLAM方法进行了对比,包括DynaSLAM、Blitz-SLAM和SG-SLAM。表I给出了平移和旋转方面的绝对轨迹误差(ATE)和相对姿态误差(RPE)结果。如表I所示,我们的方法在ATE性能上具有竞争力,在帧间一致性方面表现优异,并且在大多数序列的平移和旋转RPE上始终优于竞争方法。值得注意的是,在具有复杂相机运动的挑战性场景中,我们的系统保持了较高的相对姿态精度,这表明我们的场景质量评估和姿态精修策略在动态环境中是有效的。

我们还将所提系统与基于ORB-SLAM3的DN-SLAM进行了评估,结果如表II所示。在动态序列上,我们的方法相比ORB-SLAM3将ATE降低了92%-97%,在绝对轨迹精度上与DN-SLAM相当,而在相对姿态性能上更优,特别是在具有挑战性的fr3/w/rpy序列中(均方根误差:0.025对0.065)。这些结果证明了我们的质量评估和姿态精修策略的有效性。图4对比了ORB-SLAM3(上)和我们的方法(下)在四个TUM序列上的估计轨迹,包含三种线条类型:真实轨迹(黑线)、估计轨迹(蓝线)和误差(红线)。我们的方法表现出更优的跟踪精度,在所有序列中均降低了误差。在fr3/w/xyz序列中,它与真实轨迹几乎完美对齐;在动态条件下的fr3/w/halfsphere和fr3/w/rpy序列中,能够准确跟踪复杂运动。

f34037da-796c-11f0-a18e-92fbcf53809c.png

我们的实验证实,我们的场景质量评估和姿态精修策略提升了动态环境下的SLAM性能。在实现具有竞争力的绝对轨迹精度的同时,我们的方法在帧间一致性方面表现突出,这体现在大多数序列的RPE指标上均更优。

04 总结

在本文中,我们提出了一种适用于动态环境的自适应先验场景-对象SLAM框架。我们的质量评估机制能够有效识别问题帧,而当传统方法失效时,我们的直接姿态精修策略可对跟踪误差进行校正。实验结果表明,与最先进的方法相比,我们的方法有显著改进,尤其是在保持稳定跟踪方面。

在未来的工作中,我们计划通过整合线特征和平面特征来增强系统性能,以改进质量评估,特别是在纹理稀疏的环境中。我们还旨在基于数据关联开发一种针对优质帧和劣质帧的全局时间管理策略,实现对整个轨迹的全面优化,而不仅仅是帧间的精修。这些改进将进一步提升系统在复杂动态场景中的鲁棒性,并支持更长期的一致性建图。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SLAM
    +关注

    关注

    24

    文章

    455

    浏览量

    33183
  • 视觉
    +关注

    关注

    1

    文章

    171

    浏览量

    24710

原文标题:超越现有方法!针对动态环境的自适应先验场景-对象VSLAM,实现实时评估和误差校正

文章出处:【微信号:gh_c87a2bc99401,微信公众号:INDEMIND】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一种适用于模拟/数字混合信号环境的接地技术

    本文分享了一种适用于模拟/数字混合信号环境的接地技术。
    发表于 04-25 07:46

    一种适用于室内复杂环境的高精度、环境自适应性强的定位算法

    摘要对于室内复杂环境来说, 适用于室外定位的 GPS 系统和蜂窝移动网络在室内中的定位精度明显恶化, 无法满足室内用户精确定位的需求。因此, 研究一种适用于室内复杂
    发表于 08-18 08:12

    一种适用于嵌入式系统的模块动态加载技术

    嵌入式系统中的模块动态加载技术摘要提出一种适用于嵌入式系统的模块动态加载技术,设计实现简单,占用资源少,开销小,并且成功运用于DeltaOS
    发表于 12-20 06:32

    一种新的非白化滤波的自适应反卷积

    提出了一种新的自适应预测反卷积的方法:基于知识的自适应滤波(NBA,knowledge based Adaptive filter)。采用该法可以将先验的波形知识与
    发表于 05-09 13:22 11次下载

    一种自适应减载策略适用于高风点渗透下的电网

    针对风电迅猛发展和电源结构发生深刻变化的新形势,详细论述了高风电渗透率对低频减载实施效果的影响,并计及主要影响因素提出一种自适应减载策略以适用于高风电渗透下的电网。该策略通过对不平衡功率实施
    发表于 01-02 13:53 15次下载
    <b class='flag-5'>一种</b><b class='flag-5'>自适应</b>减载策略<b class='flag-5'>适用于</b>高风点渗透下的电网

    一种适用于动态场景SLAM方法

    同时定位与地图构建(SLAM)作为机器人领域的硏究热点,近年来取得了快速发展,但多数SLAM方法未考虑应用场景中的动态或可移动目标。针对该问题,提出
    发表于 03-18 10:39 21次下载
    <b class='flag-5'>一种</b><b class='flag-5'>适用于</b><b class='flag-5'>动态</b><b class='flag-5'>场景</b>的<b class='flag-5'>SLAM</b>方法

    关于推出适用于设备端推荐的自适应框架

    发布人:Ellie Zhou、Tian Lin、Shuangfeng Li 以及 Sushant Prakash 简介和动机 我们非常高兴地宣布推出一种自适应框架用于使用您自己的数据
    的头像 发表于 06-15 17:55 2258次阅读

    一种适用于Ad+hoc网络的DCF协议自适应功率控制机制

    一种适用于Ad+hoc网络的DCF协议自适应功率控制机制(村田电源技术论坛)-摘 要:该文对载波检测无线网络中的冲突干扰问题进行了分析,在此基础上提出了一种
    发表于 09-17 16:27 1次下载
    <b class='flag-5'>一种</b><b class='flag-5'>适用于</b>Ad+hoc网络的DCF协议<b class='flag-5'>自适应</b>功率控制机制

    一种基于直接法的动态稠密SLAM方案

    基于特征点法的视觉SLAM系统很难应用于稠密建图,且容易丢失动态对象。而基于直接法的SLAM系统会跟踪图像帧之间的所有像素,因此在
    的头像 发表于 03-13 09:38 1945次阅读

    用于神经场SLAM的矢量化对象建图

    vMAP 是一种基于神经场的对象级密集 SLAM 系统,可根据 RGB-D 输入流实时自动构建对象场景模型。
    的头像 发表于 06-15 09:29 1492次阅读
    <b class='flag-5'>用于</b>神经场<b class='flag-5'>SLAM</b>的矢量化<b class='flag-5'>对象</b>建图

    适用于智能行业的自适应视觉计数器

    电子发烧友网站提供《适用于智能行业的自适应视觉计数器.zip》资料免费下载
    发表于 07-13 10:07 0次下载
    <b class='flag-5'>适用于</b>智能行业的<b class='flag-5'>自适应</b>视觉计数器

    一种适用于动态场景的多层次地图构建算法

    本文提出了一种适用于动态场景的多层次地图构建算法,如图1所示的系统框架。首先,利用YOLOX[8]获取
    发表于 08-28 10:56 1239次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>适用于</b><b class='flag-5'>动态</b><b class='flag-5'>场景</b>的多层次地图构建算法

    一种适用于动态环境的实时视觉SLAM系统

    既能保证效率和精度,又无需GPU,行业第个达到此目标的视觉动态SLAM系统。
    的头像 发表于 09-30 14:35 1954次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>适用于</b><b class='flag-5'>动态</b><b class='flag-5'>环境</b>的实时视觉<b class='flag-5'>SLAM</b>系统

    一种适用于动态环境的3DGS-SLAM系统

    当前基于神经辐射场(NeRF)或3D高斯泼溅(3DGS)的SLAM方法在重建静态3D场景方面表现出色,但在动态环境中的跟踪和重建方面却面临着挑战。
    的头像 发表于 06-13 10:10 984次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>适用于</b><b class='flag-5'>动态</b><b class='flag-5'>环境</b>的3DGS-<b class='flag-5'>SLAM</b>系统

    一种适用于动态环境的实时RGB-D SLAM系统

    了UP-SLAM,这是一种适用于动态环境的实时RGB-D SLAM系统。实验结果表明,UP-
    的头像 发表于 07-04 15:14 956次阅读
    <b class='flag-5'>一种</b><b class='flag-5'>适用于</b><b class='flag-5'>动态</b><b class='flag-5'>环境</b>的实时RGB-D <b class='flag-5'>SLAM</b>系统