0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

最新图优化框架,全面提升SLAM定位精度

3D视觉工坊 来源:3D视觉工坊 2024-11-12 11:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

0. 这篇文章干了啥?

同时定位与地图构建(SLAM)是一项关键技术,允许移动机器人在部分或完全未知的环境中自主导航。它包括使用机载传感器同时估计机器人状态和构建传感器检测到的环境地图。SLAM可以根据传感器和地图构建技术的类别进行分类,如视觉SLAM、激光SLAM、惯性SLAM等。

解决SLAM问题的经典方法可以分为基于滤波的方法和基于图的方法。在1986年提出SLAM问题的前二十年里,基于概率公式的滤波方法已经实现了准确的估计。然而,在大规模问题中更新协方差矩阵在计算上是昂贵的。基于图的方法最早由Lu和Milios在1997年引入,随着图的增长,计算成本较低。随着计算能力的提高,基于图的SLAM的优化算法相比经典的滤波方法(如扩展卡尔曼滤波、Rao-Blackwellized粒子滤波和信息滤波)获得了广泛关注。Wilbers等人展示了基于图的方法在定位方面比粒子滤波具有更高的精度。

姿态图优化(PGO)可以建模为一个非凸优化问题,是基于图的SLAM的基础,其中它将每个姿态与一个顶点关联,将每个测量与图的一条边关联,需要从有噪声的相对测量中估计多个未知姿态。在三维空间中的姿态通常包括旋转和平移,旋转可以使用欧拉角、轴角(so(3))、特殊正交群(SO(3))或四元数(Q)表示,平移由一个三维向量t指定。此外,整体姿态还可以使用特殊欧氏群(SE(3))、李代数(se(3)或双四元数(DQ)表示。不同的建模方法会产生不同的约束,如在se(3)中没有约束,在SE(3)中有矩阵正交和行列式约束,或在Q中有球面约束。选择与问题结构兼容的简单表示将导致一个更容易解决和更准确的模型。

在过去的二十年中,许多模型已经根据噪声的不同统计分布和姿态表示方法得到了发展。同时,也提出了许多高效的优化算法来解决这些模型。从模型的角度来看,旋转噪声的统计分布通常分为高斯分布或各向同性的冯米塞斯-费舍尔(vMF)分布,而平移噪声统一表现为高斯噪声。基于最大似然估计,在se(3)上的高斯噪声可以直接导出一个无约束的非线性最小二乘模型。同样,Cheng等人建立了基于单位双四元数的最小二乘模型,并提出了一种更有效的方法来计算雅可比矩阵。通过消除两个变量,他们的模型也是无约束的。另一种建模方法使用SO(3)表示旋转,假定其服从vMF分布,并导出具有正交和行列式约束的模型。由于se(3)需要转换来描述运动过程,用SO(3)或Q和一个三维向量表示的目标函数的表达式相比无约束模型更简洁;然而,约束的引入增加了挑战。

从算法的角度来看,提出了几种高效且准确的方法来解决SLAM中的大规模问题。诸如随机梯度下降等一阶优化方法可以减少梯度计算的复杂性,并有效地解决无约束优化问题。收敛速度更快的算法,如高斯-牛顿方法、Levenberg--Marquardt方法、信赖域方法也被引入来解决该问题。与计算矩阵逆不同,使用QR或Cholesky分解等矩阵分解技术来降低复杂性,并提出了增量版本。Grisetti等人和Wagner等人提出了基于流形的高斯-牛顿算法,其中雅可比矩阵具有稀疏结构,更新过程避免了大规模线性方程系统的昂贵存储。

然而,二阶算法仅在局部区域具有快速收敛率,对于非凸问题通常返回局部极小值。后来的工作集中于找到更好的初始点并确认解的最优性。Rosen等人提出了一种基于Powell的Dog-Leg信赖域方法的稳健增量最小二乘估计,并提高了数值稳定性。Carlone等人通过检查对偶间隙推导了一个带约束的二次规划并验证了最优解。通过扩展可行集到其凸闭包,一种凸松弛方法有效地克服了非凸问题初始点选择的难题。此外,Rosen等人将模型松弛为一个半定规划,并证明了只要噪声低于某个临界阈值,其松弛的最小化结果提供了一个精确的最大似然估计。Fan和Murphey提出了PGO的一个上界,并通过广义近端方法解决它,该方法可以收敛到一阶临界点且不依赖于黎曼梯度。另一种找到更好局部极小值或全局极小值的方法依赖于初始化技术。他们指出非凸旋转估计是SLAM困难的真正原因,平移对旋转估计影响较小。因此,计算一个好的旋转估计将提高算法的性能。

我们提出了一种非凸姿态图优化的近端线性化黎曼交替方向乘子法(PieADMM),它使用最新的部分信息更新其他变量。我们的子问题不仅具有闭式解,而且可以并行计算,从而使每次更新的时间复杂性较低。这一优势在大规模数值实验中得到了验证。从理论上讲,收敛性分析补充了我们的发现。

下面一起来阅读一下这项工作~

1. 论文信息

标题:Non-convex Pose Graph Optimization in SLAM via Proximal Linearized Riemannian ADMM

作者:Xin Chen, Chunfeng Cui, Deren Han, Liqun Qi

机构:北京航空航天大学

原文链接:https://arxiv.org/abs/2404.18560

2. 摘要

位姿图优化 (PGO) 是解决基于位姿的同时定位与地图构建 (SLAM) 问题的一种著名技术。在本文中,我们使用单位四元数和三维向量表示旋转和平移,并提出了一种基于冯·米塞斯-费舍尔分布的新型 PGO 模型。从单位四元数导出的约束是球面流形,投影到这些约束上可以通过归一化来计算。然后,我们开发了一种近端线性化黎曼交替方向乘子法 (PieADMM) 来解决所提出的模型,该方法不仅具有低内存需求,而且可以并行更新位姿。此外,我们建立了 PieADMM 以 O(1/ϵ²) 的迭代复杂度找到我们模型的 ϵ-驻点解。通过对两个合成数据集和四个 3D SLAM 基准数据集的数值实验,展示了我们所提出算法的效率。

3. 效果展示

首先,我们使用不同的算法测试n = 100,m = 100的环形数据集。图2显示了当σr = 0.01,σt = 0.05,并采用弦初始化时的俯视轨迹,三种方法在视觉上收敛于相同的解。我们还测试了里程计猜测初始化技术。由于恢复的轨迹几乎重叠,并且很难观察出差异,我们将它们省略了。

8a154fac-9056-11ef-a511-92fbcf53809c.jpg

相反,我们在图3中报告了优化过程,记录了在不同方法和初始化技术下,Rel.Err和NRMSE的下降趋势以及CPU时间。由于我们的PieADMM能够针对每个顶点并行更新,因此它可以比其他方法更快地收敛。此外,弦初始化可以在旋转更新后给出平移的估计,这提供了比其他方法更准确的初始点。在此初始化下,我们的PieADMM可以收敛到具有较低相对误差的解。与里程计猜测初始化相比,我们的PieADMM通常不如mG-N的前几步准确,但随着迭代的进行,它可以实现略微更好的性能。因此,我们将弦初始化作为下一步实验中的标准初始化技术。

8a3a627e-9056-11ef-a511-92fbcf53809c.jpg

4. 主要贡献

(i) 我们提出了一种基于增强单位四元数和vMF分布的非凸姿态图优化模型,其中数据存储成本低,单位四元数的投影可以通过归一化计算。

(ii) 我们提出了一种PieADMM,其子问题具有闭式解,并且可以并行更新。

(iii) 基于流形上的一阶最优条件,我们定义了模型的一个ϵ-驻点解。然后,我们建立了PieADMM在找到ϵ-驻点解时的迭代复杂度O(1/ϵ2)。

(iv) 我们在两个不同数据规模的合成数据集和四个三维SLAM基准数据集上测试了我们的算法。数值实验验证了我们方法的有效性。

5. 基本原理是啥?

8a7e2914-9056-11ef-a511-92fbcf53809c.jpg

8aa9f4ea-9056-11ef-a511-92fbcf53809c.jpg

6. 实验结果

我们在额外的噪声水平下比较这些算法,并在表II中列出了关于Rel.Err、NRMSE和CPU时间的数值结果。我们发现PieADMM花费更少的时间并且获得更好的结果。

8add2a5e-9056-11ef-a511-92fbcf53809c.jpg

我们还测试了姿态数量n的影响。实际上,由于我们限制了机器人轨迹的范围,同等级别的噪声将在顶点数量增加时产生更大的影响。因此,在比较不同n的数据大小的影响时,我们使用相对噪声水平作为统一标准,这意味着σr = 100 × σrelr / n和σt = 100 × σrelt / n。结果如图4所示。图4a和4b显示了PieADMM的性能平稳,有时略优于其他两种方法。然而,PieADMM的运行时间增加速度比它们慢得多,参见图4c。这是因为n的规模几乎不影响旋转子问题的成本,它可以并行计算。此外,平移子问题仅涉及矩阵乘法,并且不依赖于矩阵的逆。

8b2269a2-9056-11ef-a511-92fbcf53809c.jpg

对于立方体数据集,让σt = σrelt /ˆn,其中σrelt表示平移的相对噪声水平。我们首先考虑了ˆn = 5或8,σr = 0.1,σrelt = 0.1和pcube = 0.3的两个例子。图5a和5d显示了真实轨迹,其中蓝线由运动产生,红色虚线由观测产生。图5b、5c和5e、5f分别是对应于不同ˆn的嘈杂和恢复的轨迹。图6显示了Rel.Err随着CPU时间的下降趋势,其中我们省略了图像的上半部分以突出显示细节。由于PGO模型是非凸的,而PieADMM是非单调的算法,曲线可能会振荡。然而,它总是在更短的时间内收敛到更高精度的解。

8b4d44ba-9056-11ef-a511-92fbcf53809c.jpg

8b8513a4-9056-11ef-a511-92fbcf53809c.jpg

我们还从2到10选择ˆn,并在表III中展示了数值结果。图7a显示了立方体数据集的边缘和顶点数量之间的关系,图7b和7c说明了速度随着ˆn的增加而上升的趋势。mG-N和mL-M的成本增长都是立方的,而PieADMM的增长速度较慢。

8ba83f3c-9056-11ef-a511-92fbcf53809c.jpg

8bdbe738-9056-11ef-a511-92fbcf53809c.jpg

我们测试了一些流行的3D SLAM数据集。车库数据集是一个大规模的真实世界示例,另外三个(球1、球2和环面)是用来比较性能的常见数据集。与球1数据集不同,球2数据集添加了更大的噪声。我们还使用弦初始化技术为所有方法计算了一个初始点。图8显示了轨迹的视觉结果,相应的数值结果列在表IV中。值得注意的是,我们的旋转模型是基于vMF分布而不是传统的高斯分布,因此恢复的解不相同,并且比较目标函数值或梯度是没有意义的。我们在表中显示了CPU时间,表明PieADMM收敛速度比mG-N和mL-M快。

8c19b3b0-9056-11ef-a511-92fbcf53809c.jpg

8c5e9822-9056-11ef-a511-92fbcf53809c.jpg

7. 总结

在SLAM中的位姿图优化是一种特殊的非凸优化,其中变量通常位于se(3)中,具有非线性目标函数,或在具有正交约束的特殊欧几里得群中。复杂的模型使得找到全局解变得困难。本文提出了一种基于增强单位四元数和冯米塞斯-费舍尔分布的新非凸位姿图优化模型,这是一个在单位球面上的大规模四次多项式优化。通过引入辅助变量,我们将其重新表述为多二次多项式优化、多线性最小二乘问题。然后,我们引入了一个针对PGO模型的近端线性化黎曼ADMM,其中子问题是简单的投影问题,并且可以根据有向图的结构并行解决,从而大大提高了效率。然后,基于我们PGO模型满足的Lipschitz梯度连续性假设和流形上的一阶最优性条件,我们建立了找到ε驻点解的迭代复杂度为O(1/ϵ²)。在两个具有不同数据规模和噪声水平的合成数据集以及四个3D SLAM基准数据集上的数值实验验证了我们方法的有效性。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97156
  • SLAM
    +关注

    关注

    24

    文章

    456

    浏览量

    33189
  • 数据集
    +关注

    关注

    4

    文章

    1231

    浏览量

    26050

原文标题:超越L-M和G-N!最新图优化框架!全面提升SLAM定位精度!

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    什么是激光雷达 3D SLAM技术?

    (SimultaneousLocalizationandMapping)即时定位与建,通俗来讲,就是让智能设备在未知环境中同步完成自身位置测算与周边环境地图构建。这两个过程互为支撑,既是机器人自主
    的头像 发表于 12-02 19:23 104次阅读
    什么是激光雷达 3D <b class='flag-5'>SLAM</b>技术?

    蓝牙定位技术原理:从BLE信号到高精度定位的实现逻辑

    蓝牙定位凭借低成本、低功耗与高兼容性,依托BLE信号实现从粗略到高精度定位。通过RSSI、ToF测距与AoA/AoD测向技术,结合多基站协同和算法优化,可实现米级乃至厘米级
    的头像 发表于 11-24 17:50 1646次阅读
    蓝牙<b class='flag-5'>定位</b>技术原理:从BLE信号到高<b class='flag-5'>精度</b><b class='flag-5'>定位</b>的实现逻辑

    AGV中IGPS定位精度提升方法

    领域的核心导航技术。以下是提升 IGPS 定位精度的系统方法: 一、硬件系统优化 1.  IGPS 基站布局优化 多基站交叉覆盖 :部署 4
    的头像 发表于 11-21 11:07 197次阅读

    Swift Navigation与导远科技合作打造高精度卫星定位解决方案

    的 Skylark 精密定位服务实现全面兼容。Skylark 是一种基于云的服务,可将 GPS 等标准全球导航卫星系统(GNSS)的精度从数米提升至数厘米。
    的头像 发表于 11-06 16:07 448次阅读

    毫米级定位+全场景记录:铁路高精度定位工作记录仪助力铁路线路巡查

    铁路高精度定位工作记录仪通过毫米级定位与全场景记录技术,实现了铁路线路巡查的智能化升级,显著提升了巡检效率、安全性和数据可靠性,成为保障铁路安全运营的关键工具。云翎智能高
    的头像 发表于 10-20 22:02 209次阅读
    毫米级<b class='flag-5'>定位</b>+全场景记录:铁路高<b class='flag-5'>精度</b><b class='flag-5'>定位</b>工作记录仪助力铁路线路巡查

    智能铁路新基建:云翎智能高精度定位仪如何重构巡检作业安全效率双提升

    云翎智能高精度定位仪以厘米级多源融合定位为核心,构建‘人-机-环-管’主动安全防护体系,通过智能预警与数字孪生管理,实现站场巡检安全风险降低60%、效率提升40%,重塑铁路运维从‘经验
    的头像 发表于 10-15 22:34 216次阅读
    智能铁路新基建:云翎智能高<b class='flag-5'>精度</b><b class='flag-5'>定位</b>仪如何重构巡检作业安全效率双<b class='flag-5'>提升</b>

    一种适用于动态环境的自适应先验场景-对象SLAM框架

    由于传统视觉SLAM在动态场景中容易会出现严重的定位漂移,本文提出了一种新颖的基于场景-对象的可靠性评估框架,该框架通过当前帧质量指标以及相对于可靠参考帧的场景变化,
    的头像 发表于 08-19 14:17 646次阅读
    一种适用于动态环境的自适应先验场景-对象<b class='flag-5'>SLAM</b><b class='flag-5'>框架</b>

    一种适用于动态环境的实时RGB-D SLAM系统

    近期用于视觉SLAM的3D高斯泼溅(3DGS)技术在跟踪和高保真建方面取得了显著进展。然而,其顺序优化框架以及对动态物体的敏感性限制了其在现实场景中的实时性能和鲁棒性。为此,我们提出
    的头像 发表于 07-04 15:14 992次阅读
    一种适用于动态环境的实时RGB-D <b class='flag-5'>SLAM</b>系统

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    相机标定是视觉系统的基石,直接影响后续图像处理的精度。书中详细介绍了单目和双目相机的标定流程,包括标定板的使用、参数优化以及标定文件的应用。 实际应用中,标定误差可能导致机器人定位偏差,因此标定过程
    发表于 05-03 19:41

    室内智能指路牌的定位精度能达到多少

    。精准的定位能帮助人们迅速找到目的地,节省时间与精力,提升空间的使用效率。那么,室内叁仟智能指路牌的定位精度究竟能达到何种程度?接下来,我们从定位
    的头像 发表于 04-01 10:37 627次阅读

    锂电池MES系统:全面优化生产流程,提升质量与效率

    万界星空科技锂电池MES系统通过生产计划管理、生产过程监控、质量管理、设备管理和数据采集与分析等功能,实现了生产过程的全面优化和管理。这些功能相辅相成,共同提升了锂电池生产的效率和质量。
    的头像 发表于 02-06 13:53 821次阅读
    锂电池MES系统:<b class='flag-5'>全面</b><b class='flag-5'>优化</b>生产流程,<b class='flag-5'>提升</b>质量与效率

    UWB高精度定位技术在智能仓储中的应用

    UWB高精度定位系统结合RFID和ERP软件,优化仓储管理,实现厘米级定位、抗干扰、低功耗安全,提升仓储效率40%,减少误差,未来应用场景更
    的头像 发表于 01-22 17:30 1031次阅读

    厂区人车定位用哪个定位方案好

    厂区人车定位不仅是保障生产安全、优化资源配置的基础,更是推动智能制造、提升运营效率的关键环节。但传统的人车定位方案往往难以全面满足厂区复杂多
    的头像 发表于 12-19 10:36 784次阅读
    厂区人车<b class='flag-5'>定位</b>用哪个<b class='flag-5'>定位</b>方案好

    SSM框架的性能优化技巧 SSM框架中RESTful API的实现

    SSM框架的性能优化技巧 SSM(Spring + Spring MVC + MyBatis)框架的性能优化提升Java Web应用性能的
    的头像 发表于 12-17 09:10 1125次阅读

    用于SLAM中点云地图综合评估的开源框架

    SLAM中评估大规模的点云地图仍颇具挑战,主要原因在于缺乏统一、稳健且高效的评估框架。本文提出了MapEval,这是一个用于点云地图综合评估的开源框架。在模拟数据集和真实世界数据集上开展的大量实验
    的头像 发表于 12-13 11:18 1404次阅读
    用于<b class='flag-5'>SLAM</b>中点云地图综合评估的开源<b class='flag-5'>框架</b>