0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过场景landmark做定位的新思路(CVPR 2022)

3D视觉工坊 来源:3D视觉工坊 作者:3D视觉工坊 2022-12-16 11:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

主要内容:提出了一种基于学习的相机定位算法,其无需存储图像特征和场景三维点云,降低了存储限制,通过识别场景中稀疏但显著有代表性的landmark来找到2D-3D对应关系进行后续的鲁棒姿态估计,通过训练检测landmark的场景特定的CNN来实现所提出的想法,即回归输入图像中对应landmark的2D坐标。

634694fc-7ce5-11ed-8abf-dac502259ad0.png

创新点与Contributions:1)与大多数landmark通常可见的人体姿态估计不同,由于相机视野有限并且无法同时观察场景的不同部分,相机姿态估计任务中大多数场景landmark不会同时可见,文章通过提出一种新的神经方位估计器(Neural Bearing Estimator,NBE)来解决这一问题,该估计器可以直接回归相机坐标系中场景landmark的3D方位向量,NBE学习全局场景表示的同时学习预测场景landmark的方向向量,即使它们不可见。 2)提出了一个新的室内定位数据集,INDOOR-6,相对于传统的7-Scenes室内数据集,包含更多变化的场景、昼夜图像和强烈的照明变化 3)与现有的无存储定位方法相比,具有低存储的优点且性能较好 文章提出了两种预测图像中场景landmark的方法,在第一种方法中训练了一个模型来识别图像中的2D场景地标,称之为场景地标检测器(SLD),由于假设已知的相机内参,这些2D检测可以转换为3D方位矢量或射线。在第二种方法中训练了一个不同的模型直接预测相机坐标系中landmark的3D方位向量,称之为神经方位估计器(NBE)。注:使用SLD,只能检测到相机视场(FoV)中可见的landmark,而NBE预测所有landmark的方位,包括相机视场外不可见的landmark。

63d732a0-7ce5-11ed-8abf-dac502259ad0.png

首先会有一个SFM构建的点云模型,会在这些点云中挑选出有代表性的点云子集,用这些子集以及建图时SFM算法生成的数据库图像的伪真值来训练两个提出的网络模型。SLD:SLD被设计为将RGB图像I作为输入并输出一组像素似然图(热图)表示每个可见地标的位置,其模型架构如下:

68351844-7ce5-11ed-8abf-dac502259ad0.png

由四个主要组件组成:使用ResNet-18为backbone,删除最后三个最大池化层以保留高分辨率特征图(输出分辨率为输入图像分辨率的四分之一),其次在ResNet-18之后使用扩张卷积块,扩张率设置为1、2、3和4,接下来转置卷积层执行上采样,并负责生成分辨率为输入图像一半的热图,最后一层由1×1卷积组成,预测L个热图通道,每个地标一个。 训练损失:

684cdd6c-7ce5-11ed-8abf-dac502259ad0.png

在推断过程中,假设当其最大热图值超过阈值τ=0.2时表明检测到地标,利用亚像素精度计算热图峰值位置处裁剪的17×17 patch的期望值。NBE:设计了一个模型在给定图像I的情况下回归全部场景landmark(即使它不可见)的方位向量。 CNN将图像I作为输入以生成深度特征图,然后是多个MLP(多层感知器)块,每个块输出指向landmark的方向向量,MLP包含两个全连接层,具有128个ReLU激活节点。

686f7782-7ce5-11ed-8abf-dac502259ad0.png

6899dd88-7ce5-11ed-8abf-dac502259ad0.png

训练好两个模型后,将每个查询图像输入SLD网络以获得2D检测,然后根据内参将其转换为一组landmark方位向量B1,如果检测到超过八个场景landmark,使用鲁棒最小解算器(P3P+RANSAC)计算相机姿态,然后使用基于Levenberg-Marquardt的非线性细化。如果没有8个,将相同的图像输入NBE网络并获得预测方位B2,然后合并方位估计B1和B2的集合以形成新的集合B3,当集合B1和B2中的方位指向同一地标时,保留来自B1的估计,因为SLD通常比NBE更准确。最后使用上面描述的相同过程但使用B3计算相机姿态。如何从点云中选择有代表性的场景landmark提供给网络进行训练?从SfM点云P中找到L个场景landmark的最佳子集是一个组合问题,其中评估每个子集都是困难的。本文受之前以贪婪的方式寻找有区别的关键点或场景元素工作的启发,去选择鲁棒性(具有更长的轨迹)、可重复性(在多个场景中看到)和可概括性(从许多不同的观看方向和深度观察)的场景landmark,测量轨迹长度大于阈值t的3D点x的显著性得分A(x),如下所示:

68d42042-7ce5-11ed-8abf-dac502259ad0.png

除了最大化总体显著性得分之外还寻找在空间上覆盖3D场景的场景landmark以便从场景内的任何地方都可以看到一些地标,例如无论摄像机在场景中的哪个位置都希望一些地标可见。为此使用算法1中描述的约束贪婪方法

68e57806-7ce5-11ed-8abf-dac502259ad0.png

下图表述一些挑选到的landmark在二维图像中的投影的裁剪patch

68fb4a1e-7ce5-11ed-8abf-dac502259ad0.png

实验:训练模型的细节可去论文中查看 实验数据集是在自己提出的INDOOR-6数据集和7Scenes数据集上

69223e26-7ce5-11ed-8abf-dac502259ad0.png

评估了单独使用NBE, SLD,联合使用NBE+SLD, NBE+SLD(E)(是更紧凑的网络),和SOTA的基于分层定位方法结合HLoc+SLD Baseline为Posenet、DSAC、HLoc 在INDOOR-6数据集上的结果:

697d9d3e-7ce5-11ed-8abf-dac502259ad0.png

69c240b0-7ce5-11ed-8abf-dac502259ad0.png

存储比较和消融研究:

6a35e38a-7ce5-11ed-8abf-dac502259ad0.png

7Scenes数据集上的实验结果:

6a53983a-7ce5-11ed-8abf-dac502259ad0.png

总结:算法是一种存储要求低但精度高的方法。主要见解是在人和物体姿态估计中广泛用于关键点检测的现代CNN架构也适用于检测显著的、场景特定的3D landmark。 实验结果表明,其方法优于以前的无存储方法,但不如HLoc(顶级检索和匹配方法之一)准确,但是HLoc需要高存储。而且基于landmark的2D–3D对应关系补充了HLoc的对应关系,并且在计算姿态之前结合这些对应关系进一步提高了HLoc精度。局限性:首先神经网络是特定于场景的,像其他学习方法一样每个场景需要许多训练图像,而且在使用之前需要仔细选择场景landmark集。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106891
  • 算法
    +关注

    关注

    23

    文章

    4762

    浏览量

    97248
  • cnn
    cnn
    +关注

    关注

    3

    文章

    355

    浏览量

    23261

原文标题:通过场景landmark做定位的新思路(CVPR 2022)

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    uwb人员定位卡的功能、原理和应用场景详解

    UWB人员定位卡基于超宽带技术,实现亚米级高精度定位,支持SOS报警、低功耗运行及多场景融合定位。广泛应用于工业、医疗、司法等领域,提升安全监管与管理效率。
    的头像 发表于 12-04 17:36 1182次阅读
    uwb人员<b class='flag-5'>定位</b>卡的功能、原理和应用<b class='flag-5'>场景</b>详解

    开源鸿蒙技术大会2025丨定位与感知分论坛:构建开源鸿蒙全场景定位感知用户体验

    在万物智联加速演进的当下,高精度定位、设备协同感知等技术,将持续提升开源鸿蒙在移动设备导航、人员定位场景的用户体验。
    的头像 发表于 11-20 17:34 543次阅读
    开源鸿蒙技术大会2025丨<b class='flag-5'>定位</b>与感知分论坛:构建开源鸿蒙全<b class='flag-5'>场景</b><b class='flag-5'>定位</b>感知用户体验

    GPS定位和地磁定位有什么区别?

    GPS定位和地磁定位是两种原理完全不同、应用场景也差异巨大的技术。简单来说:GPS定位是绝对定位,告诉你“你在世界的哪个经纬度”。地磁
    的头像 发表于 11-19 12:01 210次阅读
    GPS<b class='flag-5'>定位</b>和地磁<b class='flag-5'>定位</b>有什么区别?

    常见的室内定位技术有哪些?深度剖析UWB、蓝牙定位等技术的优劣与应用场景

    本文解析UWB、蓝牙BLE、Wi-Fi三大室内定位技术的原理、优缺点及应用场景,涵盖高精度定位、低功耗部署与成本考量,助力选择最优方案。
    的头像 发表于 11-17 16:45 1553次阅读
    常见的室内<b class='flag-5'>定位</b>技术有哪些?深度剖析UWB、蓝牙<b class='flag-5'>定位</b>等技术的优劣与应用<b class='flag-5'>场景</b>

    铁路隧道施工安全管控:云翎智能高精度人员定位记录仪全场景解决方案

    云翎智能高精度人员定位记录仪通过厘米级定位、多源融合感知、抗干扰通信与数字孪生管理技术,构建了覆盖铁路隧道施工全场景的“定位-监测-预警-处
    的头像 发表于 10-28 21:36 161次阅读
    铁路隧道施工安全管控:云翎智能高精度人员<b class='flag-5'>定位</b>记录仪全<b class='flag-5'>场景</b>解决方案

    毫米级定位+全场景记录:铁路高精度定位工作记录仪助力铁路线路巡查

    铁路高精度定位工作记录仪通过毫米级定位与全场景记录技术,实现了铁路线路巡查的智能化升级,显著提升了巡检效率、安全性和数据可靠性,成为保障铁路安全运营的关键工具。云翎智能高精度
    的头像 发表于 10-20 22:02 225次阅读
    毫米级<b class='flag-5'>定位</b>+全<b class='flag-5'>场景</b>记录:铁路高精度<b class='flag-5'>定位</b>工作记录仪助力铁路线路巡查

    谐波 THD 超标,如何通过监测数据定位谐波源?

    ),从 “宏观区域定位” 到 “微观设备定位” 逐步缩小范围。以下是基于监测数据的具体定位方法,覆盖工业、商业、电网等常见场景: 一、第一步:宏观区域
    的头像 发表于 09-23 11:43 523次阅读
    谐波 THD 超标,如何<b class='flag-5'>通过</b>监测数据<b class='flag-5'>定位</b>谐波源?

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 1009次阅读

    输电线路分布式故障定位装置的原理、优势与应用场景解析

    输电线路分布式故障定位装置的原理、优势与应用场景解析
    的头像 发表于 05-16 09:25 655次阅读

    UWB 定位测距

    指示、可通过拨码开关设置参数,包括标签还是基站的判别,地址的确定等。 应用场景 :室内定位、资产追踪、智能仓储等。 2、实物照 实物图片UWB测距定位,UWB3000+Nrf52832
    发表于 05-12 09:36

    征求 NFER 近场电磁测距 人员定位

    最近遇到一个场景,需要做室内人员定位。需要实现基站安装在电梯上,随电梯上下移动,定位标签在人员身上。电梯经过时候可以像扫描一样定位出每层楼的人员位置,对精度没要求。需要考虑到穿透效果。
    发表于 03-06 10:15

    时域反射计的技术原理和应用场景

    一种高效的阻抗测量和分析工具,在多个领域发挥着重要作用。通过对其反射信号的分析,可以高效地识别并定位阻抗不连续点,进而提高电路和通信系统的可靠性和性能。
    发表于 02-11 14:39

    混合信号分析仪的原理和应用场景

    可以捕获电源波形并分析电流、电压和功率参数,帮助工程师评估电源系统的性能。 故障排查与定位:在电子设备的故障排查过程中,混合信号分析仪可以发挥重要作用。通过捕获和分析故障信号的波形,工程师可以快速定位
    发表于 01-21 16:45

    蓝牙人员定位技术:场景化应用与优势分析

    在当今智能化、数字化的时代,蓝牙人员定位技术凭借其低功耗、高精度和易于部署的特点,在众多场景中发挥着重要作用。云酷科技将结合具体场景,探讨蓝牙人员定位技术的优势和应用价值。 一、智能制
    的头像 发表于 12-31 16:51 603次阅读