0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通过场景landmark做定位的新思路(CVPR 2022)

3D视觉工坊 来源:3D视觉工坊 作者:3D视觉工坊 2022-12-16 11:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

主要内容:提出了一种基于学习的相机定位算法,其无需存储图像特征和场景三维点云,降低了存储限制,通过识别场景中稀疏但显著有代表性的landmark来找到2D-3D对应关系进行后续的鲁棒姿态估计,通过训练检测landmark的场景特定的CNN来实现所提出的想法,即回归输入图像中对应landmark的2D坐标。

634694fc-7ce5-11ed-8abf-dac502259ad0.png

创新点与Contributions:1)与大多数landmark通常可见的人体姿态估计不同,由于相机视野有限并且无法同时观察场景的不同部分,相机姿态估计任务中大多数场景landmark不会同时可见,文章通过提出一种新的神经方位估计器(Neural Bearing Estimator,NBE)来解决这一问题,该估计器可以直接回归相机坐标系中场景landmark的3D方位向量,NBE学习全局场景表示的同时学习预测场景landmark的方向向量,即使它们不可见。 2)提出了一个新的室内定位数据集,INDOOR-6,相对于传统的7-Scenes室内数据集,包含更多变化的场景、昼夜图像和强烈的照明变化 3)与现有的无存储定位方法相比,具有低存储的优点且性能较好 文章提出了两种预测图像中场景landmark的方法,在第一种方法中训练了一个模型来识别图像中的2D场景地标,称之为场景地标检测器(SLD),由于假设已知的相机内参,这些2D检测可以转换为3D方位矢量或射线。在第二种方法中训练了一个不同的模型直接预测相机坐标系中landmark的3D方位向量,称之为神经方位估计器(NBE)。注:使用SLD,只能检测到相机视场(FoV)中可见的landmark,而NBE预测所有landmark的方位,包括相机视场外不可见的landmark。

63d732a0-7ce5-11ed-8abf-dac502259ad0.png

首先会有一个SFM构建的点云模型,会在这些点云中挑选出有代表性的点云子集,用这些子集以及建图时SFM算法生成的数据库图像的伪真值来训练两个提出的网络模型。SLD:SLD被设计为将RGB图像I作为输入并输出一组像素似然图(热图)表示每个可见地标的位置,其模型架构如下:

68351844-7ce5-11ed-8abf-dac502259ad0.png

由四个主要组件组成:使用ResNet-18为backbone,删除最后三个最大池化层以保留高分辨率特征图(输出分辨率为输入图像分辨率的四分之一),其次在ResNet-18之后使用扩张卷积块,扩张率设置为1、2、3和4,接下来转置卷积层执行上采样,并负责生成分辨率为输入图像一半的热图,最后一层由1×1卷积组成,预测L个热图通道,每个地标一个。 训练损失:

684cdd6c-7ce5-11ed-8abf-dac502259ad0.png

在推断过程中,假设当其最大热图值超过阈值τ=0.2时表明检测到地标,利用亚像素精度计算热图峰值位置处裁剪的17×17 patch的期望值。NBE:设计了一个模型在给定图像I的情况下回归全部场景landmark(即使它不可见)的方位向量。 CNN将图像I作为输入以生成深度特征图,然后是多个MLP(多层感知器)块,每个块输出指向landmark的方向向量,MLP包含两个全连接层,具有128个ReLU激活节点。

686f7782-7ce5-11ed-8abf-dac502259ad0.png

6899dd88-7ce5-11ed-8abf-dac502259ad0.png

训练好两个模型后,将每个查询图像输入SLD网络以获得2D检测,然后根据内参将其转换为一组landmark方位向量B1,如果检测到超过八个场景landmark,使用鲁棒最小解算器(P3P+RANSAC)计算相机姿态,然后使用基于Levenberg-Marquardt的非线性细化。如果没有8个,将相同的图像输入NBE网络并获得预测方位B2,然后合并方位估计B1和B2的集合以形成新的集合B3,当集合B1和B2中的方位指向同一地标时,保留来自B1的估计,因为SLD通常比NBE更准确。最后使用上面描述的相同过程但使用B3计算相机姿态。如何从点云中选择有代表性的场景landmark提供给网络进行训练?从SfM点云P中找到L个场景landmark的最佳子集是一个组合问题,其中评估每个子集都是困难的。本文受之前以贪婪的方式寻找有区别的关键点或场景元素工作的启发,去选择鲁棒性(具有更长的轨迹)、可重复性(在多个场景中看到)和可概括性(从许多不同的观看方向和深度观察)的场景landmark,测量轨迹长度大于阈值t的3D点x的显著性得分A(x),如下所示:

68d42042-7ce5-11ed-8abf-dac502259ad0.png

除了最大化总体显著性得分之外还寻找在空间上覆盖3D场景的场景landmark以便从场景内的任何地方都可以看到一些地标,例如无论摄像机在场景中的哪个位置都希望一些地标可见。为此使用算法1中描述的约束贪婪方法

68e57806-7ce5-11ed-8abf-dac502259ad0.png

下图表述一些挑选到的landmark在二维图像中的投影的裁剪patch

68fb4a1e-7ce5-11ed-8abf-dac502259ad0.png

实验:训练模型的细节可去论文中查看 实验数据集是在自己提出的INDOOR-6数据集和7Scenes数据集上

69223e26-7ce5-11ed-8abf-dac502259ad0.png

评估了单独使用NBE, SLD,联合使用NBE+SLD, NBE+SLD(E)(是更紧凑的网络),和SOTA的基于分层定位方法结合HLoc+SLD Baseline为Posenet、DSAC、HLoc 在INDOOR-6数据集上的结果:

697d9d3e-7ce5-11ed-8abf-dac502259ad0.png

69c240b0-7ce5-11ed-8abf-dac502259ad0.png

存储比较和消融研究:

6a35e38a-7ce5-11ed-8abf-dac502259ad0.png

7Scenes数据集上的实验结果:

6a53983a-7ce5-11ed-8abf-dac502259ad0.png

总结:算法是一种存储要求低但精度高的方法。主要见解是在人和物体姿态估计中广泛用于关键点检测的现代CNN架构也适用于检测显著的、场景特定的3D landmark。 实验结果表明,其方法优于以前的无存储方法,但不如HLoc(顶级检索和匹配方法之一)准确,但是HLoc需要高存储。而且基于landmark的2D–3D对应关系补充了HLoc的对应关系,并且在计算姿态之前结合这些对应关系进一步提高了HLoc精度。局限性:首先神经网络是特定于场景的,像其他学习方法一样每个场景需要许多训练图像,而且在使用之前需要仔细选择场景landmark集。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108158
  • 算法
    +关注

    关注

    23

    文章

    4803

    浏览量

    98530
  • cnn
    cnn
    +关注

    关注

    3

    文章

    356

    浏览量

    23533

原文标题:通过场景landmark做定位的新思路(CVPR 2022)

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【夏曹俊】VisualStudio2022构建调试C++项目

    ”,解决那些编译通过但运行必崩的“定时炸弹”。 第三步:建立“工程级”的肌肉记忆(知识内化) 快速扫完文章后,停止阅读。用以下三个极其真实的“翻车场景”来反刍你的认知,检验是否看透: 场景一: 你引入
    发表于 04-18 16:21

    探索 ISL6401 RSLIC PWM 控制器评估板:为 VoIP 电源设计带来新思路

    探索 ISL6401 RSLIC PWM 控制器评估板:为 VoIP 电源设计带来新思路 在当今数字化通信的浪潮中,VoIP 技术的应用日益广泛,对于相关电源供应的要求也越来越高。今天,我们就来
    的头像 发表于 04-12 15:05 359次阅读

    UWB 定位中的 ToF、TWR、TDoA 是什么?

    想了解 UWB 定位,你一定会遇到三个高频缩写: ToF 、 TWR 、 TDoA 。它们看似专业晦涩,但底层原理并不复杂。本文将用最通俗的方式帮你理清三者的含义、区别和适用场景,方便你在项目选型
    发表于 04-08 11:18

    微电网保护的关键技术在城市商业园区场景中的应用案例分享

    西格电力提供智能微电网系统解决方案,咨询服务:1.3.7-5.0.0.4-6.2.0.0自适应保护、分布式协同保护、电力电子适配型保护、防孤岛保护等关键技术,通过场景化优化升级,在各类城市商业园区中
    的头像 发表于 03-20 11:49 127次阅读

    从智慧医疗到多元商业场景的室内人员定位技术应用详解

    GPS室内失效?蓝牙信标定位技术应运而生!通过信标部署、信号接收与算法解算,实现1–5米高精度定位。已广泛应用于智慧医疗(导诊/设备管理)、文旅(智能导览)、工业(安全监控)、商业(寻车/精准营销)等
    的头像 发表于 03-02 17:16 658次阅读

    Nullmax研发团队静态元素检测和拓扑推理新成果入选CVPR 2026

    思路,显著提升自动驾驶在无图场景下的实时感知理解能力。Nullmax 致力于巩固 ADAS 产品能力,为更多用户提供全场景、可泛化、性能佳的智驾体验。
    的头像 发表于 02-28 10:08 652次阅读

    数字音频放大器新思路:MAX98360全方位解析

    数字音频放大器新思路:MAX98360全方位解析 在数字化浪潮的推动下,音频设备市场对音质、效率和成本的要求日益严苛。在这个背景下,我们迎来了Analog Devices推出的MAX98360系列
    的头像 发表于 01-16 14:15 292次阅读

    北斗卫星导航定位技术从核心误差修正方法、不同定位模式到工业场景融合应用详解(二)

    斗系统通过“空间星座+地面控制+用户终端”协同,以伪距测量和空间后方交会实现高精度定位。文章详解六大误差源及三层修正技术,涵盖开放、授权与增强三类定位模式,精度从米级至厘米级。结合UWB、蓝牙等技术,实现工业
    的头像 发表于 12-30 17:02 871次阅读

    uwb人员定位卡的功能、原理和应用场景详解

    UWB人员定位卡基于超宽带技术,实现亚米级高精度定位,支持SOS报警、低功耗运行及多场景融合定位。广泛应用于工业、医疗、司法等领域,提升安全监管与管理效率。
    的头像 发表于 12-04 17:36 1814次阅读
    uwb人员<b class='flag-5'>定位</b>卡的功能、原理和应用<b class='flag-5'>场景</b>详解

    开源鸿蒙技术大会2025丨定位与感知分论坛:构建开源鸿蒙全场景定位感知用户体验

    在万物智联加速演进的当下,高精度定位、设备协同感知等技术,将持续提升开源鸿蒙在移动设备导航、人员定位场景的用户体验。
    的头像 发表于 11-20 17:34 1043次阅读
    开源鸿蒙技术大会2025丨<b class='flag-5'>定位</b>与感知分论坛:构建开源鸿蒙全<b class='flag-5'>场景</b><b class='flag-5'>定位</b>感知用户体验

    GPS定位和地磁定位有什么区别?

    GPS定位和地磁定位是两种原理完全不同、应用场景也差异巨大的技术。简单来说:GPS定位是绝对定位,告诉你“你在世界的哪个经纬度”。地磁
    的头像 发表于 11-19 12:01 704次阅读
    GPS<b class='flag-5'>定位</b>和地磁<b class='flag-5'>定位</b>有什么区别?

    常见的室内定位技术有哪些?深度剖析UWB、蓝牙定位等技术的优劣与应用场景

    本文解析UWB、蓝牙BLE、Wi-Fi三大室内定位技术的原理、优缺点及应用场景,涵盖高精度定位、低功耗部署与成本考量,助力选择最优方案。
    的头像 发表于 11-17 16:45 2222次阅读
    常见的室内<b class='flag-5'>定位</b>技术有哪些?深度剖析UWB、蓝牙<b class='flag-5'>定位</b>等技术的优劣与应用<b class='flag-5'>场景</b>

    毫米级定位+全场景记录:铁路高精度定位工作记录仪助力铁路线路巡查

    铁路高精度定位工作记录仪通过毫米级定位与全场景记录技术,实现了铁路线路巡查的智能化升级,显著提升了巡检效率、安全性和数据可靠性,成为保障铁路安全运营的关键工具。云翎智能高精度
    的头像 发表于 10-20 22:02 587次阅读
    毫米级<b class='flag-5'>定位</b>+全<b class='flag-5'>场景</b>记录:铁路高精度<b class='flag-5'>定位</b>工作记录仪助力铁路线路巡查

    谐波 THD 超标,如何通过监测数据定位谐波源?

    ),从 “宏观区域定位” 到 “微观设备定位” 逐步缩小范围。以下是基于监测数据的具体定位方法,覆盖工业、商业、电网等常见场景: 一、第一步:宏观区域
    的头像 发表于 09-23 11:43 1419次阅读
    谐波 THD 超标,如何<b class='flag-5'>通过</b>监测数据<b class='flag-5'>定位</b>谐波源?

    UWB 定位测距

    指示、可通过拨码开关设置参数,包括标签还是基站的判别,地址的确定等。 应用场景 :室内定位、资产追踪、智能仓储等。 2、实物照 实物图片UWB测距定位,UWB3000+Nrf52832
    发表于 05-12 09:36