0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种用于视觉定位的2D-3D匹配方法GAM

3D视觉工坊 来源:3D视觉工坊 2023-02-16 10:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

主要内容:

提出了一种新的2D-3D匹配方法,几何辅助匹配(GAM),使用外观信息和几何上下文来改进2D-3D特征匹配,可以在保持高精度的同时增强2D-3D匹配的recall,将GAM插入到分层视觉定位pipeline中,表明GAM可以有效地提高定位的鲁棒性和准确性,其实验表明,GAM可以找到比手工启发式和学习的方法更正确的匹配,在多个视觉定位数据集上获得了最先进的结果。

Contributions:

提出了GAM,首先根据视觉外观为每个2D点建立多个候选匹配,然后根据几何上下文过滤不正确的匹配。

提出了一种称为BMNet的深度神经网络来处理多对多候选匹配,它可以预测每个2D-3D匹配的几何先验并输出全局最优匹配集。

提出了一种具有新场景检索策略的分层视觉定位方法,进一步提高了姿态估计的鲁棒性。

所提出的定位方法在多个数据集上优于最先进的方法。

几何辅助匹配:

583fcf36-ad34-11ed-bfe3-dac502259ad0.png

58593cbe-ad34-11ed-bfe3-dac502259ad0.png

网络架构:

5877fa6e-ad34-11ed-bfe3-dac502259ad0.png

589dd0e0-ad34-11ed-bfe3-dac502259ad0.png

58b3f028-ad34-11ed-bfe3-dac502259ad0.png

Hungarian Pooling:

如果直接训练g(g;θ),网络参数将很难学习,因为几何一致性可能与监督冲突,如下图所示。

58cad842-ad34-11ed-bfe3-dac502259ad0.png

2D图像点与在3D空间中接近的两个3D点匹配,在相同的相机姿势下,它们可能都有小的重投影误差,网络易于根据提取的几何特征为它们生成相似的权重,这两种对应关系都被认为是几何一致的。

然而其中只有一个是inlier,其余的则是outlier,多个对应具有相似的几何特征但具有不同标签的这种差异使得网络难以收敛。

为了解决这个问题,将匈牙利算法引入到网络中进行端到端训练。匈牙利算法可以找到全局最优的一对一匹配,因为只选择了两个对应关系中的一个,所以可以消除几何一致性和监督之间的差异。

基于由g(g;θ)预测的权重向量w和二分图g,权重矩阵w被构造为:

58e217c8-ad34-11ed-bfe3-dac502259ad0.png

其中W的未填充元素被设置为0,然后将匈牙利算法应用于该权重矩阵W获得匹配M的最大权重。分配向量s由下列公式获得:

58efcd46-ad34-11ed-bfe3-dac502259ad0.png

由于输出边缘来自输入边缘的子集,引入匈牙利算法的层可以被视为一个特殊的采样层,称之为匈牙利池,端到端训练中使用的反向传播公式如下:

590280bc-ad34-11ed-bfe3-dac502259ad0.png

分层定位pipeline:

59195f26-ad34-11ed-bfe3-dac502259ad0.png

对于查询图像,提取其全局特征和局部特征,全局特征用于粗略定位以确定要匹配的3D点集,提取的局部特征和结合相应描述符的3D点集都被送到GAM中以获得全局最优2D-3D对应。

整个定位过程分为三个模块,即场景检索、2D-3D特征匹配和先验引导姿态估计。

场景检索:

594184ba-ad34-11ed-bfe3-dac502259ad0.png

596cbdce-ad34-11ed-bfe3-dac502259ad0.png

2D-3D特征匹配:

根据场景检索的顺序执行GAM并输出匹配的2D-3D对应,对于第k个场景597d6ad4-ad34-11ed-bfe3-dac502259ad0.png,获取其3D点和相应的描述子来构建3D特征集,在从查询图像提取的2D局部特征和3D特征之间执行GAM,输出匹配M的最大权重,根据欧氏距离执行kNN比率匹配,当描述子被归一化时,这可以通过矩阵运算有效地实现。

先验引导的姿态估计:

由于M中仍然存在一些错误匹配,在RANSAC循环中应用PnP解算器,在RANSAC loop中,采样2D-3D对应的概率由BMNet预测的似然决定,这使得能够以更大的机会对可能的inlier进行采样。

实验:

首先进行了2D-3D匹配实验,表明GAM以比手工制作的方法和学习方法更高的精度找到更多的真实匹配。

数据集:MegaDepth数据集中选择一个位置作为2D-3D匹配评估的测试数据集。

将GAM与传统手工制作方法和学习匹配方法进行了比较 使用最近邻(NN)匹配器从描述符空间中的每个2D点的所有3D点中找到最近邻,手工制作的异常值剔除方法包括比率测试(ratio)、距离阈值(distance)和彼此最近的邻居(cross check),因为没有其他基于学习的方法直接用于2D-3D特征匹配,因此将最近提出的一些在2D-2D匹配中表现良好的方法迁移到2D-3D进行比较,将LGCNet和OANet的输入从2D-2D对应替换为2D3D对应,即LGCNet-2D3D和OANet2D3D

598c397e-ad34-11ed-bfe3-dac502259ad0.png

评估GAM在视觉定位方面的有效性以及提出的视觉定位框架: 数据集:Aachen Day-Night

599b47a2-ad34-11ed-bfe3-dac502259ad0.png

与SOTA定位方法的比较: 数据集:Cambridge Landmarks 和Aachen Day-Night

59b3d696-ad34-11ed-bfe3-dac502259ad0.png59cbcd96-ad34-11ed-bfe3-dac502259ad0.png

总结:


提出了一种用于视觉定位的2D-3D匹配方法GAM,同时使用外观信息和几何上下文来提高匹配性能,在保持高精度的同时提高了2D-3D匹配的召回率,其引入了一种新的二部匹配神经网络BMNet以提取2D-3D对应的几何特征,并可以学习全局几何一致性以预测每个对应的真实匹配的可能性,还将匈牙利算法集成到BMNet中作为一个特殊的池层以端到端的方式找到最大权重匹配,使得定位能够获得更正确的匹配从而提高了定位的鲁棒性和准确性。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108189
  • gam
    gam
    +关注

    关注

    0

    文章

    5

    浏览量

    7447
  • 匹配器
    +关注

    关注

    0

    文章

    6

    浏览量

    5850

原文标题:用几何信息来辅助基于特征的视觉定位(arxiv 2022)

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    onsemi N沟道屏蔽栅功率MOSFET:FDP2D3N10C与FDPF2D3N10C解析

    沟道屏蔽栅功率MOSFET:FDP2D3N10C和FDPF2D3N10C。 文件下载: FDP2D3N10C-D.PDF 、产品概述 这两款MOSFET采用了onsemi先进的POW
    的头像 发表于 04-15 09:40 410次阅读

    3D视觉引导拆码垛:文读懂“机器眼”如何指挥机器人搬货?

    3D视觉引导技术。很多入门者会好奇,这双“眼睛”究竟如何看清货物、精准定位,又能无缝指挥机器人完成动作?本文将拆解3D视觉“扫描识别-坐标
    的头像 发表于 03-05 13:17 385次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>视觉</b>引导拆码垛:<b class='flag-5'>一</b>文读懂“机器眼”如何指挥机器人搬货?

    2D、2.5D3D封装技术的区别与应用解析

    半导体封装技术的发展始终遵循着摩尔定律的延伸与超越。当制程工艺逼近物理极限,先进封装技术成为延续芯片性能提升的关键路径。本文将从技术原理、典型结构和应用场景三个维度,系统剖析2D、2.5D3D封装
    的头像 发表于 01-15 07:40 1229次阅读
    <b class='flag-5'>2D</b>、2.5<b class='flag-5'>D</b>与<b class='flag-5'>3D</b>封装技术的区别与应用解析

    用于窄带匹配高速射频ADC的全新方法

    本期,为大家带来的是《用于窄带匹配高速射频 ADC 的全新方法》,介绍了一种用于窄带匹配高速射频
    的头像 发表于 01-04 15:56 7643次阅读
    <b class='flag-5'>用于</b>窄带<b class='flag-5'>匹配</b>高速射频ADC的全新<b class='flag-5'>方法</b>

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:开启3D磁传感器评估之旅

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:开启3D磁传感器评估之旅 在电子工程师的日常工作中,评估和开发磁传感器是项常见
    的头像 发表于 12-18 17:15 1327次阅读

    iDS iToF Nion 3D相机,开启高性价比3D视觉新纪元!

    、友思特新品 友思特 iDS uEye Nion iTof 3D相机将 120 万像素的卓越空间分辨率与可靠的深度精度相结合—即使在极具挑战性的环境中也能确保获取精细的 3D 数据。 其外壳达到
    的头像 发表于 12-15 14:59 557次阅读
    iDS iToF Nion <b class='flag-5'>3D</b>相机,开启高性价比<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>新纪元!

    2025 3D机器视觉的发展趋势

    迭代与应用拓展成为市场的主要推动力:·技术升级:视觉系统从单任务的2D相机向多功能3D相机进化。过去用2D相机完成单
    的头像 发表于 12-10 17:25 1414次阅读
    2025 <b class='flag-5'>3D</b>机器<b class='flag-5'>视觉</b>的发展趋势

    友思特应用 | 基于高精度双目散斑 3D 相机的放射治疗视觉定位应用

    面临挑战。本文将深入探讨基于高精度双目散斑3D相机的视觉定位系统如何革新放疗定位流程,提升治疗的安全性与有效性。
    的头像 发表于 10-30 11:05 561次阅读
    友思特应用 | 基于高精度双目散斑 <b class='flag-5'>3D</b> 相机的放射治疗<b class='flag-5'>视觉</b><b class='flag-5'>定位</b>应用

    奥比中光领跑韩国机器人3D视觉市场

    近日,国际权威行业研究机构Interact Analysis发布《韩国商用及工业移动机器人3D视觉市场分析》报告(以下简称“报告”)。数据显示,奥比中光在韩国商用和工业移动机器人3D视觉
    的头像 发表于 10-23 16:27 871次阅读

    季丰电子邀您相约2025国际3D视觉感知与应用大会

    9月20日 - 21日,国际3D视觉感知与应用大会将在苏州太湖国际会议中心盛大启幕,大会议题涵盖3D成像与测量、3D视觉
    的头像 发表于 09-08 15:03 1203次阅读

    iTOF技术,多样化的3D视觉应用

    视觉传感器对于机器信息获取至关重要,正在从二维(2D)发展到三维(3D),在某些方面模仿并超越人类的视觉能力,从而推动创新应用。3D
    发表于 09-05 07:24

    一种环保型红色发烟弹主装药配方设计与优化

    (DSC)的功能,能够在同实验条件下同时获得样品的质量变化和热流信息。一种环保型红色发烟弹主装药配方设计与优化【(1、武警工程大学研究生大队2、武警工程大学装备
    的头像 发表于 07-07 15:56 599次阅读
    <b class='flag-5'>一种</b>环保型红色发烟弹主装药<b class='flag-5'>配方</b>设计与优化

    3D视觉引领工业变革

    随着工业智能化的推进,3D视觉技术正为制造业带来变革。市场规模逐年扩大,技术应用与市场竞争日益激烈。
    的头像 发表于 07-07 11:08 922次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>视觉</b>引领工业变革

    一种用于动态环境的实时RGB-D SLAM系统

    了UP-SLAM,这是一种用于动态环境的实时RGB-D SLAM系统。实验结果表明,UP-SLAM在定位精度方面(高出59.8%)和渲染质量方面(峰值信噪比高出4.57分贝)均优于最
    的头像 发表于 07-04 15:14 1462次阅读
    <b class='flag-5'>一种</b>适<b class='flag-5'>用于</b>动态环境的实时RGB-<b class='flag-5'>D</b> SLAM系统

    一种用于动态环境的3DGS-SLAM系统

    当前基于神经辐射场(NeRF)或3D高斯泼溅(3DGS)的SLAM方法在重建静态3D场景方面表现出色,但在动态环境中的跟踪和重建方面却面临着挑战。
    的头像 发表于 06-13 10:10 1603次阅读
    <b class='flag-5'>一种</b>适<b class='flag-5'>用于</b>动态环境的<b class='flag-5'>3</b>DGS-SLAM系统