0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度剖析3D视觉定位技术

新机器视觉 来源:华为云社区 作者:华为云社区 2021-04-01 14:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

引言

所谓3D视觉定位指的是根据事先构建的3D模型及相关信息,计算取得某张图像在拍摄时相机的位置和姿态。这是3D视觉的一项十分重要的技术,可以用来帮助实现人员定位与导航。本博文将基于2019年CVPR论文From Coarse to Fine: Robust Hierarchical Localization at Large Scale所采用的分级定位方案对该技术进行简要的介绍。

基本原理

3D视觉定位的直接目标是计算当前图像的照相机位姿,解决该问题的直接方案是建立3D点与2D点之间的匹配关系,通过二者的匹配关系估计相机位姿,这一问题被称作PnP(Pespective-n-Point)问题。求解PnP问题的方法有很多,常见的有P3P、EPnP、UPnP等,具体的如何实现本文不做介绍,读者可以自行搜索PnP问题的相关理论。而视觉定位需要解决的一大关键问题是如何建立3D点与2D点之间的匹配关系。对于这一点,论文作者Sarlin提出过一种分级定位的方案,以下将详细介绍该方案。

分级定位

e7de8e74-92a7-11eb-8b86-12bb97331649.png

分级定位的框架大约可以分成三步:预检索、共视聚类、局部匹配与定位。

预检索

预检索的意义在于获取前k张与当前图像最相似的图像,判断相似的依据通常是通过匹配图像的全局特征。一般而言,产生全局特征的方法可以依赖于局部特征所组成的词袋,不过近些年,一些深度学习方案也被引入了进来,例如NetVLAD或更加轻量级的MobileNetVLAD。最终通过获取当前图像的全局特征的k个最近邻来获取预检索得到的相近图集。

共视聚类

然而由于可能产生的错误匹配,所获取到的预检索图集并不一定全部都面向同一场景,这时就需要先将面向不同场景的图像区分开来,这项技术就被称作共视聚类,简而言之就是将具有共视关系的图像聚成一类。

ea0522da-92a7-11eb-8b86-12bb97331649.png

这一过程实际十分简单,它是通过匹配同名点来获取的,这些同名点在早先进行的3D建模过程中通过特征的提取与匹配已经建立了对应的关系。若两个图像中存在稳定的同名点,则认为二者共视,分成一类,否则分成两类。

局部匹配与定位

一般认为图像数量较多的类所对应的场景是正确场景的可能性较大。因此从这一场景开始,尝试获取相机位姿。获取的方式主要依赖求解PnP问题,因此需要首先构建当前图像的2D关键点在3D模型中的坐标位置。在尚不知道相机姿态前,这一信息的获取需要首先匹配当前图像和场景内的图像,特别要匹配那些能够对应到3D位置的2D特征点,若能够匹配上则确定了当前图像中的2D点和3D点的对应关系,继而即可通过对PnP问题的求解获取相机位姿。

总结

本博文基于当前被广泛采用的分级视觉定位方法对在3D视觉领域广泛使用的视觉定位方法进行了简要介绍,其主要可以被分为三个步骤,即预检索、共视聚类、局部匹配与定位,最终通过求解PnP问题来获取当前图像的位姿,从而确定拍摄者的位置。笔者后续将继续保持对3D视觉领域的研究和关注,并继续输出相关博文。

参考文献

Sarlin P E, Cadena C, Siegwart R, et al. From coarse to fine: Robust hierarchical localization at large scale[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 12716-12725.

Sarlin P E, Debraine F, Dymczyk M, et al. Leveraging deep visual descriptors for hierarchical efficient localization[J]. arXiv preprint arXiv:1809.01019, 2018.

Arandjelovic R, Gronat P, Torii A, et al. NetVLAD: CNN architecture for weakly supervised place recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2016: 5297-5307.

来源:华为云社

文链接:https://bbs.huaweicloud.com/blogs/229261

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    3022

    浏览量

    115563
  • 照相机
    +关注

    关注

    0

    文章

    70

    浏览量

    27790
  • 导航
    +关注

    关注

    7

    文章

    582

    浏览量

    44071

原文标题:3D视觉定位技术

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    奥比中光3D视觉产品助力北美智慧物流应用落地

    近日,北美规模最大、影响力最广的物流与供应链技术盛会——MODEX 2026在美国亚特兰大举行,奥比中光携多款3D视觉产品与行业解决方案参展。
    的头像 发表于 04-23 09:35 345次阅读

    友思特技术 | 智能iToF技术:开启高性价比3D视觉新纪元

    传统工业3D视觉深陷两难困局:要么高价换取高性能,要么牺牲精度以控制成本。智能iToF技术的崛起成功打破了这一局面。它通过片上深度处理、全局快门与高频调制等创新,在维持成本优势的同时,
    的头像 发表于 03-06 13:12 210次阅读
    友思特<b class='flag-5'>技术</b> | 智能iToF<b class='flag-5'>技术</b>:开启高性价比<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>新纪元

    3D视觉引导拆码垛:一文读懂“机器眼”如何指挥机器人搬货?

    3D视觉引导技术。很多入门者会好奇,这双“眼睛”究竟如何看清货物、精准定位,又能无缝指挥机器人完成动作?本文将拆解3D
    的头像 发表于 03-05 13:17 381次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>视觉</b>引导拆码垛:一文读懂“机器眼”如何指挥机器人搬货?

    基于3D视觉引导的移动式复合机器人设计:智能自动化革命的核心技术

    Meta Description: 本文深入探讨了基于3D视觉引导的移动式复合机器人设计的技术优势、应用前景与挑战。通过分析这一创新技术的应用领域,展现其在智能制造、医疗、农业和物流等
    的头像 发表于 01-20 16:24 421次阅读
    基于<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>引导的移动式复合机器人设计:智能自动化革命的核心<b class='flag-5'>技术</b>

    iDS iToF Nion 3D相机,开启高性价比3D视觉新纪元!

    一、友思特新品 友思特 iDS uEye Nion iTof 3D相机将 120 万像素的卓越空间分辨率与可靠的深度精度相结合—即使在极具挑战性的环境中也能确保获取精细的 3D 数据。 其外壳达到
    的头像 发表于 12-15 14:59 552次阅读
    iDS iToF Nion <b class='flag-5'>3D</b>相机,开启高性价比<b class='flag-5'>3D</b><b class='flag-5'>视觉</b>新纪元!

    2025 3D机器视觉的发展趋势

    迭代与应用拓展成为市场的主要推动力:·技术升级:视觉系统从单一任务的2D相机向多功能3D相机进化。过去用2D相机完成单一任务,如今用户更愿意
    的头像 发表于 12-10 17:25 1413次阅读
    2025 <b class='flag-5'>3D</b>机器<b class='flag-5'>视觉</b>的发展趋势

    Vitrox 3D在线X-RAY检测技术

    中国的核心代理商,致力于将前沿的自动光学检测技术带给国内电子制造业。今天,我们将深入剖析Vitrox核心技术之一——3D在线X-RAY自动检测系统 的工作原理 一、
    的头像 发表于 12-03 10:05 867次阅读

    3D传感器到立体相机,解锁工业应用新可能

    3D传感器是实现深度感知的核心技术。这些传感器广泛应用于多种常见的3D视觉技术中,例如立体相机、
    的头像 发表于 11-28 17:03 2017次阅读
    从<b class='flag-5'>3D</b>传感器到立体相机,解锁工业应用新可能

    3D 视觉系统供应商全景解析:技术迭代与国产力量的崛起

    3D 视觉系统供应商全景解析:技术迭代与国产力量的崛起 在智能制造浪潮下,3D 视觉系统已从高端工业装备的 “选配项” 变为自动化产线的 “
    的头像 发表于 11-21 13:33 583次阅读

    友思特应用 | 基于高精度双目散斑 3D 相机的放射治疗视觉定位应用

    面临挑战。本文将深入探讨基于高精度双目散斑3D相机的视觉定位系统如何革新放疗定位流程,提升治疗的安全性与有效性。
    的头像 发表于 10-30 11:05 559次阅读
    友思特应用 | 基于高精度双目散斑 <b class='flag-5'>3D</b> 相机的放射治疗<b class='flag-5'>视觉</b><b class='flag-5'>定位</b>应用

    奥比中光领跑韩国机器人3D视觉市场

    近日,国际权威行业研究机构Interact Analysis发布《韩国商用及工业移动机器人3D视觉市场分析》报告(以下简称“报告”)。数据显示,奥比中光在韩国商用和工业移动机器人3D视觉
    的头像 发表于 10-23 16:27 868次阅读

    季丰电子邀您相约2025国际3D视觉感知与应用大会

    9月20日 - 21日,国际3D视觉感知与应用大会将在苏州太湖国际会议中心盛大启幕,大会议题涵盖3D成像与测量、3D视觉
    的头像 发表于 09-08 15:03 1196次阅读

    iTOF技术,多样化的3D视觉应用

    视觉传感器对于机器信息获取至关重要,正在从二维(2D)发展到三维(3D),在某些方面模仿并超越人类的视觉能力,从而推动创新应用。3D
    发表于 09-05 07:24

    3D视觉引领工业变革

    随着工业智能化的推进,3D视觉技术正为制造业带来变革。市场规模逐年扩大,技术应用与市场竞争日益激烈。
    的头像 发表于 07-07 11:08 917次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>视觉</b>引领工业变革

    海伯森3D闪测传感器,工业检测领域的高精度利器

    随着信息技术的飞速进步,第四次视觉革命深度融合“人”“机”“物”,基于光学原理的3D视觉检测技术
    的头像 发表于 06-20 17:46 1605次阅读
    海伯森<b class='flag-5'>3D</b>闪测传感器,工业检测领域的高精度利器