0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面向SLAM鲁棒应用提出了基于RGB特征点提取算法

iotmag 来源:物联网技术 作者:梁伟鄯 2022-09-23 10:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摘 要 :视觉 SLAM(Simultaneous Localization And Mapping)的鲁棒性是困扰其走向应用的瓶颈,其中特征点提取算法的鲁棒性是重要影响因素。针对目前特征点提取算法普遍基于灰度图像,造成较大信息损失的问题,提出 RGB 图像的信息熵度量,验证了 RGB 图像变换为灰度图像的信息损失。在此基础上,提出了基于信息熵评价的特征点提取算法,根据 RGB 图像三个通道的信息熵确定灰度变换权重,最大限度保留图像信息 ;然后利用 FAST算法进行特征提取 ;最后直接基于 RGB 三通道构建特征描述子,实现特征在像素级的融合,为特征匹配提供可靠的依据。通过实验证明,改进的 RGB 特征点提取算法的匹配精度相比经典 ORB 算法在一定程度上有所提高 ;同时,相较于使用 RANSC 算法的 ORB 算法,二者精度基本相同,但较大程度地缩短了处理时间,基本可以满足实时处理的需求。

0 引 言

视觉SLAM(Simultaneous Localization And Mapping)的关键是建立图像间鲁棒的特征点匹配关系,其决定着摄像机运动参数的求解精度和目标点三维世界坐标重建精度[1],而影响匹配效果的重要因素是特征点提取算法。当前相对成熟的视觉SLAM解决方案有 Mono[2]、PTAM[3]、ORBSLAM[4]、SVO[5]、LSD-SLAM[6]和ORBSLAM2[7]等,普遍基于灰度图像进行特征点提取即匹配,对于环境对比明显的情况表现相对稳定,尤其ORBSLAM2更是因采用ORB特征在室外环境也有着较好的表现 ;相比于 SIFT、SURF 等多尺度提取算法,ORB特征提取算法简单,匹配精度相对较高,适合实时应用的场合。但也存在着当环境局部纹理或结构相似时所提取特征点的描述子无法加以区别的问题,从而造成错误匹配,而这种错误在多数应用场景下是无法接受的。为此,寻求更为鲁棒的特征点提取算法对于视觉SLAM就显得尤为重要。随着彩色图像处理技术的不断发展,基于彩色图像的特征提取已经应用在很多场合。彩色图像包含的特征信息要多于灰度图像,它不仅包含灰度图所携带的特征信息,还包含饱和度及色度分量的特征信息。据统计,基于灰度图像提取的特征信息仅占原始彩色图像的百分之九十。本文将充分挖掘彩色图像所包含的信息,构建基于RGB图像特征点提取算法,以此提高视觉SLAM的鲁棒性。

1 RGB图像信息熵度量

图像特征点提取的本质即信息的提取,如果能对灰度图像和彩色图像包含信息进行特定度量和比较,将为信息提取算法提供理论上的指导。按照 Marr 计算理论 [8],图像中的信息即图像中颜色或亮度的变化,呈现出的是物体和物体的关系以及与人的关系的要素。如果把一幅图像看作一个虚构零记忆“灰度信源”的输出时,可以通过观察图像的直方图来估计该信源的符号概率。假设图像大小为M×N,灰度范围为 [0,L-1],rk为此区间的离散灰度随机变量,nk为第k级灰度在图像中出现的次数。这时,灰度信源的熵变为 :

79ac95e4-3ae5-11ed-9e49-dac502259ad0.png

其中,79cfa5c0-3ae5-11ed-9e49-dac502259ad0.png

目前对于RGB值和灰度的转换,从心理学的角度来看满足人眼从彩色到亮度的感觉转换,对红、绿、蓝三种颜色赋以固定权重,通过加权求和得到灰度值,数学关系如下 :

79e9976e-3ae5-11ed-9e49-dac502259ad0.png

其中:R、G、B 分别为对应像素的红、绿、蓝分量;Grey为转换后像素的灰度值。

根据式(1)图像信息熵的定义,变换后的灰度图像的信息熵可轻易求得,而原始 RGB 图像的信息熵成为问题的关键。如果将 RGB 图像看作三个独立图层的简单叠加,则它的信息熵就是三个图层信息熵的和,即 :

7a0aa800-3ae5-11ed-9e49-dac502259ad0.png

其中:HR、HG、HB 分别为R、G、B三个图层对应的信息熵,而HRGB为彩色图像总的信息熵。此种定义在形式上比较简单,但其割裂了三个图层的彼此联系,这与实际情况不符。为最大限度反映彩色图像的信息规律,将R、G、B 三个图层看作一个整体,某个像素看作随机向量rRGB=(R, G, B),R∈[0,L-1],G ∈[0, L-1],B∈[0, L-1],则其信息熵可定义为:

7a1f43dc-3ae5-11ed-9e49-dac502259ad0.png

其中,7a34aaba-3ae5-11ed-9e49-dac502259ad0.png

在此运用上述定义对变换前后的RGB图像和灰度图像的信息进行比较,为得到可靠的结果,选用了4幅不同场景的图像进行变换,其结果如图1所示。

7a4dc446-3ae5-11ed-9e49-dac502259ad0.png

由图1可以看出,RGB信息熵都远大于相对应的灰度图像信息熵。也就是彩色图像变换为灰度图像后,图像的信息量有比较大的损失,对后续的特征提取必将产生影响。

2 基于RGB特征点提取算法

基于RGB图像的特征点提取算法可分为三类 :一是基于输出融合,分别对RGB图像三个通道进行特征提取,根据设计的融合准则得到整体的特征,实现相对简单,但容易导致信息丢失 ;二是基于RGB颜色向量,将RGB图像看作二维网格上的三维向量场,通过求解向量值函数实现特征提取 ;三是多维梯度方法,属于信息级的融合策略,可实现最终RGB特征信息增强[9-10]。

2.1 RGB 特征点查找算法

本文将采用第二类方法,基于信息熵计算RGB每个分量的最优融合权值,实现像素级的融合。算法步骤如下 :

(1)计算RGB图像三个通道IR、IG、IB的信息熵 :

7a8a541a-3ae5-11ed-9e49-dac502259ad0.png

其中,pR(Rk)、pG(Gk)、pB(Bk) 分别是IR、IG、IB三个通道的直方图统计量。

(2)根据图像信息量确定三个通道的权重。为了最大限度地保留图像信息,按照信息量的大小分配权重 :

7a9ec256-3ae5-11ed-9e49-dac502259ad0.png

(3)基于信息量将RGB图像线性变换为灰度图像 :

7abdeda2-3ae5-11ed-9e49-dac502259ad0.png

式中,R、G、B分别是RGB图像任意像素的分量。

由此证明基于信息熵的线性变换的信息量得到最大保留, 该命题可等效为 :任意假设线性变换Grey=λRR+λGG+λBB,对应的信息量HGrey≤HGreyI。

证明 :假设 Greyk 为变换后灰度图像的离散灰度随机变量,Rk、Gk、Bk分别为原始RGB图像三通道IR、IG、IB的离散随机变量。根据信息论可知,当信源的方差越大,则信息熵越大。

假设IR、IG、IB的方差分别为D(Rk)、D(Gk)、D(Bk),且D(Rk)>D(Gk)>D(Bk), 则可推出HR>HG>HB, 从而推出λRI>λGI>λBI。

根据方差性质 :D(Greyk)=λR2D(Rk)+λG2D(Gk)+λB2D(Bk),则有λR+λG+λB=1,推出:λR2D(Rk)+λG2D(Gk)+λB2D(Bk) ≤ λ2RID(Rk)+λ2GID(Gk)+λ2BI D(Bk),从而有:HGrey ≤ HGreyI。

(4)运用FAST算法确定特征点,此处不再赘述。

2.2 RGB 特征点描述子

本文采用的特征点描述子是在 Brief 描述子基础上加以改进的。为充分利用 RGB 三个通道的信息,描述子建立如下 :

(1)将RGB图像看作M×N×3的数组,IR、IG、IB 由上至下分布,以IG某二维特征点 (x,y)为中心,取S×S×3的立体邻域。

(2)在邻域内随机选取一对点。随机规则设计如下 :在图层选择上采取均匀随机采样 ;图层上像素采用高斯两步随机采样,即首先对xi 按照高斯分布7ade04ca-3ae5-11ed-9e49-dac502259ad0.png采样,然后对yi 按照高斯分布7b03b788-3ae5-11ed-9e49-dac502259ad0.png采样。

(3)比较二者像素的大小,并按照如下公式进行二进制赋值。

7b22c042-3ae5-11ed-9e49-dac502259ad0.png

其中,p(xi, yi)和p(xi', yi')是随机点(xi, yi)和(xi', yi')处的像素值。

(4)重复步骤 1 ~3,生成一个二进制编码,此编码即为特征点描述子。

3 实验及分析

为验证本文提出的特征点提取算法,拟与原始ORB特征点检测算法进行比较。分别采集两组图片 :第一组是在相同场景下通过平移、旋转、尺度等变换得到的 ;第二组为完全不同的场景图片。分别对两组图片进行特征点提取,并进行特征点匹配,采用改进的 ORB特征点提取算法(为使ORB 算法具有尺度、旋转不变性,在此将原算法中的Brie描述子更换为 Surf 描述子)的结果如图2、图3所示。

7b4afbb6-3ae5-11ed-9e49-dac502259ad0.png

由图中可看出,相同场景下大部分点的匹配是正确的,由于未采用RANSC算法,有少数点发生了匹配错误。如果采用RANSC算法,误匹配点对可以避免,但匹配时间会大大增加,平均为218.902 ms。对完全不同的场景进行特征提取,即使使用了RANSC算法仍然存在明显的3处误匹配,这种错误对于人类视觉而言是荒唐的。特征描述子采用的是局部邻域编码,从原理上只是经过编码的特征点的匹配,不代表客观物体间关系的匹配。产生这一现象一方面是由于特征定义的问题,另一方面是由于算法普遍是基于灰度图像,未能充分利用原始RGB图像信息的问题。

对以上两组图片采用本文提出的基于RGB特征点提取算法进行处理,同时采用基于距离的匹配算法进行匹配,其结果如图4、图5所示。

7b70664e-3ae5-11ed-9e49-dac502259ad0.png

相较于原算法,相同场景下基于RGB特征点的提取算法降低了错误匹配,其与原算法组合使用RANSC算法的性能相近,但处理时间缩短了62.014 ms。也说明了在算法充分利用RGB信息后,对于匹配结果的提升是有效的。但在不同场景下基于RGB特征提取仍然存在着极少的明显误匹配,这是因为算法本身仍是基于图像局部范围,当不同场景存在着较大的相似度时,这种错误发生的概率就会增加,通过扩大描述子随机范围可以降低错误率,但不可能完全避免。

4 结 语

本文面向SLAM鲁棒应用提出了基于RGB特征点提取算法,通过与目前普遍使用的ORB特征提取算法进行比较,发现误匹配率有明显降低,性能与使用RANSC算法相当,但处理时间得到了明显降低,从而也验证了本文提出的RGB图像信息熵度量方法的正确性,从信息论的角度解释了算法的有效性。今后,将围绕不同场景下误匹配发生的机理展开理论研究,进一步提升特征提取的鲁棒性。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1097

    浏览量

    42559
  • RGB
    RGB
    +关注

    关注

    4

    文章

    843

    浏览量

    62440
  • SLAM
    +关注

    关注

    24

    文章

    462

    浏览量

    33506

原文标题:论文速览 | 面向视觉SLAM的改进RGB特征点检测算法

文章出处:【微信号:iotmag,微信公众号:iotmag】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    技术解读:其利天下自适应观测器,如何提升吸尘器方案整体

    性特指设备面对电压波动、负载突变、电机参数偏差、高低温环境干扰时,依旧保持平稳运行的能力。当下多数吸尘器无刷电机驱动方案沿用传统滑膜观测器算法,搭配通用主控芯片,系统抗干扰能力薄弱,在常规机型
    的头像 发表于 06-10 14:00 41次阅读
    技术解读:其利天下自适应观测器,如何提升吸尘器方案整体<b class='flag-5'>鲁</b><b class='flag-5'>棒</b>性

    NXP MRF1K50N与MRF1K50GN:高性射频功率LDMOS晶体管的卓越之选

    NXP MRF1K50N与MRF1K50GN:高性射频功率LDMOS晶体管的卓越之选 在射频功率晶体管的领域中,NXP的MRF1K50N和MRF1K50GN脱颖而出,以其高性和
    的头像 发表于 06-10 10:15 100次阅读

    单芯片全信号链纳芯微磁编码器误差补偿与宽温

    工业级高速伺服与 BLDC 风机控制对磁编码器提出了高精度、强抗扰、全温稳定的严苛要求。本文以纳芯微 MT6835/MT6826 等 AMR/TMR 单芯片磁编码器为核心,系统阐述其全信号链集成架构、多源误差机理建模、多级误差补偿技术与宽温
    的头像 发表于 06-09 17:01 215次阅读

    Atmel SAM D20 QTouch 性演示套件深度解析

    Atmel SAM D20 QTouch 性演示套件深度解析 在电子设计领域,电容式触摸技术凭借其高灵敏度、耐用性和美观性,在众多应用场景中得到了广泛应用。Atmel 的 SAM D20
    的头像 发表于 06-05 09:05 136次阅读

    其利天下吸尘器无刷电机驱动方案核心技术:自适应观测器如何提升整机性?

    在清洁电器行业竞争日益激烈的今天,核心技术的突破已成为厂商突围的关键。其利天下自主研发的自适应观测器技术,从算法底层解决了吸尘器无刷电机驱动方案的性难题,配合自研KY32DQ020高性能MCU与千万级量产经验,为整机厂商提供
    的头像 发表于 06-05 09:00 397次阅读
    其利天下吸尘器无刷电机驱动方案核心技术:自适应观测器如何提升整机<b class='flag-5'>鲁</b><b class='flag-5'>棒</b>性?

    《多模态大模型 前沿算法与实战应用 第一季》精品课程简介

    原理出发,结合典型项目场景,解析多模态系统的全栈实现路径。 一、多模态算法的三大技术支柱 1. 模态编码器:异构数据的统一表征 不同模态的数据需要不同的编码器提取特征: 视觉模态 :CNN(如
    发表于 05-01 17:46

    20%丢包率仍可解码,安谋科技新一代“玲珑”VPU IP高性加持

    ,不稳会花屏。安谋科技发布的新一代VPU IP—— “玲珑”V560/V760,从架构设计之初就瞄准这个市场痛,通过两项核心能力实现视频处理“快且稳”:一是独创条带级编解码控制技术,显著降低延时;二是全维度高性设计,让视频
    的头像 发表于 03-31 10:14 242次阅读
    20%丢包率仍可解码,安谋科技新一代“玲珑”VPU IP高<b class='flag-5'>鲁</b><b class='flag-5'>棒</b>性加持

    瞻芯电子G2 650V SiC MOSFET的性验证试验

    瞻芯电子(IVCT)基于经典寿命模型,对大样本量的第二代(G2)650V SiC MOSFET 进行了性验证试验(Robustness-Validation)。该试验严格遵循AEC-Q101
    的头像 发表于 12-18 16:35 6949次阅读
    瞻芯电子G2 650V SiC MOSFET的<b class='flag-5'>鲁</b><b class='flag-5'>棒</b>性验证试验

    FPGA和GPU加速的视觉SLAM系统中特征检测器研究

    特征检测是SLAM系统中常见但耗时的模块,随着SLAM技术日益广泛应用于无人机等功耗受限平台,其效率优化尤为重要。本文首次针对视觉SLAM流程开展硬件加速
    的头像 发表于 10-31 09:30 987次阅读
    FPGA和GPU加速的视觉<b class='flag-5'>SLAM</b>系统中<b class='flag-5'>特征</b>检测器研究

    基于级联分类器的人脸检测基本原理

    本次分享的内容是基于级联分类器的人脸检测基本原理 1) 人脸检测概述 关于人脸检测算法,目前主流方法分为两类,一类是基于知识,主要方法包括模板匹配,人脸特征,形状和边缘,纹理特征,颜色特征
    发表于 10-30 06:14

    自动驾驶中如何将稀疏地图与视觉SLAM相结合?

    [首发于智驾最前沿微信公众号]在自动驾驶场景中,稀疏地图通常是由一系列关键帧和若干三维稀疏特征构成的地图,每个特征包含三维坐标和描述外观的描述子;而视觉
    的头像 发表于 10-28 09:07 895次阅读
    自动驾驶中如何将稀疏地图与视觉<b class='flag-5'>SLAM</b>相结合?

    一种适用于动态环境的自适应先验场景-对象SLAM框架

    由于传统视觉SLAM在动态场景中容易会出现严重的定位漂移,本文提出了一种新颖的基于场景-对象的可靠性评估框架,该框架通过当前帧质量指标以及相对于可靠参考帧的场景变化,全面评估SLAM的稳定性。
    的头像 发表于 08-19 14:17 1103次阅读
    一种适用于动态环境的自适应先验场景-对象<b class='flag-5'>SLAM</b>框架

    具备光照和自适应特征剔除的VSLAM前端框架

    现有的基于特征的VSLAM系统依赖于固定的前端参数,这使得它们在面对光照突变时显得十分脆弱,且特征跟踪也不稳定。为应对这些挑战,我们提出了“IRAF-SLAM”,这是一种具备光照
    的头像 发表于 07-30 10:38 1062次阅读
    具备光照<b class='flag-5'>鲁</b><b class='flag-5'>棒</b>和自适应<b class='flag-5'>特征</b>剔除的VSLAM前端框架

    基于深度学习的增强版ORB-SLAM3详解

    ORB-SLAM3虽是当前最先进的SLAM之一,但由于使用传统的ORB(定向FAST和旋转BRIEF)特征,在尺度、旋转和光照发生显著变化时可能会表现出局限性。
    的头像 发表于 07-14 17:21 2182次阅读
    基于深度学习的增强版ORB-<b class='flag-5'>SLAM</b>3详解

    一种适用于动态环境的实时RGB-D SLAM系统

    近期用于视觉SLAM的3D高斯泼溅(3DGS)技术在跟踪和高保真建图方面取得了显著进展。然而,其顺序优化框架以及对动态物体的敏感性限制了其在现实场景中的实时性能和性。为此,我们提出了
    的头像 发表于 07-04 15:14 1601次阅读
    一种适用于动态环境的实时<b class='flag-5'>RGB</b>-D <b class='flag-5'>SLAM</b>系统