0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于自动驾驶的时空融合激光雷达地点识别算法SeqOT

3D视觉工坊 来源:计算机视觉工坊 作者:马君驿 2022-12-09 10:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

论文作者:Junyi Ma, Xieyuanli Chen, Jingyi Xu, Guangming Xiong∗

论文来源:IEEE Transactions on Industrial Electronics

1、摘要

在本文中,作者在其原有工作OverlapTransformer (OT)的基础上,提出了一种用于自动驾驶的时空融合激光雷达地点识别算法SeqOT。SeqOT以多帧激光雷达数据作为输入,使用端到端的方式直接为序列化数据提取全局描述子,用以快速的地点识别检索。SeqOT采用多尺度Transformer结构对单帧高阶特征与多帧高阶特征进行增强和融合,并使用池化结构对多帧子描述子进行降维,显著提升地点识别描述子特异性和实时性。此外,SeqOT具有yaw角旋转不变和激光序列顺序不变的结构,进一步提高自动驾驶车辆多角度地点识别的准确率。试验结果表明,SeqOT在长、短时间跨度数据集上均具有很好的识别性能,且其运行速度快于激光雷达帧率,适用于实时运行的自动驾驶车辆。

2、主要工作与贡献

本文的主要贡献是一个端到端的地点识别神经网络,它利用连续的range image实现可靠的长期地点识别。受益于所提出的yaw角旋转不变结构,SeqOT对视点变化和多帧激光雷达数据的输入顺序具有较强的鲁棒性,因此即使在自动驾驶车辆以相反方向行驶时也能实现可靠的地点识别。SeqOT利用多尺度Transformer模块来融合序列化激光雷达数据的时空信息,通过增强单帧内部特征的关联与多帧间特征的关联,增强地点描述子特异性,进而提升地点识别精度。

3、算法流程

38896004-775f-11ed-8abf-dac502259ad0.png

图1 SeqOT算法结构

SeqOT由单帧编码模块、多帧编码模块,以及池化模块组合而成。如图1所示,首先将多帧三维激光点云通过球面投影转换为多帧二维range image,然后将各帧range image输入到单帧编码模块中,分别进行空间维度的压缩和通道维度的扩张,再利用单帧Transformer模块进行特征图的特异性增强,然后将特异性增强后的结果与增强前的结果进行通道维度上的拼接。以上操作均对序列化激光信息中的单帧数据分别进行操作。接下来,将单帧编码模块输出的特征输入到多帧编码模块中,在将相邻帧特征进行拼接后,输入到多帧Transformer模块进行多帧信息的高阶特征融合与增强,然后将融合后的结果输入到NetVLAD结构中生成一系列维度为1x256的子描述子向量。池化模块将此输入激光序列中的全部子描述子进行池化压缩,为输入激光序列生成最终的1x256全局描述子向量。

球面投影与yaw角旋转等变性

SeqOT使用序列化range image作为输入,并充分利用其yaw角旋转等变性。一个三维激光点(x, y, z),通过如下公式就可以投影至一个二维的图像像素(u, v),这就是球面投影生成range image的过程。range image上的每个像素点都代表激光点的距离信息。

389cf970-775f-11ed-8abf-dac502259ad0.png

range image本身具备yaw角旋转等变性,即一帧激光点云相对于z轴的旋转等价于本帧range image的平移。图2展示了yaw角旋转等变的简单示例。

38b1ce36-775f-11ed-8abf-dac502259ad0.png

图2 yaw角旋转等变性示例

得益于三维点云绕z轴的旋转等价于range image的平移,SeqOT后续的结构能够输出一系列yaw角旋转等变的中间特征图,进而最终将yaw角旋转等变性转化为yaw角旋转不变性,输出不受视点变化影响的全局描述子,从而保证多角度地点识别的可行性。

单帧编码模块

单帧编码模块对输入序列激光帧的每一帧单独进行高阶特征提取。基于此前的工作[1],单帧编码模块使用了与OverlapTransformer相似的OverlapNetLeg对range image进行高度方向的压缩与通道维度的扩张。而后的单帧Transformer模块对OverlapNetLeg的输出进行特异性增强,即增强单帧激光内部不同特征之间的关联。增强后的特征与增强前的特征进行拼接,得到yaw角旋转等变的中间特征,输入到后续的多帧编码模块。

多帧编码模块与池化模块

多帧编码模块将连续帧经过单帧编码模块输出的序列化高阶特征进行初步融合,池化模块则对初步融合的特征进行描述子级的聚合,最终为序列化输入计算地点识别描述子。在多帧编码模块中,首先将相邻三帧点云对应的单帧编码模块的输出进行拼接,构成更长的特征编码,输入至多帧Transformer模块,对帧间特征关联进行增强,实现多帧信息的融合。序列化信息融合后的特征输入至NetVLAD结构中,提取一系列子描述子。池化模块最终将序列子描述子进行聚合,生成一维地点识别全局描述子。由于结构中使用了具有顺序不变性质的NetVLAD结构与GeM池化结构,因此最终输出的全局描述子具备yaw角旋转不变性和激光序列顺序不变性,示例如图3所示,相关证明详见论文。

38fadb3a-775f-11ed-8abf-dac502259ad0.png

图3 全局描述子yaw角旋转不变性示例

基于overlap的训练

与此前工作[1]类似,SeqOT利用基于overlap划分的数据集进行训练。利用overlap作为label进行训练的理念在OverlapNet论文[2]中有所阐述。训练过程采用对比学习的思路,对于一帧query点云,同时向SeqOT输入本帧点云对应的序列激光帧、以及它的kp个正样本序列和kn个负样本序列。基于overlap的triplet loss函数如下式所示。

3912427a-775f-11ed-8abf-dac502259ad0.png

使用overlap而不是点云之间的距离作为衡量正负样本的基准,是因为overlap对于描述激光点云相似度来说是一个更为自然的方式;此外,点云间的overlap对应了后续点云配准的质量,因此基于overlap对是否为同一地点进行判断更有益于后续算法的进行。此外,本工作面向自动驾驶车辆地点识别最常用场景——可重复性行驶环境,为低显存的嵌入式设备提供了更为节省资源的两步训练策略,即第一步:将triplet loss作用于多帧编码模块输出的子描述子,训练池化模块之前的模型,并保存训练使用的子描述子;第二步:利用保存的子描述子作为输入,将triplet loss作用于SeqOT最终输出的全局描述子,训练池化模块。

4、实验结果

毫末数据集上的地点识别结果

3924b3ce-775f-11ed-8abf-dac502259ad0.png

KITTI和MulRan数据集上的泛化性测试结果

3944d8a2-775f-11ed-8abf-dac502259ad0.png

396889fa-775f-11ed-8abf-dac502259ad0.png

输入序列长度的对比试验结果

398decae-775f-11ed-8abf-dac502259ad0.png

多尺度Transformer的消融试验结果

39b77cea-775f-11ed-8abf-dac502259ad0.png

yaw角旋转不变性验证

39dd84ee-775f-11ed-8abf-dac502259ad0.png

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106768
  • 激光雷达
    +关注

    关注

    977

    文章

    4377

    浏览量

    195324
  • 自动驾驶
    +关注

    关注

    791

    文章

    14667

    浏览量

    176382

原文标题:SeqOT: 基于时空融合Transformer的SOTA地点识别算法,代码开源(IEEE Trans2022)

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶里的激光雷达有何作用?

    [首发于智驾最前沿微信公众号]激光雷达(LiDAR)是一款把光当“尺子”来量距离的一类传感器,在自动驾驶里负责“看清三维形状和距离”。它和摄像头、毫米波雷达不一样,能直接给出稠密的三维点云,帮助车辆
    的头像 发表于 10-10 07:15 568次阅读
    <b class='flag-5'>自动驾驶</b>里的<b class='flag-5'>激光雷达</b>有何作用?

    自动驾驶激光雷达可以安装在哪些位置?

    为了让自动驾驶汽车在各种复杂环境中都能精准感知周围情况,激光雷达(LiDAR)作为重要的环境感知传感器,发挥着不可替代的作用。激光雷达能够发射数十万乃至数百万束激光脉冲,并接收反射光信
    的头像 发表于 09-08 09:19 708次阅读

    决定自动驾驶激光雷达感知质量的因素有哪些?

    一个激光雷达是否适合自动驾驶,基本上取决于它在距离(range)、角度/点云分辨率(resolution)、以及在现实世界复杂条件下的鲁棒性(robustness)。
    的头像 发表于 08-20 12:08 1874次阅读
    决定<b class='flag-5'>自动驾驶</b><b class='flag-5'>激光雷达</b>感知质量的因素有哪些?

    自动驾驶激光雷达究竟是增加了成本,还是降低了算力?

    [首发于智驾最前沿微信公众号]随着纯视觉方案被越来越车企尝试,激光雷达(LiDAR)成为了自动驾驶中一个关键但又充满争议的部件。它因提供高精度的三维点云数据而成为追求高安全性、高可靠性的自动驾驶方案
    的头像 发表于 08-07 09:04 586次阅读
    <b class='flag-5'>自动驾驶</b>加<b class='flag-5'>激光雷达</b>究竟是增加了成本,还是降低了算力?

    自动驾驶到具身智能,激光雷达缘何一边被嫌弃,一边被追捧?

    自从自动驾驶被提出,激光雷达就一直处于技术讨论的中央,虽然在自动驾驶技术发展过程中,也出现了关于纯视觉的讨论,但激光雷达依然是被很多厂商所采用。具身智能的出现,则再一次让
    的头像 发表于 07-24 18:10 762次阅读

    自动驾驶只用激光雷达进行感知会有哪些问题?

    [首发于智驾最前沿微信公众号]自动驾驶依赖激光雷达(LiDAR)技术已成为行业内的主流选择之一。激光雷达通过发射和接收激光脉冲,绘制周围环境的三维点云,为车辆提供精确的空间感知能力。之
    的头像 发表于 07-02 08:59 595次阅读

    自动驾驶激光雷达之间会相互干扰吗?

    [首发于智驾最前沿微信公众号]就在最近,有一位小伙伴问了一个非常有趣的问题,如果多辆搭载激光雷达自动驾驶车辆相遇,是否会相互干扰?对于这个问题,智驾最前沿查阅了多份资料及相关文献,今天就带大家分析
    的头像 发表于 06-03 10:02 602次阅读

    激光雷达自动驾驶领域中的优势

    光束方向上的距离信息,将空间环境转化为高密度点云数据,为自动驾驶算法提供不可或缺的环境感知信息。雷达感知数据作为自动驾驶算法的重要输入之一,
    的头像 发表于 05-15 11:15 989次阅读
    <b class='flag-5'>激光雷达</b>在<b class='flag-5'>自动驾驶</b>领域中的优势

    爱普生高精度车规晶振助力激光雷达自动驾驶

    自动驾驶技术快速落地的今天,激光雷达作为车辆的“智慧之眼”,其测距精度与可靠性直接决定了自动驾驶系统的安全上限。而在这双“眼睛”的核心,爱普生(EPSON)的高精度车规晶振以卓越性能成为激光
    的头像 发表于 04-07 17:38 559次阅读
    爱普生高精度车规晶振助力<b class='flag-5'>激光雷达</b><b class='flag-5'>自动驾驶</b>

    自动驾驶中的激光雷达是否会伤害人眼?

    提到激光,很多人都会下意识想到“激光笔”,相信在童年玩激光笔时,一定会被告知不能直接对着人眼照射,会对人眼造成伤害。但随着自动驾驶技术的不断发展,
    的头像 发表于 03-24 09:26 894次阅读
    <b class='flag-5'>自动驾驶</b>中的<b class='flag-5'>激光雷达</b>是否会伤害人眼?

    激光雷达技术:自动驾驶的应用与发展趋势

    随着近些年科技不断地创新,自动驾驶技术正逐渐从概念走向现实,成为汽车行业的重要发展方向。在众多传感器技术中,激光雷达(LiDAR)因其独特的优势,被认为是实现高级自动驾驶功能的关键。激光雷达
    的头像 发表于 03-10 10:16 1410次阅读
    <b class='flag-5'>激光雷达</b>技术:<b class='flag-5'>自动驾驶</b>的应用与发展趋势

    激光雷达自动驾驶走的一段弯路吗?

    感知系统作为自动驾驶汽车的“眼睛”和“神经中枢”,扮演着至关重要的角色,自动驾驶车辆需要依靠传感器获取外部环境信息,以便在瞬息万变的道路上准确而及时地做出决策。激光雷达(Lidar)作为一种高精度
    的头像 发表于 02-19 09:09 698次阅读

    禾赛激光雷达助力宝马智能工厂自动驾驶

    合作将共同为Embotech的自动驾驶车辆调度系统(AVM)提供高性能、高可靠性的激光雷达技术与感知软件。 该合作成果已应用于宝马(BMW)位于德国的智能工厂内部,实现了“厂内自动驾驶
    的头像 发表于 02-11 09:46 965次阅读

    激光雷达光电组件的AEC-Q102认证:保障自动驾驶硬件的可靠性与品质

    自动驾驶的发展与激光雷达的作用由于目前5G技术的广泛应用,自动驾驶技术正逐步从理论走向实际应用。在这一转型过程中,激光雷达(LiDAR)作为一种高精度、高适应性和强大的环境感知能力的传
    的头像 发表于 01-14 12:02 1061次阅读
    <b class='flag-5'>激光雷达</b>光电组件的AEC-Q102认证:保障<b class='flag-5'>自动驾驶</b>硬件的可靠性与品质

    Mobileye牵手Innoviz合作激光雷达用于其Mobile Drive平台

    自动驾驶驾驶辅助技术的全球领导者Mobileye 和Innoviz今天宣布,Mobileye将在Mobileye Drive平台上使用innoviz的激光雷达。这展示了Innoviz的激光雷
    的头像 发表于 12-12 18:41 1499次阅读