0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解决由激光雷达线数差异导致的三维目标检测域适应问题

倩倩 来源:CVer 作者:韦祎 2022-08-31 14:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文是对我们ECCV 2022被接收的文章LiDAR Distillation: Bridging the Beam-Induced Domain Gap for 3D Object Detection的介绍。在这个工作中,我们通过构建伪低线数点云,利用知识蒸馏方法,来减小由激光雷达线数域差异导致的模型性能下降问题。很荣幸地,我们的文章被ECCV 2022收录,目前项目代码已开源,欢迎大家试用。

e8de29a2-28eb-11ed-ba43-dac502259ad0.jpg

arXiv:https://arxiv.org/abs/2203.14956

Code(已开源):

https://github.com/weiyithu/LiDAR-Distillation

概述

近年来随着人工智能的发展,自动驾驶技术开始逐步落地,广泛应用在无人机,清洁机器人,无人配送小车等无人系统中。而三维目标检测是自动驾驶技术中的重要一环,是三维环境感知的基础,其目的是检测出三维空间中每个物体的三维紧致框。相较于基于图像的纯视觉算法,基于点云三维目标检测方法精度更高,可以提供更加准确的三维位置,是现阶段高阶自动驾驶使用的方案。

激光雷达虽然可以提供准确的三维信息,但价格也是昂贵的,尤其是高线数激光雷达。因此在一些较低成本的产品中,例如清洁机器人和无人配送车,无法部署高线数雷达。然而现有公开数据集大部分都是用高线数雷达采集的,这中间存在着线数导致的域差异问题会使得我们无法很好地利用这些大型的公开数据集。除此之外,与RGB相机不同,激光雷达产品更新迭代较快,不同类型的激光雷达线数也会是不同的。对于每一代产品都去重新采集数据集是非常费时费力,不切合实际的。因此如何更好地利用之前采集的高线数数据集是个值得探究的问题。

同时,我们发现之前的一些算法大部分都是为了通用域适应问题设计的(例如ST3D),但面对训练集是高线数点云,测试集是低线数点云的场景,这些算法不能很好地处理。为了解决这个问题,我们提出了LiDAR Distillation。我们方法的核心是对源域高线数数据进行下采样得到伪低线数点云,与目标域线数对齐。以在高线数点云数据集上训练得到的三维目标检测器作为教师网络,在伪低线数点云数据集上训练得到的三维目标检测器作为学生网络,进行离线知识蒸馏算法,提升学生网络精度。由于下采样过程是逐步进行的,整个框架是迭代框架。在Waymo->nuScenes上的实验结果表明,我们的方法超过了当前最好方法的性能,并且我们的方法可以很好地与其它通用域适应方法进行结合,在推理过程中不增加任何计算量。

方法

e8fc6a20-28eb-11ed-ba43-dac502259ad0.jpg

1)生成低线数伪点云数据

为了对齐源域和目标域的点云线数(假设源域和目标域线数分别为Bs和Bt),我们首先需要对源域的高线数数据进行下采样。与一般的点云下采样方法不同,我们不能对点云进行均匀的采样,而是需要按照每条线进行采样。因此,我们首先需要将一个场景的点云中的每个点归类到每条线中。虽然有一些公开数据集中的数据有线束的标注,但很多激光雷达点云数据(例如KITTI)并没有这个信息,我们需要自己设计算法分离出每条线上的点。我们将每个点的笛卡尔坐标转换成球坐标:

e926aa88-28eb-11ed-ba43-dac502259ad0.png

e9349a12-28eb-11ed-ba43-dac502259ad0.png

2)利用高线数点云数据进行知识蒸馏

知识蒸馏框架中包含两个模型:教师网络和学生网络。一般而言,教师网络拥有更多的参数量和更强的表示能力,可以达到更好的性能;而学生网络模型更小,推理速度更快,能更好地用在存算资源受限的设备中。学生网络通过模仿教师网络的特征来提升自身的性能。与传统知识蒸馏方法不同的是,在我们的方法中,教师网络和学生网络的结构相同,唯一区别在于教师网络是在高线数数据上训练得到的,而学生网络是在低线数数据上训练所得。因此我们利用知识蒸馏的目的是将高线数点云中的丰富信息量传递给学生网络。

我们注意到大部分三维目标检测框架都会将三维特征投影到二维鸟瞰图(BEV)上,得到BEV特征。因此我们将BEV特征作为模仿目标。之前工作相关研究结果表明,由于特征图维度非常高,直接回归高维向量容易导致网络不收敛。除此之外,特征图存在很多低响应区域,这部分的特征往往是不重要的。为了解决这个问题,我们提取BEV特征图中的感兴趣区域(ROI)并在这些区域上执行模仿操作。整体目标函数如下:

e95b4982-28eb-11ed-ba43-dac502259ad0.png

3)渐进式知识蒸馏

我们发现当高线数数据和低线数数据之间的线数差异过大时(例如64线和16线),学生网络无法很好地向教师网络进行学习。我们提出渐进式知识蒸馏框架,逐步进行蒸馏学习。以64线数据到16线数据为例,我们首先生成伪32线数据,并在上面训练得到学生模型。紧接着,我们生成伪16线数据,并以上一步得到的学生模型作为教师网络。在伪16线数据上得到的学生网络作为最终结果在目标域的16线数据上进行推理。

实验结果

1) Waymo->nuScenes实验

e97ef40e-28eb-11ed-ba43-dac502259ad0.jpg

需要注意的是虽然Waymo数据集是64线数据,nuScenes是32线数据,但由于nuScene垂直视场角是Waymo的一半,因此其等效线数为16线。尽管我们的方法仅仅是为了由线数不同导致的域差异问题而设计的,没有考虑其它域差异因素,我们的方法仍然达到了SOTA的性能。并且,由于我们的方法没有用到目标域的训练数据,我们的方法很容易与其它方法进行互补结合(例如ST3D),达到更好的效果。

2)KITTI实验

e99b95e6-28eb-11ed-ba43-dac502259ad0.jpg

为了排除源域和目标域其它域差异因素的干扰,我们在KITTI上进行了实验。在这个实验中,点云线数不同是源域和目标域唯一的差别,其实这个设置更贴合真正的业界应用。换句话说,虽然产品更新导致了激光雷达线数变化,但使用场景并没有改变。但很可惜的是,学界并没有在同一场景用不同线数雷达采集的数据集。因此我们只能将64线KITTI数据分别下采样到多种低线数作为目标域。

3)预训练实验

e9c127fc-28eb-11ed-ba43-dac502259ad0.jpg

对于公司而言,他们愿意标一些源域的数据。因此我们也做了用我们方法在源域上进行预训练,然后在目标域上进行微调的实验。我们发现仅使用5%的目标域有标签数据,我们方法得到的模型性能就可以超过没有预训练直接用100%目标域数据进行训练得到模型的性能。

方法不足与未来展望

我们的方法是在BEV特征上进行知识蒸馏的,但很显然这不是最优解,尤其是对于不是很依赖BEV特征的网络而言,最近也出了不少三维目标检测知识蒸馏的文章,这些方法值得借鉴。另一方面,现在的公开数据集基本上用的都是用机械式激光雷达采集的。而由于成本原因,现在越来越多的厂家选用固态或者混合固态的激光雷达,这些雷达中的线数概念与机械式的不同,因此如何在这些雷达中缓解域差异问题是一个不错的未来方向。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49736

    浏览量

    261536
  • 激光雷达
    +关注

    关注

    978

    文章

    4377

    浏览量

    195378
  • 点云
    +关注

    关注

    0

    文章

    59

    浏览量

    4046

原文标题:ECCV 2022 | LiDAR Distillation: 解决由激光雷达线数差异导致的三维目标检测域适应问题

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CES 2025激光雷达观察:“千线激光雷达亮相,头部厂商布局具身智能

    厂商也展示了最新的方案,包括集成在座舱内的激光雷达方案,FMCW激光雷达等。   下面我们就来看下这届CES上激光雷达行业有哪些新的发展动态。   车载激光雷达迈向千
    的头像 发表于 01-12 09:08 3352次阅读
    CES 2025<b class='flag-5'>激光雷达</b>观察:“千<b class='flag-5'>线</b>”<b class='flag-5'>激光雷达</b>亮相,头部厂商布局具身智能

    线激光雷达 3D SLAM 无人叉车系统解决方案:开启工业物流新变革

    :什么是激光雷达3DSLAM?激光雷达3DSLAM(3DSimultaneousLocalizationandMapping,三维同步定位与地图构建)是无人叉车自主导航
    的头像 发表于 11-28 19:46 698次阅读
    多<b class='flag-5'>线</b><b class='flag-5'>激光雷达</b> 3D SLAM 无人叉车系统解决方案:开启工业物流新变革

    激光雷达:智能时代的“感知之眼”,开启三维世界新纪元

    激光雷达凭借其毫米级精度、全天候性能与三维建模能力,成为智能驾驶、机器人、智慧城市等万亿级赛道的核心基础设施。 高精度感知:突破传统传感器的物理极限 传统摄像头在逆光、雨雾中“失明”,毫米波雷达难以识别静
    的头像 发表于 11-17 08:47 222次阅读
    <b class='flag-5'>激光雷达</b>:智能时代的“感知之眼”,开启<b class='flag-5'>三维</b>世界新纪元

    全球最强L3感知方案!禾赛ETX 800线激光雷达+FTX固态补盲

    电子发烧友网综合报道 禾赛科技在今年IAA Mobility慕尼黑国际车展上发布了ETX 800线车规级超远距激光雷达,刷新了“全球线最高+全球测距最远”的量产车载
    的头像 发表于 10-18 00:51 7799次阅读
    全球最强L3感知方案!禾赛ETX 800<b class='flag-5'>线</b><b class='flag-5'>激光雷达</b>+FTX固态补盲

    自动驾驶里的激光雷达有何作用?

    [首发于智驾最前沿微信公众号]激光雷达(LiDAR)是一款把光当“尺子”来量距离的一类传感器,在自动驾驶里负责“看清三维形状和距离”。它和摄像头、毫米波雷达不一样,能直接给出稠密的三维
    的头像 发表于 10-10 07:15 600次阅读
    自动驾驶里的<b class='flag-5'>激光雷达</b>有何作用?

    800线!禾赛发布ETX激光雷达

    电子发烧友网综合报道 在2025年IAA Mobility慕尼黑国际车展上,禾赛发布了ETX 800线车规级超远距激光雷达,凭借“全球线最高+全球测距最远”两大硬指标再次刷新量产车载
    发表于 09-13 16:16 1634次阅读

    自动驾驶激光雷达可以安装在哪些位置?

    构建出高精度的三维点云图,让车辆“看”到前方、侧方乃至后方的各类物体轮廓及距离信息。要让激光雷达发挥最佳性能,除了选型和算法优化之外,合理的安装位置至关重要,不同部位安装的激光雷达各有侧重,协同工作才能形成全面、
    的头像 发表于 09-08 09:19 718次阅读

    内蒙古首批测风激光雷达生产线在呼和浩特投产

    科技有限公司共同组建的现代化高科技企业,是自治区首家具备测风激光雷达自主研发、生产及标定能力的低空基础设施设备生产企业,填补了自治区在低空气象监测装备制造领域的空白。 恒科技条测风激光雷达
    的头像 发表于 07-21 19:29 464次阅读

    全固态激光雷达为什么迟迟未来?其技术难点是什么?

    [首发于智驾最前沿微信公众号]激光雷达(LiDAR)作为自动驾驶车辆环境感知的“第只眼”,能够发射激光脉冲并接收反射光,实时构建周围物体的三维点云,从而为车辆决策提供精准的距离和形状
    的头像 发表于 07-11 09:02 657次阅读

    自动驾驶只用激光雷达进行感知会有哪些问题?

    [首发于智驾最前沿微信公众号]自动驾驶依赖激光雷达(LiDAR)技术已成为行业内的主流选择之一。激光雷达通过发射和接收激光脉冲,绘制周围环境的三维点云,为车辆提供精确的空间感知能力。之
    的头像 发表于 07-02 08:59 628次阅读

    超酷的树莓派激光雷达扫描仪!

    摘要这款DIY的PiLiDAR扫描仪项目利用树莓派进行激光雷达测绘。激光雷达通过发射激光来扫描周围环境,从而创建三维模型。该项目需要树莓派4、摄像头、电机以及
    的头像 发表于 06-01 08:33 796次阅读
    超酷的树莓派<b class='flag-5'>激光雷达</b>扫描仪!

    爱普生高精度车规晶振助力激光雷达自动驾驶

    实现毫米级感知的关键支撑,为智能驾驶提供稳定可靠的“心跳”节拍。激光雷达通过发射激光脉冲并计算反射时间生成三维点云数据,其核心要求是时序同步精度与环境适应性。微小的
    的头像 发表于 04-07 17:38 565次阅读
    爱普生高精度车规晶振助力<b class='flag-5'>激光雷达</b>自动驾驶

    自动驾驶中的激光雷达是否会伤害人眼?

    ,其精确的三维环境重建能力和全天候适应性逐渐成为很多车企优先选用的感知硬件。随着搭载激光雷达的车辆越来越多,有些小伙伴不禁会想一个问题,那就是 车载激光雷达是否安全,当遇到搭载
    的头像 发表于 03-24 09:26 904次阅读
    自动驾驶中的<b class='flag-5'>激光雷达</b>是否会伤害人眼?

    激光雷达技术:自动驾驶的应用与发展趋势

    激光雷达是一种通过发射激光束并接收反射光束来测量物体距离和速度的传感器。它能够生成周围环境的精确三维地图,为自动驾驶车辆提供关键的感知信息。激光雷达的主要组成部分包括
    的头像 发表于 03-10 10:16 1422次阅读
    <b class='flag-5'>激光雷达</b>技术:自动驾驶的应用与发展趋势

    基于空谱特征优化选择的高光谱激光雷达地物分类

    其可快速高效获取地物目标三维空间信息的优势特点,在地物分类、森林管理、资源调查、城市三维建模等诸多领域发挥着越来越重要的作用。随着遥感探测领域的不断拓展与深化,如何实现激光雷达在复杂场
    的头像 发表于 01-08 10:29 755次阅读
    基于空谱特征优化选择的高光谱<b class='flag-5'>激光雷达</b>地物分类