0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里达摩院又有新的研究进展,在自动驾驶3D物体检测领域

算法与数据结构 来源:算法与数据结构 2020-05-06 10:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最新消息,阿里达摩院又有新的研究进展,这次在自动驾驶3D物体检测领域。

达摩院的研究人员提出一个通用、高性能的检测器,在自动驾驶领域权威数据集KITTI BEV(鸟瞰)上,检测速度达到25FPS ,一举占据榜首,与排名第二的方案相比,减少了一半多,同时精度也远超其他的单阶段检测器。可以说首次实现3D物体检测精度与速度兼得。

达摩院研究团队表示:“检测器是自动驾驶系统的核心组件之一,但该领域一直缺少创新和突破,此次我们实现3D检测精度和速度的提升,将有助于提高自动驾驶系统的安全性。”

从实验结果来看,他们显然取得了良好进展,而且研究的主要完成人员(一作),还是达摩院的实习生。

同时,该研究也得到了同行们的认可,被计算机视觉领域顶级会议CVPR 2020收录。他们是如何做到的呢?我们借助阿里达摩院提供的解读,一一来看。

如何实现精度和速度兼得?

众所周知,与普通2D图像识别应用不同,自动驾驶系统对精度和速度的要求更高,不仅需要快速识别周围环境的物体,还要对物体在三维空间中的位置做精准定位。

仅靠传感器算法模型,通常无法平衡视觉识别的精度和速度。因此,检测器成为提升自动驾驶系统安全性的一个关键因素。

经过多年研究,当前业界主流的单阶段检测器在检测速度上很好,但在检测精度却差强人意。

这就是达摩院研究的出发点:寻找一种能二者兼得的方法。

他们提出的思路是:将两阶段检测器中对特征进行细粒度刻画的思想,移植到单阶段检测中。

在他们的模型中,用于部署的检测器, 即推断网络, 由一个骨干网络和检测头组成。

骨干网络用3D的稀疏网络实现,用于提取含有高语义的体素特征。检测头将体素特征压缩成鸟瞰图表示,并在上面运行2D全卷积网络来预测3D物体框。

他们在训练中利用一个辅助网络将单阶段检测器中的体素特征,转化为点级特征并施加一定的监督信号

在实现上,他们将卷积特征中的非零信号映射到原始的点云空间中, 然后在每个点上进行插值,来获取卷积特征的点级表示。使得卷积特征也具有结构感知能力,来提高检测精度。

而在做模型推断时,辅助网络并不参与计算(detached),保证单阶段检测器的检测效率。

另外,他们还提出一个工程上的改进:Part-sensitive Warping (PSWarp),用于处理单阶段检测器中存在的 “框-置信度-不匹配” 问题。

核心思路是:利用采样器, 用生成的采样网格在对应的局部敏感特征图上进行采样,生成对齐好的特征图。最终能反映置信度的特征图,是K个对齐好特征图的平均。

单阶段方法,能达到两阶段方法精度

阿里达摩院的研究人员,在KITTI数据集上评估了方法的有效性。下图(PR Curve)中,实线为两阶段方法, 虚线为单阶段方法。

可以看出,达摩院提出的单阶段方法(黑色)能够达到两阶段方法才能达到的精度。

下图展示了他们在KITTI 鸟瞰(BEV) 和 3D 测试集上的结果。

可以看出,他们提出的方法,可以在不增加额外计算量的情况下,达到25FPS 的检测速度,而且还能保持精度。具体的检测效果如下:

两位共同一作,都是达摩院研究实习生

研究论文,标题为“Structure Aware Single-Stage 3D Object Detection from Point Cloud”,共有5名研究人员参与,分别来自阿里达摩院和香港理工大学。

第一作者是Chenhang He,是阿里达摩院的研究实习生,正在香港理工大学读博,预计2022年毕业。

他的导师是达摩院高级研究员、香港理工大学电子计算学系讲座教授、IEEE Fellow张磊,也是这一研究的通讯作者。

另一位第一作者Hui Zeng,也是是阿里达摩院的研究实习生,同样是张磊的博士生,预计在今年毕业。

其他作者,分别是达摩院高级研究员、IEEE Fellow华先胜、达摩院资深算法专家黄建强等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1715

    浏览量

    47481
  • 数据集
    +关注

    关注

    4

    文章

    1232

    浏览量

    26068
  • 自动驾驶
    +关注

    关注

    791

    文章

    14693

    浏览量

    176923

原文标题:阿里达摩院新研究:实习生一作突破自动驾驶技术难题,首次实现3D物体检测精度与速度兼得

文章出处:【微信号:TheAlgorithm,微信公众号:算法与数据结构】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    立体视觉和激光雷达3D智驾感知领域的差异分析

    随着智能驾驶技术从L2级辅助驾驶向L3级有条件自动驾驶加速演进,感知系统作为自动驾驶的“眼睛”,其技术路线的选择一直成为行业核心议题焦点,
    的头像 发表于 11-02 14:49 813次阅读
    立体视觉和激光雷达<b class='flag-5'>在</b><b class='flag-5'>3D</b>智驾感知<b class='flag-5'>领域</b>的差异分析

    iTOF技术,多样化的3D视觉应用

    。 ◆ 应用2—机舱内的 3D 传感 应用3—自主移动机器人 (AMR) 室外(~150,000 勒克斯)和黑暗环境中进行障碍物检测。 高分辨率能力,可准确
    发表于 09-05 07:24

    可存储1000张人脸特征的3D人脸识别模块 支持小程序管理

    ,专为用于智能智能门锁,智能门禁,金融支付等场景研发,支持3D体检测3D人脸识别,红外活体检测,可见光活体检测等,可以抵御照片、视频等二
    的头像 发表于 08-25 12:02 440次阅读
    可存储1000张人脸特征的<b class='flag-5'>3D</b>人脸识别模块 支持小程序管理

    自动驾驶汽车如何准确识别小物体

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要在道路上安全行驶,需要识别的东西远比我们所知道的诸如红绿灯、行人、车辆等复杂得多。其中有一个是我们经常会忽略,但同样非常重要的障碍物,那就是小物体,像是
    的头像 发表于 08-22 09:11 477次阅读
    <b class='flag-5'>自动驾驶</b>汽车如何准确识别小<b class='flag-5'>物体</b>?

    生成式 AI 重塑自动驾驶仿真:4D 场景生成技术的突破与实践

    生成式AI驱动的4D场景技术正解决传统方法效率低、覆盖不足等痛点,如何通过NeRF、3D高斯泼溅等技术实现高保真动态建模?高效生成极端天气等长尾场景?本文为您系统梳理AI驱动的4D场景生成体系及其
    的头像 发表于 08-06 11:20 4841次阅读
    生成式 AI 重塑<b class='flag-5'>自动驾驶</b>仿真:4<b class='flag-5'>D</b> 场景生成技术的突破与实践

    卡车、矿车的自动驾驶和乘用车的自动驾驶技术要求上有何不同?

    [首发于智驾最前沿微信公众号]自动驾驶技术的发展,让组合辅助驾驶得到大量应用,但现在对于自动驾驶技术的宣传,普遍是乘用车领域,而对于卡车、
    的头像 发表于 06-28 11:38 751次阅读
    卡车、矿车的<b class='flag-5'>自动驾驶</b>和乘用车的<b class='flag-5'>自动驾驶</b><b class='flag-5'>在</b>技术要求上有何不同?

    海伯森3D闪测传感器,工业检测领域的高精度利器

    优势,解决了接触式测量效率、精度、适应性上的瓶颈,尤其适合大批量生产、复杂结构检测、高附加值产品场景。工业检测领域
    的头像 发表于 06-20 17:46 1324次阅读
    海伯森<b class='flag-5'>3D</b>闪测传感器,工业<b class='flag-5'>检测</b><b class='flag-5'>领域</b>的高精度利器

    浅析4D-bev标注技术自动驾驶领域的重要性

    感知领域的一项突破性创新,通过引入时间维度与全局视角,为自动驾驶系统提供了高精度、多模态的时空真值数据,重塑了自动驾驶系统的开发范式。 4D-BEV标注是什么? 4
    的头像 发表于 06-12 16:10 1231次阅读

    普华基础软件莅临阿里巴巴达摩调研交流

    近日, 普华基础软件股份有限公司(以下简称普华基础软件)董事、总经理刘宏倩一行前往阿里巴巴达摩(杭州)科技有限公司(以下简称达摩)调研交
    的头像 发表于 04-08 10:10 971次阅读

    理想汽车推出全新自动驾驶架构

    2025年3月18日,理想汽车自动驾驶技术研发负责人贾鹏NVIDIA GTC 2025发表主题演讲《VLA:迈向自动驾驶物理智能体的关键一步》,分享了理想汽车对于下一代
    的头像 发表于 03-19 14:12 926次阅读

    康谋分享 | 3DGS:革新自动驾驶仿真场景重建的关键技术

    3DGS技术为自动驾驶仿真场景重建带来突破,通过3D高斯点精确表达复杂场景的几何和光照特性,显著提升渲染速度与图像质量。康谋aiSim平台结合3DGS,提供高保真虚拟环境与动态交通流模
    的头像 发表于 03-05 09:45 4928次阅读
    康谋分享 | <b class='flag-5'>3</b>DGS:革新<b class='flag-5'>自动驾驶</b>仿真场景重建的关键技术

    超景深3D检测显微镜技术解析

    现代科技领域,显微镜技术的发展始终是推动科学研究和技术进步的重要引擎。上海桐尔作为这一领域的探索者,其超景深3D
    发表于 02-25 10:51

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    目前高速发展的大模型能给具身智能带来一些突破性的进展。 对于感知系统,要做的主要任务是物体检测,语义分割,立体视觉,鸟瞰视角感知。 有很多算法都可以实现物体检测,比如文章提到的HOG + SVM算法
    发表于 01-04 19:22