0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种端到端的单阶段多视图融合3D检测方法MVAF-Net

新机器视觉 来源:新机器视觉 作者:新机器视觉 2021-01-27 11:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

该方法将激光雷达投影的BEV和前向视角、与摄像头视角图像作为检测输入,在特征融合中,提出attentive pointwise fusion (APF) 模块。设计attentive pointwise weighting (APW) 模块学习,附加另外两个任务foreground分类和中心回归。

af6eaade-6042-11eb-8b86-12bb97331649.png

如图是架构图:整个MVAF-Net包括三个部分

1)单视图特征提取(SVFE),

2)多视图特征融合(MVFF)

3)融合特征检测(FFD)。

afbae516-6042-11eb-8b86-12bb97331649.png

在SVFE部分,原始的RGB图像和点云由3-stream CNN主干(CV,BEV和RV)处理,生成多视图特征图,在BEV和RV做点云体素化。在MVFF部分,多视图特征与attentive pointwise fusion模块逐点自适应融合。融合的点特征通过attentive pointwise weighting模块进一步处理,对点特征进行加权并学习结构信息。在FFD部分,对融合和重加权的点特征再次体素化,并作融合主干输入给最终的3D检测。

RV投影表示为柱面坐标系统:

b02bd316-6042-11eb-8b86-12bb97331649.png

attentive pointwise fusion模块架构如下:

b0809f40-6042-11eb-8b86-12bb97331649.png

而attentive pointwise weighting模块架构如下:

b131afb0-6042-11eb-8b86-12bb97331649.png

MVAF-Net的主干网络细节如下图:

b1825e38-6042-11eb-8b86-12bb97331649.png

检测头包括:分类(focal loss)、框回归(SmoothL1 loss)和方向分类(softMax loss)。其总loss函数为

b20fc3a4-6042-11eb-8b86-12bb97331649.png

最后两个是前景分类项(focal loss)和中心回归项(SmoothL1 loss)。

结果如下:

b27a322a-6042-11eb-8b86-12bb97331649.png

结论

我们提出了一种端到端的单阶段多视图融合3D检测方法MVAF-Net,它由三部分组成:单视图特征提取(SVFE),多视图特征融合(MVFF)和融合特征检测(FFD)。在SVFE部分,三流CNN主干(CV,BEV和RV主干)使用LiDAR点云和RGB图像来生成多视图特征图。在MVFF部分,使用我们提出的注意点向融合(APF)模块实现了多视图特征的自适应融合,该模块可以使用注意力机制自适应地确定从多视图输入中引入了多少信息。此外,我们通过提出的注意点加权(APW)模块进一步改善了网络的性能,该模块可以对点特征进行加权并通过两个额外的任务来学习结构信息:前景分类和中心回归。大量实验验证了所提出的APF和APW模块的有效性。此外,所提出的MVAF-Net产生了竞争性结果,并且在所有单阶段融合方法中均达到了最佳性能。此外,我们的MVAF-Net胜过大多数两阶段融合方法,在KITTI基准上实现了速度和精度之间的最佳平衡。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2822

    浏览量

    52797
  • 摄像头
    +关注

    关注

    61

    文章

    5058

    浏览量

    102438
  • 激光雷达
    +关注

    关注

    978

    文章

    4377

    浏览量

    195364

原文标题:相机与激光雷达融合的3D目标检测方法MVAF-Net

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Vitrox的v510i系列的3D AOI光学检测设备

    V510i部署在SMT生产线的 贴片机之后、回流焊炉之前或之后 ,主要用于检测贴装好的电子元件是否存在缺陷。其核心任务是: 3D与2D复合检测 :同时利用
    的头像 发表于 12-04 09:27 109次阅读

    Nullmax轨迹规划论文入选AAAI 2026

    11月8日,全球人工智能顶会 AAAI 2026 公布论文录用结果,Nullmax 研发团队的轨迹规划论文成功入选。该论文创新提出一种由粗
    的头像 发表于 11-12 10:53 534次阅读

    板子的差分时钟如何正确地转化为

    本组使用的板子是GENESYS2,输入时钟信号为差分时钟信号,而E203使用的时钟都是的,所以需要将差分时钟信号转为。而通过网络检索,可以得到以下的
    发表于 10-27 07:29

    自动驾驶中“段式”和“二段式”有什么区别?

    [首发于智驾最前沿微信公众号]最近有小伙伴提问,段式和二段式
    的头像 发表于 10-24 09:03 626次阅读
    自动驾驶中“<b class='flag-5'>一</b>段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”和“二段式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”有什么区别?

    自动驾驶中常提的段式(段)是个啥?

    自动驾驶技术的发展,催生出技术的应用,段式
    的头像 发表于 10-18 10:16 1375次阅读

    玩转 KiCad 3D模型的使用

    时间都在与 2D 的焊盘、走线和丝印打交道。但个完整的产品,终究是要走向物理世界的。元器件的高度、接插件的朝向、与外壳的配合,这些都是 2D 视图难以表达的。 幸运的是,KiCad
    的头像 发表于 09-16 19:21 1w次阅读
    玩转 KiCad <b class='flag-5'>3D</b>模型的使用

    ABSD-10169PSM差分有源巴伦Marki

    ABSD-10169PSM差分有源巴伦MarkiABSD-10169PSM是款使用3mm QFN表面贴装封装的GaAs有源MMIC平
    发表于 06-19 09:21

    文带你厘清自动驾驶架构差异

    [首发于智驾最前沿微信公众号]随着自动驾驶技术飞速发展,智能驾驶系统的设计思路也经历了从传统模块化架构大模型转变。传统模块化架构将感知、预测、规划和控制等子任务拆分开,分别由不
    的头像 发表于 05-08 09:07 784次阅读
    <b class='flag-5'>一</b>文带你厘清自动驾驶<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>架构差异

    小米汽车智驾技术介绍

    后起之秀,小米在宣布造车前被非常的人质疑,但在“真香”定律下,小米创下了很多友商所不能及的成就。作为科技企业,小米也在智能驾驶领域也不断研发及突破,并推送了自动驾驶系统。 小米
    的头像 发表于 03-31 18:17 4777次阅读
    小米汽车<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>智驾技术介绍

    技术分享 |模态自动驾驶混合渲染HRMAD:将NeRF和3DGS进行感知验证和AD测试

    模态自动驾驶混合渲染HRMAD,融合NeRF与3DGS技术,实现超10万㎡场景重建,传感器实时输出,仿真更接近真实数据!然而,如何用高保真仿真场景快速验证自动驾驶算法?HRMAD已
    的头像 发表于 03-26 16:05 3921次阅读
    技术分享 |<b class='flag-5'>多</b>模态自动驾驶混合渲染HRMAD:将NeRF和<b class='flag-5'>3</b>DGS进行感知验证和<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>AD测试

    一种以图像为中心的3D感知模型BIP3D

    在具身智能系统中,3D感知算法是个关键组件,它在侧帮助可以帮助智能体理解环境信息,在云端可以用来辅助生成3D场景和3D标签,具备重要的研
    的头像 发表于 03-17 13:44 957次阅读
    <b class='flag-5'>一种</b>以图像为中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    BEVFusion —面向自动驾驶的多任务传感器高效融合框架技术详解

    ,激光雷达在3D视图中捕获数据。1. 核心目标与创新‌目标‌ 解决模态传感器(摄像头、激光雷达等)在3D感知任务中的异构数据融合难题,实现
    的头像 发表于 02-26 20:33 5968次阅读
    BEVFusion —面向自动驾驶的多任务<b class='flag-5'>多</b>传感器高效<b class='flag-5'>融合</b>框架技术详解

    ADS1147可以配置成3输入,为什么是3个?

    ADS1147可以配置成3输入,为什么是3个?比如我要配置AIN0为输入,那是不是选
    发表于 02-10 07:06

    SciChart 3D for WPF图表库

    DirectX 支持的 WPF 3D 图表和广泛的 API 完成工作。 WPF 3D 图表性能 我们传奇的 WPF 3D 图表性能由广泛的
    的头像 发表于 01-23 13:49 1248次阅读
    SciChart <b class='flag-5'>3D</b> for WPF图表库

    光学系统的3D可视化

    视图 3D 系统视图: 无光可视化系统 选项 - 选择要显示的元件 右键单击文档窗口,菜单上将显示详细选项。第个选项 \"Select Elements to Show\&quo
    发表于 01-06 08:53