0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶有了占用网络还需要卷积神经网络吗?

智驾最前沿 2026-05-04 18:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]在自动驾驶的视觉感知领域,占用网络(Occupancy Network)风头正劲,大有取代传统目标检测方案的势头。在最近一篇交流占用网络的文章中,有小伙伴提问,自动驾驶有了占用网络还需要卷积神经网络(CNN)吗?

对于这个问题我们需要先厘清它们在整个系统里扮演的角色。占用网络在自动驾驶中更像是一种对世界的表达方式,而CNN则是处理图像信息的基础工具。这两者之间并不是非此即彼的替代关系,而是各司其职。

wKgZO2nltR-ABk2HAAAQo00DEvw658.jpg

传统的视觉识别是怎么工作的?

在占用网络流行之前,自动驾驶的主流感知方案是基于CNN的目标检测。你可以把它想象成给摄像头拍到的每一张照片画框。

当摄像头拍摄到前方的道路,CNN会通过一层层的卷积运算,从像素中提取出边缘、纹理、形状等特征。如果它发现某个区域的特征符合它学习过的车或者人的特征,就会在该位置打上一个标签,并给出一个矩形框。

wKgZPGnltR-AW6L0AABAjIC9Zo4170.jpg

卷积神经网络架构

这种方式在处理标准物体时效率非常高,因为它直接告诉了系统前方多远有一辆车。

然而,单纯依靠画框的方案存在一个明显的短板,就是它很难处理那些没见过的物体。

如果路面上掉落了一个形状奇特的塑料桶,或者有一辆侧翻的运载奇形怪状建筑材料的卡车,传统的CNN目标检测模型可能会因为找不到匹配的特征而漏检。

这是因为这类模型本质上是在做分类题,如果题目超出了它的知识库,它就可能选择视而不见。这种漏检对于追求极致安全的自动驾驶来说,显然是不可接受的。

wKgZO2nltSCAG-ldAAAR42n7O-I833.jpg

为什么需要占用网络?

为了解决这种“长尾问题”,占用网络应运而生。它不再试图去分辨前方到底是车还是树,而是直接把三维空间切成无数个微小的方格,也就是我们常说的体素。

占用网络的目标非常单纯,那就是判断每一个方格是被占据了,还是空闲的。

通过这种方式,感知系统就能构建出一个实时的三维物理世界模型。在这个模型里,哪怕前方是一堆乱七八糟的杂物,只要它占据了空间,占用网络就会把它标记为不可通行。

wKgZPGnltSGAC3LSAACz3BFhSGA936.jpg

这种从做分类题到做空间判断题的转变,极大地提升了自动驾驶对未知环境的适应能力。它不再依赖于复杂的物体标签,而是回归到了物理世界的本质。

通过占用网络,车辆可以更精准地感知物体的边缘、高度和深度,甚至能预测物体在空间中的运动趋势。

这不仅解决了漏检奇形怪状物体的问题,也为车辆的规控系统提供了更干净、更立体的环境地图。

wKgZO2nltSGAM09hAAASG3BOmsQ413.jpg

占用网络和CNN是替代关系吗?

既然占用网络这么厉害,那CNN是不是就可以不再使用了呢?答案是否定的。实际上,目前的占用网络架构中,CNN依然发挥着不可替代的基础作用。

我们要明白,占用网络处理的是三维空间的占用情况,但传感器的输入,尤其是摄像头拍摄的原始画面,依然是二维的像素点。

要把这些杂乱的像素变成有意义的特征,最成熟、最高效的手段依然是CNN。

在目前的感知流程中,CNN充当着骨干网络的角色。摄像头捕获图像后,首先由CNN进行初步的特征提取,把图像转化成高维的特征向量。这些特征向量里包含了物体的颜色、纹理、明暗变化等关键信息。

随后,这些信息才会被送入后续的模块(比如Transformer或跨空间映射模块),转化成三维空间下的占用概率。

换句话说,CNN负责看,它提供了感知的素材;而占用网络负责想,它基于这些素材把世界构造成三维的模样。

wKgZO2nltSOAHgYHAAASAJELks8279.jpg

未来的感知架构会如何演进?

虽然CNN目前依然稳坐骨干网络的宝座,但自动驾驶的感知架构确实在发生变化。随着计算硬件的升级,一些原本由CNN承担的任务正在向Transformer转移,尤其是在处理多摄像头融合和长时序信息时,Transformer表现出了更强的全局建模能力。

但这并不意味着CNN会彻底消失。在一些对实时性要求极高、计算资源相对有限的边缘处理任务上,CNN凭借其局部特征提取的极高效率,依然具有很强的竞争力。

未来的自动驾驶感知系统,大概率会是一种多种技术深度融合的状态。CNN可能会继续在底层处理图像像素,通过轻量化的设计快速提取基础特征;而占用网络则在更高层级上统领全局,把来自不同传感器的数据整合成统一的空间模型。

在这个进化的过程中,占用网络并没有淘汰CNN,而是把CNN从繁重的画框任务中解放了出来,让它回归到最擅长的图像特征提取工作中。

两者的结合,让自动驾驶汽车能够不仅看清路上的物体,更能真正读懂这个立体的物理世界。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    795

    文章

    15011

    浏览量

    181712
  • 卷积神经网络

    关注

    4

    文章

    375

    浏览量

    12928
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶占用网络还需要数据标注吗?

    [首发于智驾最前沿微信公众号]在自动驾驶领域,占据网络(Occupancy Network,简称OCC)一直是近年来的热点技术。不知道大家在了解占用网络时,是否会有这么一个想法,那就是
    的头像 发表于 04-17 08:53 423次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>占用</b><b class='flag-5'>网络</b><b class='flag-5'>还需要</b>数据标注吗?

    卷积神经网络如何让自动驾驶识别障碍物?

    自动驾驶的发展过程中,感知系统一直承担车辆“眼睛”的角色,其核心任务是让计算机理解复杂多变的物理世界。卷积神经网络(CNN)作为一种专门用于处理图像和视频等网格状数据结构的深度学习模型,已经成为
    的头像 发表于 04-11 09:59 1488次阅读
    <b class='flag-5'>卷积</b><b class='flag-5'>神经网络</b>如何让<b class='flag-5'>自动驾驶</b>识别障碍物?

    自动驾驶中常提的占用网络检测存在哪些问题?

    自动驾驶感知技术在过去几年中经历很大的变化,从最初的二维图像检测到鸟瞰图投影,再到如今备受关注的占用网络,感知技术的提升,让自动驾驶的能力
    的头像 发表于 02-24 15:53 1194次阅读

    神经网络的初步认识

    日常生活中的智能应用都离不开深度学习,而深度学习则依赖于神经网络的实现。什么是神经网络神经网络的核心思想是模仿生物神经系统的结构,特别是大脑中神经
    的头像 发表于 12-17 15:05 484次阅读
    <b class='flag-5'>神经网络</b>的初步认识

    Transformer如何让自动驾驶变得更聪明?

    ]自动驾驶中常提的Transformer本质上是一种神经网络结构,最早在自然语言处理里火起来。与卷积神经网络(CNN)或循环神经网络(RNN
    的头像 发表于 11-19 18:17 2484次阅读

    自动驾驶中常提的卷积神经网络是个啥?

    自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像
    的头像 发表于 11-19 18:15 2277次阅读
    <b class='flag-5'>自动驾驶</b>中常提的<b class='flag-5'>卷积</b><b class='flag-5'>神经网络</b>是个啥?

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    数的提出很大程度的解决BP算法在优化深层神经网络时的梯度耗散问题。当x&gt;0 时,梯度恒为1,无梯度耗散问题,收敛快;当x&lt;0 时,该层的输出为0。 CNN
    发表于 10-29 07:49

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    构建CNN网络模型并优化的一般化建议

    通过实践,本文总结了构建CNN网络模型并优化的一般化建议,这些建议将会在构建高准确率轻量级CNN神经网络模型方面提供帮助。 1)避免单层神经网络:我们清楚神经网络本身是
    发表于 10-28 08:02

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    模型。 我们使用MNIST数据集,训练一个卷积神经网络(CNN)模型,用于手写数字识别。一旦模型被训练并保存,就可以用于对新图像进行推理和预测。要使用生成的模型进行推理,可以按照以下步骤进行操作: 1.
    发表于 10-22 07:03

    CICC2033神经网络部署相关操作

    读取。接下来需要使用扩展指令,完成神经网络的部署,此处仅对第一层卷积+池化的部署进行说明,其余层与之类似。 1.使用 Custom_Dtrans 指令,将权重数据、输入数据导入硬件加速器内。对于权重
    发表于 10-20 08:00

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的神经结构,尽管这种微生物的
    的头像 发表于 09-28 10:03 1602次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    卷积神经网络如何监测皮带堵料情况 #人工智能

    卷积神经网络
    jf_60804796
    发布于 :2025年07月01日 17:08:42

    神经网络专家系统在电机故障诊断中的应用

    的诊断误差。仿真结果验证该算法的有效性。 纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:神经网络专家系统在电机故障诊断中的应用.pdf【免责声明】本文系网络转载,版权归原作
    发表于 06-16 22:09

    基于FPGA搭建神经网络的步骤解析

    本文的目的是在一个神经网络已经通过python或者MATLAB训练好的神经网络模型,将训练好的模型的权重和偏置文件以TXT文件格式导出,然后通过python程序将txt文件转化为coe文件,(coe
    的头像 发表于 06-03 15:51 1540次阅读
    基于FPGA搭建<b class='flag-5'>神经网络</b>的步骤解析