0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶占据感知网络越精细越好吗?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2026-05-06 09:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]在自动驾驶的感知领域,占据感知网络(Occupancy Network,简称OCC)已成为理解三维世界的主流方案。它就像是将车身周围的空间切割成无数个细小的乐高方块,通过判断每个方块是否被物体占据,来构建出一张完整的三维地图。如果想让自动驾驶系统看得更清、避障更准,那就得把这些方块做得更小、更密,也就是提升体素的精细度,那体素越精细就越好吗?

wKgZPGn6ldiAITcYAAAQo00DEvw369.jpg

怎样把虚拟空间刻画得更细腻?

想要提升体素的精细度,核心在于如何在特征提取阶段保留更多的细节。摄像头拍摄的高清图像在经过深度神经网络处理后,会为了提取语义信息而不断被压缩,导致很多微小的结构信息丢失。为了解决这个问题,算法会采用多尺度特征融合的技术,就是让模型在处理图像时,既盯着全局的大轮廓,也不放过局部的细微像素。通过将高层级的语义特征与低层级的细节特征进行融合,算法就能获得更加丰富的原始素材,为后续生成高精度的体素奠定基础。

wKgZPGn6ldiATgZyAAE4H9lCoLQ236.jpg

图片源自:网络

在将图像信息映射到三维空间时,采样点的密度决定了最终的细腻程度。传统的方案只是在空间中稀疏地放一些探测点,而精细化的OCC则会撒下更密的查询网。每一个查询点都会去图像中寻找对应的像素特征,并结合深度预测信息,准确地填入对应的空间方块中。

时序信息的加入也起到了关键作用,由于车辆在行驶中视角会不断变化,系统可以利用前几帧的观察结果来补充当前的视野盲区。这种利用时间换空间的方法,通过多帧数据的交叉印证,能够让原本模糊的物体边缘变得清晰起来,甚至能识别出细长的电线杆或垂下的树枝。

空间表达方式的改进也是让体素变精细的有效途径,直接在三维空间中堆叠高分辨率的方块会消耗巨大的资源,因此有技术提出了像是三视图投影(TPV)等技术。这种方法不再死磕完整的三维立方体,而是把三维信息投影到三个相互垂直的平面上进行处理。在二维平面上操作高分辨率数据的成本远低于三维空间,通过这种巧妙的维度转换,算法能够在逻辑上实现极高的分辨率,最后再还原回三维世界,从而在保证精细度的同时,绕开了直接计算海量三维数据的难题。

wKgZO2n6ldmAC-BMAAAR42n7O-I830.jpg

算法如何避免计算量的爆炸式增长?

追求极致的精细度其实是一把双刃剑,当精细度提升后,必然会带来计算量的爆炸式增长。在三维空间中,分辨率的提升与计算成本之间并不是线性的关系,而是呈立方倍数增长。如果我们将体素的边长缩小一半,同一空间内的体素数量就会变成原来的八倍。这意味着车载芯片不仅要处理海量的浮点运算,还要面对巨大的显存压力。如果硬件的显存带宽无法支撑这种数据吞吐量,感知系统就会出现严重的延迟。在高速行驶的过程中,几十毫秒的延迟就可能导致车辆错过最佳的制动时机。

wKgZPGn6ldqAQpi3AACz3BFhSGA284.jpg

图片源自:网络

为了缓解这种压力,算法并不倾向于在所有区域都实行均匀细化,而是采用了更聪明的按需分配策略。如系统会引入稀疏化处理技术,只针对那些真正有物体存在的区域进行精细建模,而对于大片空旷的区域(如天空或开阔的远景)则采用粗略的描述甚至直接略过。这种思路也演变成了非均匀网格方案,即在车辆近处、对驾驶决策影响较大的范围内使用高精细度的体素,而在远处则逐渐降低分辨率。这种近实远虚的分配方案,既保留了关键的细节,又极大地节省了宝贵的算力资源。

层次化的结构也是一种有效的优化手段。系统可以先在一个较低的分辨率下进行预扫,确定哪些地方可能有东西,然后再对这些感兴趣的区域进行递归式的细化。这种从粗到细的处理流程,避免了在无意义的空域上浪费计算资源。通过这种动态调整精度的方法,感知网络可以在保持实时性的前提下,实现对复杂障碍物(如路边的绿化带、散落的纸箱等)的精准刻画。

wKgZO2n6ldqALFOCAAASG3BOmsQ586.jpg

变清晰之后会面临哪些新麻烦?

体素变精细后,另一个隐蔽但棘手的问题是噪声和虚警。当方块划分得非常细时,算法对于输入数据的细微抖动会变得异常敏感。摄像头图像中的一点光影闪烁,或者传感器在标定上的微小误差,在精细的体素空间里都可能被放大成不存在的障碍物。这种现象就像是照相机感光度调得太高后出现的噪点,会让系统误以为前方有障碍而触发频繁的减速甚至急刹车。如何在高分辨率和信号稳定性之间找到平衡,是技术落地时必须要解决的问题。

wKgZPGn6lduAb9cwAAadZZ1MXyI927.jpg

图片源自:网络

当体素更精细后,数据标注的复杂度也会大幅度提升。要训练一个精细的占据感知网络,就需要极其精准的真值作为参考,目前主流的做法是利用激光雷达收集的点云来生成标签。但激光雷达的点云会随着距离增加会迅速变得稀疏。当我们要求的体素精细度超过了激光雷达点的密度时,很多小方块里其实根本没有参考数据。这种数据的断层会让模型在学习时产生困惑,因为它不知道那些没有点云落入的缝隙到底是真实的物理空间,还是传感器的盲区。

体素精细化后还会涉及多传感器之间协同的问题,虽然摄像头能提供丰富的细节,但它对距离的感知天然不如激光雷达准确。在极高分辨率的体素网格中,这种距离上的微小偏差会被体现得淋漓尽致,导致不同传感器给出的信息在同一个细小方块里发生冲突。这种冲突如果不经过复杂的融合算法处理,反而会降低感知的可信度。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    795

    文章

    15014

    浏览量

    181728
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶有了占用网络还需要卷积神经网络吗?

    在占用网络流行之前,自动驾驶的主流感知方案是基于CNN的目标检测。你可以把它想象成给摄像头拍到的每一张照片画框。
    的头像 发表于 05-04 18:05 3369次阅读
    <b class='flag-5'>自动驾驶</b>有了占用<b class='flag-5'>网络</b>还需要卷积神经<b class='flag-5'>网络</b>吗?

    自动驾驶占用网络还需要数据标注吗?

    [首发于智驾最前沿微信公众号]在自动驾驶领域,占据网络(Occupancy Network,简称OCC)一直是近年来的热点技术。不知道大家在了解占用网络时,是否会有这么一个想法,那就是
    的头像 发表于 04-17 08:53 425次阅读
    <b class='flag-5'>自动驾驶</b>占用<b class='flag-5'>网络</b>还需要数据标注吗?

    自动驾驶占据感知网络是如何识别障碍物的?

    方式虽然直观,但在面对现实世界中千奇百怪的物体时,就会显得力不从心。为了解决这一问题,占据感知网络(Occupancy Network,简称OCC)技术逐渐成为行业主流。 为什么传统的画框方式不够用了 在过去很长一段时间里,
    的头像 发表于 04-15 09:37 245次阅读
    <b class='flag-5'>自动驾驶</b>中<b class='flag-5'>占据</b><b class='flag-5'>感知</b><b class='flag-5'>网络</b>是如何识别障碍物的?

    卷积神经网络如何让自动驾驶识别障碍物?

    自动驾驶的发展过程中,感知系统一直承担车辆“眼睛”的角色,其核心任务是让计算机理解复杂多变的物理世界。卷积神经网络(CNN)作为一种专门用于处理图像和视频等网格状数据结构的深度学习模型,已经成为
    的头像 发表于 04-11 09:59 1497次阅读
    卷积神经<b class='flag-5'>网络</b>如何让<b class='flag-5'>自动驾驶</b>识别障碍物?

    自动驾驶感知硬件清洁装置应如何设计?

    自动驾驶发展过程中,感知系统的可靠性一直是大家讨论的热点。尽管目前的传感器在探测距离、分辨率和响应速度上已经取得了长足进步,但有一个产品落地时必须考虑却鲜被讨论的问题,那就是感知硬件的脏污处理。
    的头像 发表于 03-09 17:08 961次阅读

    为什么光照对纯视觉自动驾驶影响较大?

    自动驾驶的技术路线中,纯视觉方案因其模仿人类驾驶逻辑与低廉的硬件成本,一直是很多车企的选择。但这种高度依赖摄像头的感知方式,在夜幕降临、车辆驶入幽暗的隧道,或是遭遇强烈的逆光直射、漫天的雨雪浓雾时,
    的头像 发表于 03-09 17:06 1056次阅读

    自动驾驶中常提的占用网络检测存在哪些问题?

    自动驾驶感知技术在过去几年中经历了很大的变化,从最初的二维图像检测到鸟瞰图投影,再到如今备受关注的占用网络感知技术的提升,让自动驾驶的能力
    的头像 发表于 02-24 15:53 1199次阅读

    自动驾驶汽车如何完成超车?

    经过一套完整的感知、理解、决策、规划和控制的流程,每一步都要考虑安全和规范,需要不断感知周围环境,判断什么时候超车、怎么超车、是否安全等,然后才可以按照计划执行操作。 自动驾驶汽车在变道前需要全面看懂如前车
    的头像 发表于 02-16 17:37 1.7w次阅读
    <b class='flag-5'>自动驾驶</b>汽车如何完成超车?

    自动驾驶汽车如何实现自动驾驶

    人类驾驶员而言是非常直观且有效的指令,但对于自动驾驶汽车来说,则意味着需要一套极其复杂的感知、理解与决策链路。 自动驾驶如何看清文字? 自动驾驶
    的头像 发表于 02-10 08:50 831次阅读
    <b class='flag-5'>自动驾驶</b>汽车如何实现<b class='flag-5'>自动驾驶</b>

    占用网络为什么让自动驾驶感知更精准?

    [首发于智驾最前沿微信公众号]自动驾驶技术的演进过程,本质上是人类试图赋予机器“理解物理世界几何结构”能力的过程。在过去很长一段时间里,感知系统高度依赖于对特定目标的“分类与识别”。如果系统在训练
    的头像 发表于 01-19 09:26 542次阅读
    占用<b class='flag-5'>网络</b>为什么让<b class='flag-5'>自动驾驶</b><b class='flag-5'>感知</b>更精准?

    自动驾驶汽车中传感器用得越多就越好吗

    [首发于智驾最前沿微信公众号]为确保自动驾驶安全,很多技术方案中都会采用感知冗余的方式来兜底,即在车辆上加装多个传感器,以实现更多的信息感知。其实对于自动驾驶汽车来说,每个传感器都有自
    的头像 发表于 11-28 09:46 790次阅读
    <b class='flag-5'>自动驾驶</b>汽车中传感器用得越多就<b class='flag-5'>越好吗</b>?

    自动驾驶感知不一致是怎么发生的?

    [首发于智驾最前沿微信公众号]为了让自动驾驶汽车能够安全行驶,很多技术方案中会将多个感知硬件加装到车辆上,以确保自动驾驶汽车感知冗余,但感知
    的头像 发表于 09-17 12:45 974次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>感知</b>不一致是怎么发生的?

    如何确保自动驾驶汽车感知的准确性?

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要自动驾驶,首先要做的就是能对周边环境实现精准感知,也就是能“看”清道路,那自动驾驶汽车如何在复杂、快速变化的道路环境中做到
    的头像 发表于 08-23 15:06 1851次阅读
    如何确保<b class='flag-5'>自动驾驶</b>汽车<b class='flag-5'>感知</b>的准确性?

    自动驾驶系统的算力越高就越好吗

    [首发于智驾最前沿微信公众号]自动驾驶系统的“算力”是指车载计算平台中用于执行感知、决策、规划和控制等算法的硬件性能指标。之前给大家分享了算力的概念及作用,从概念上看,算力越强大,就意味着系统能够
    的头像 发表于 08-11 18:30 1036次阅读

    SONY FCB-CR8530,如何重塑自动驾驶视觉感知格局?

    自动驾驶技术快速发展的当下,车辆对周围环境的精准感知是确保安全与高效运行的关键。凯茉锐电子SONY FCB-CR8530摄像机凭借其卓越性能,正逐渐成为自动驾驶领域视觉感知系统的核心
    的头像 发表于 06-25 17:54 799次阅读