0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶占用网络处理天空和路面的逻辑一样吗?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 陈云培 2026-03-25 08:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]在自动驾驶领域,如何准确地感知和理解周围的三维环境始终是技术核心。早期的感知方案主要依赖于二维目标检测,即通过图像识别出车辆、行人和交通标志,并在其周围画出矩形框。

这种基于框的识别方式在面对复杂和不规则物体时显得力不从心。随着技术的发展,鸟瞰图技术将多摄像头采集的图像转换到俯视坐标系中,极大地改善了路径规划的效率,但它依然忽略了高度维度的信息。占用网络的出现彻底改变了这一现状。

wKgZPGnDMPKAMO7bAAAQo00DEvw270.jpg

占用网络的优势是什么?

占用网络不再只是关注路面上“这是一个什么物体”,而是通过将三维空间切分为无数个细小的方块,即体素,来预测每个空间单位是否被占据。这种从“物体优先”向“几何优先”的转变,使自动驾驶系统能够识别出那些在传统模型库中不存在的异形物体,从而有效填补了感知上的语义裂隙。

占用网络的核心优势在于它能够提供一种密集的、具有高度信息的环境描述。通过这种方式,车辆不仅能看到前方有一辆车,还能感知到路面上的细微起伏、伸向道路的树枝或是倾斜的路灯杆。这种全方位的感知能力直接提升了自动驾驶系统在复杂城市场景和非结构化道路中的安全性。

wKgZO2nDMPKAWTpqAACz3BFhSGA161.jpg

图片源自:网络

在占用网络的构建过程中,针对不同性质的场景元素采取差异化的处理手段是提升精度的关键。尤其是路面与天空这两类特征迥异的场景,它们分别代表了物理世界的“支撑面”与“无穷远边界”,其处理逻辑在算法底层有着本质的区别。

占用网络通常由一个强大的主干网络提取多视角图像特征,随后利用注意力机制将这些二维特征投影到三维体素空间中。在这一过程中,算法必须能够辨别哪些像素对应着立体的物理障碍物,哪些像素仅仅是作为背景存在。

路面作为车辆行驶的基础,其几何特征的重构精度直接影响到避障和悬挂控制;而天空则是一个没有深度信息的区域,它在占用网络中更多地扮演着“几何定标”和“负约束”的角色。对这两个场景进行差异化处理,不仅是提升算力效率的需要,更是实现高可靠感知的必然选择。

wKgZPGnDMPOAQZFlAAAR42n7O-I546.jpg

占用网络如何处理路面?

路面在占用网络中被视为最基础的静态场景。虽然在视觉上路面呈现出较为统一的纹理,但在三维空间中,路面的处理远比看上去复杂。路面不仅是“被占据”的体素,它还承载着坡度、颠簸以及路缘石等关键几何信息。

为了做好路面的区分,占用网络首先需要解决高精度的高度估计问题。传统的视觉感知算法在处理远距离路面时,由于透视效应和图像分辨率的限制,会出现严重的深度误差。占用网络通过引入高程重构技术,能够刻画出路面的凹凸不平,这对于车辆在复杂地形下的速度规划至关重要。

在处理路面时,算法会利用“地平面先验”作为约束。这意味着模型会预先假设路面是一个大致连续的表面,并在此基础上通过多帧图像的融合来消除单帧预测带来的噪声。

对于非结构化道路中的起伏,一些先进的模型采用了坡度感知的自适应特征提取模块。该模块可以根据输入图像动态调整特征权重,从而在陡坡或急弯处保持稳定的路面追踪能力。

与处理障碍物不同,路面的体素填充逻辑一般是分层进行的。模型会先生成一个粗略的地面网格,再根据局部的图像特征进行亚体素级别的细节修正,这种从粗到精的过程保证了感知系统对行驶路径的精准判断。

数据层面的处理同样体现了路面的特殊性。在生成用于训练占用网络的地面真值标签时,直接使用激光雷达点云会遇到稀疏性的问题。由于激光束与地面夹角很小,远处的点云几乎无法覆盖地面。

因此,有技术提出了专门的标签生成管线,通过融合多帧序列、利用泊松重构等算法填补空洞,从而生成一个连续、平滑且具有真实语义的路面体素模型。

此外,针对路面反光或阴影导致的识别错误,占用网络会结合语义分割信息,将标记为“可行驶区域”的像素点与空间中的深度值进行交叉验证,确保被占据的路面体素不会与空中的悬浮物混淆。

特斯拉等车企的占用网络通过预测“带符号距离场”来进一步提升路面的表现。这种方法不仅能确定路面是否被占据,还能计算出空间中任意一点距离路面表面的精确距离。这种精度的提升使得车辆能够识别出路面上微小的凸起。这种对路面的精细化建模,极大地增强了自动驾驶系统对复杂路况的适应性。

wKgZPGnDMPSAYHv9AAASG3BOmsQ456.jpg

占用网络如何处理天空?

相比于路面的“重几何”属性,天空在占用网络中的处理逻辑则更倾向于“重语义”和“负反馈”。天空其实是无尽的背景,激光雷达等主动传感器无法在天空区域获得反射信号,因此天空在传感器的原始数据中通常表现为“丢失”或“无穷远”。

如果算法不对天空进行特殊处理,那么在将图像特征投影到三维空间时,天空区域的像素特征可能会因为缺乏深度约束而沿着光束方向发生“漂移”,错误地填充到近处的体素中,形成“深度流血”现象。

为了有效地区分天空,占用网络引入了“天空接地”技术。这一技术是利用大模型或预训练的语义网络识别出图像中的天空区域,并将其作为感知系统的边界约束。

在投影过程中,属于天空区域的体素会被强制标记为“空闲”或“未观测”,从而防止系统在半空中产生虚假的障碍物。这种方法本质上是将天空视为一个过滤器,利用视觉背景的确定性来反向优化三维空间的几何结构。这与路面处理中不断寻找“支撑点”的逻辑正好相反,天空的处理是在不断地进行“空间排除”。

天空在环境理解中还承担着辅助定标的任务。通过分析天空中云层的分布、光线的明暗以及地平线的位置,算法可以辅助修正相机的外参。在无人船或极端地形下的自动驾驶中,利用颜色空间模型(如亮度与饱和度分布)对天空进行精准检测,能够帮助系统更快速地识别出陆地和水面的界限。

在占用网络的训练阶段,对于天空标签的缺失,研究人员会引入“能见度掩码”的机制。该机制能够区分一个体素是确实没有被占据,还是因为被遮挡而无法观测。由于天空永远不会被“占据”,它在能见度推理中提供了一个天然的终点参考。

三透视视图(TPV)等新型表征方式对天空的处理更加得心应手。TPV将空间分解为顶视、侧视和前视三个互相垂直的平面,天空的语义特征可以在侧视和前视图中得到充分的表达,而不会像传统的鸟瞰图(BEV)那样将高度信息完全压缩。

这种多维度的特征融合,当像素出现在图像上方且呈现出天空特有的色彩分布时,其对应的三维体素应具有极低的占据概率。这种语义驱动的几何推理,是占用网络能够处理各种复杂气象和光照条件的关键所在。

wKgZPGnDMPSAPrLGAAASAJELks8549.jpg

异构场景的统一建模与技术协同

占用网络之所以强大,是因为它能在同一个框架下,利用完全不同的逻辑同时处理路面、天空和各种复杂的障碍物。这种统一性是通过复杂的特征提升与融合机制实现的。

在自动驾驶算法中,三透视视图(TPV)和Transformer结构的引入,使得模型能够根据空间位置的动态变化,自适应地应用不同的处理策略。如当系统识别到一个体素位于车辆下方且语义接近“路面”时,会更侧重于几何表面的平滑性;而当体素位于视野上方且呈现天空特征时,系统则会应用更强的负约束来清空该区域。

为了在有限的算力下实现这种精细化的场景区分,有技术提出了“距离感知”的感知范式。在车辆附近的“安全核心区”,系统会分配更高的分辨率和更多的体素单元,以便精确重构路面的每一个细节;而在远距离区域,则采用更粗糙的体素划分,主要依靠语义信息来判断天空和背景的边界。

这种资源分配策略不仅模拟了人类视觉“近精远粗”的特点,还显著提升了系统的实时处理能力。

同时,为了解决传感器数据的稀疏性和噪声问题,自监督学习技术开始崭露头角。通过利用神经辐射场(NeRF)等渲染技术,模型可以将预测的三维占用图重新投影回二维图像,并与原始视频帧进行比对,从而在没有人工标注的情况下,自主学习如何区分复杂的路面纹理与变幻莫测的天空背景。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    794

    文章

    14976

    浏览量

    181355
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶占用网络还需要数据标注吗?

    [首发于智驾最前沿微信公众号]在自动驾驶领域,占据网络(Occupancy Network,简称OCC)直是近年来的热点技术。不知道大家在了解占用
    的头像 发表于 04-17 08:53 358次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>占用</b><b class='flag-5'>网络</b>还需要数据标注吗?

    自动驾驶汽车如何探测路面的积水深度?

    [首发于智驾最前沿微信公众号]对于自动驾驶汽车来说,雨天和积水直是非常棘手的挑战。在晴朗的天气里,传感器可以轻松识别车道线、行人和其他车辆,但当路面出现大面积积水甚至发生内涝时,情况就变得复杂了
    的头像 发表于 04-07 08:51 314次阅读
    <b class='flag-5'>自动驾驶</b>汽车如何探测<b class='flag-5'>路面的</b>积水深度?

    大模型时代自动驾驶标注有什么特殊要求?

    的端到端架构和占用网络,标注工作已经从平面的像素点位,跨越到了四维时空的深度重建。 空间的立体化与时间的连贯性挑战 自动驾驶标注的难点在于从二维图像向三维向量空间的跃迁。早期的算法
    的头像 发表于 03-01 09:09 3057次阅读
    大模型时代<b class='flag-5'>自动驾驶</b>标注有什么特殊要求?

    自动驾驶在颠簸路面如何确保感知准确性?

    [首发于智驾最前沿微信公众号]当自动驾驶汽车在城市道路、乡间小路或石子路面行驶时,感知系统的稳定性会面临前所未有的考验。这种考验不仅源于环境光照的变化或障碍物类型的增多,更来自于车辆与路面交互时产生
    的头像 发表于 02-25 08:51 666次阅读
    <b class='flag-5'>自动驾驶</b>在颠簸<b class='flag-5'>路面</b>如何确保感知准确性?

    自动驾驶中常提的占用网络检测存在哪些问题?

    自动驾驶感知技术在过去几年中经历了很大的变化,从最初的二维图像检测到鸟瞰图投影,再到如今备受关注的占用网络,感知技术的提升,让自动驾驶的能力越来越强。
    的头像 发表于 02-24 15:53 1151次阅读

    自动驾驶端到端为什么会出现黑盒现象?

    自动驾驶领域,端到端(End-to-End)是指从感知环境的原始数据到车辆实际控制指令,全部交给个统的深度学习模型来完成。这和传统的模块化自动驾驶系统不
    的头像 发表于 02-20 09:25 9519次阅读
    <b class='flag-5'>自动驾驶</b>端到端为什么会出现黑盒现象?

    如何设计好自动驾驶ODD?

    为确定自动驾驶的可使用范围,会给自动驾驶设置个运行设计域(Operational Design Domain,ODD)。ODD的作用就是用来明确自动驾驶在什么情况下能工作,在什么情况
    的头像 发表于 01-24 09:27 1721次阅读

    L3级自动驾驶在技术上有什么不一样的要求?

    [首发于智驾最前沿微信公众号]最近,很多小伙伴在后台私信,想了解L3级自动驾驶有哪些技术要求。其实对于自动驾驶行业来说,L3级是个非常重要的分水岭。旦达到L3级,车辆的主要
    的头像 发表于 01-07 08:51 2824次阅读
    L3级<b class='flag-5'>自动驾驶</b>在技术上有什么不<b class='flag-5'>一样</b>的要求?

    纯视觉自动驾驶会像人眼一样“近视”吗?

    [首发于智驾最前沿微信公众号]在自动驾驶领域,纯视觉路线逐渐获得了部分从业者和研究者的认可与支持。随着双目乃至三目摄像头方案的应用,通过视差计算、结构约束和算法建模,摄像头已经具备了定程度的深度
    的头像 发表于 12-15 09:23 873次阅读
    纯视觉<b class='flag-5'>自动驾驶</b>会像人眼<b class='flag-5'>一样</b>“近视”吗?

    自动驾驶中毫米波雷达到底有何作用?

    ]自动驾驶汽车为了能够更好地勘测到交通环境,需要多个感知硬件协同工作,由于各感知硬件的功能不同,在自动驾驶行业中被讨论的热度也不一样,摄像头与激光雷达作为主要的感知硬件,直是行业讨论
    的头像 发表于 12-10 17:07 2033次阅读
    <b class='flag-5'>自动驾驶</b>中毫米波雷达到底有何作用?

    NVIDIA与Uber合作推进全球L4级自动驾驶移动出行网络

    NVIDIA 宣布与 Uber 达成合作,将共同扩展全球 L4 级自动驾驶移动出行网络。合作将依托 Uber 新代无人驾驶出租车和自动配送
    的头像 发表于 11-03 14:33 1473次阅读

    卡车、矿车的自动驾驶和乘用车的自动驾驶在技术要求上有何不同?

    自动驾驶技术也得到了充足的应用,但因应用场景不同,技术的侧重方向也有所区别。今天就来和大家聊聊这个话题。 应用场景:开放道路vs封闭场地 首先要理解的是,自动驾驶所面对的环境决定了它的技术基础。乘用车
    的头像 发表于 06-28 11:38 1728次阅读
    卡车、矿车的<b class='flag-5'>自动驾驶</b>和乘用车的<b class='flag-5'>自动驾驶</b>在技术要求上有何不同?

    自动驾驶汽车接管逻辑如何设置更为合理?

    交通环境并随时接管的工作。但就是这简单需求,车企在自动驾驶系统与人类驾驶员的接管边界并未给出明确的界定。有很多实际案例表明,在系统无法处理复杂路况时,会突然弹出“请立即接管”的提示,
    的头像 发表于 06-26 08:56 965次阅读

    新能源车软件单元测试深度解析:自动驾驶系统视角

    。 ‌自动驾驶软件的特殊性‌ ‌ 感知层: ‌激光雷达、摄像头等传感器数据处理算法的单元测试需覆盖极端场景。例如,激光雷达点云滤波算法在雨雪天气下的噪声抑制能力需通过边界测试验证。某厂商曾在测试中遗漏
    发表于 05-12 15:59