0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶中占据感知网络是如何识别障碍物的?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2026-04-15 09:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]在自动驾驶中,如何让车辆“看见”并“理解”周遭环境始终是核心难题。早期的感知方案大多依赖于目标检测,也就是给摄像头捕捉到的画面里的汽车、行人或自行车画上一个个方框。这种方式虽然直观,但在面对现实世界中千奇百怪的物体时,就会显得力不从心。为了解决这一问题,占据感知网络(Occupancy Network,简称OCC)技术逐渐成为行业主流。

wKgZPGne69-AK9Q8AAAQo00DEvw133.jpg

为什么传统的画框方式不够用了

在过去很长一段时间里,自动驾驶系统主要识别的是预先定义好的物体。研发人员会告诉人工智能,长成什么样的叫车,什么样的叫人。只要系统在画面中找到了符合特征的物体,就会用一个三维的长方体框把它们标出来。这种基于目标的识别方式在标准化的城市道路上表现不错,可一旦遇到“意料之外”的状况,问题就接踵而至。

wKgZO2ne69-AM7eOACM84OjnIkg537.jpg

图片源自:网络

举个例子,路上突然掉落了一个形状奇特的纸箱,或者出现了一棵倒下的树,甚至一辆货车翻倒。由于这些物体的形状并不在系统预设的类别里,感知网络很可能无法给它们画上框,从而认为前方是平坦的道路。这种识别逻辑的缺失会导致非常严重的安全事故。占据感知网络的出现,本质上是将感知思路从寻找特定物体转变为判断空间是否被占用。它不再关心前方到底是车还是树,而是会确认那块空间是不是实心的。

wKgZPGne6-CAQW4xAAAR42n7O-I910.jpg

空间是如何被数字化切分的

要理解占据感知网络的工作原理,可以先想象把车辆周围的三维空间切成无数个微小的正方体。这些小方块在技术上被称为“体素”。如果把传统的照片比作二维的像素点阵,那么体素就是三维版的像素。占据感知网络的核心任务,就是判断每一个微小的体素方块里到底是有物体存在,还是空无一物的透明空气。

wKgZO2ne6-GAXQH-AAEoCI9IVK8465.jpg

图片源自:网络

在实际运作中,车辆搭载的多个摄像头会从不同角度拍摄周围的画面。占据感知网络会将这些来自不同位置的二维图像信息提取出来,通过数学转化,映射到预先设定好的三维网格空间里。这个过程就像是在进行连线游戏,系统需要根据图像中像素的特征,推算出它们在三维世界中对应的是哪一个格点。

当这些信息汇总到三维网格后,神经网络会通过深度学习模型对每个格子的状态进行预测。它会给每个格子分配一个概率值,用来描述这个地方被占据的可能性。如果概率值很高,系统就会认为这里存在障碍物。这种处理方式不需要提前学习每一种障碍物的长相,只要某个空间反射回来的视觉特征显示那里有东西,它就会被标记为“占据”状态,从而提醒车辆避让。

wKgZPGne6-GAWOWCAAASG3BOmsQ421.jpg

摄像头画面如何变成三维模型

由于目前主流的占据感知方案大多基于视觉相机,如何从扁平的图片中还原出准确的深度信息就变得至关重要。系统会利用特征提取网络,把摄像头拍到的每一帧画面转化为高维的特征数据。这些数据不仅包含了颜色和纹理,还隐含了物体之间的空间关系。随后,系统会利用特殊的变换模块,将这些分布在不同视角下的特征融合在一起,形成一个以车辆为中心的统一空间视角。

wKgZO2ne6-KARShrAACzTMFHArw888.jpg

图片源自:网络

在这个统一的特征空间里,网络会进一步细化对空间的理解。除了判断格子是否被占据,有些的占据感知网络还能识别出格子的属性。例如,它能分辨出这一团被占据的空间是属于静止的马路牙子,还是属于正在移动的车辆。

这种语义上的细分,能帮助自动驾驶系统做出更合理的决策。比如面对路边的绿化带,车辆可以选择贴近行驶,而面对同样高度的石墩子,则必须保持更远的安全距离。

这种感知方式的另一个优势在于它对物体遮挡的鲁棒性。在复杂的交通流中,前方的车辆经常会遮住更远处的路面。占据感知网络具备一定的空间推理能力,它能根据已有的视觉线索,对被遮挡区域的占据情况做出合理的估算。这种脑补能力让自动驾驶车辆在处理十字路口或拥挤路段时,表现得更像一个经验丰富的人类驾驶员。

wKgZPGne6-KAbbbEAAASAJELks8820.jpg

面对异形物体时有什么优势

占据感知网络最大的杀手锏在于它解决通用障碍物问题的能力。在真实的道路上,会出现垃圾桶、施工围栏、甚至是被风刮起的塑料袋,它们的形态千变万化。传统的识别算法很难穷尽所有的可能性,而占据感知网络通过体素化的方式,将物理世界完整地建模了出来。无论障碍物长得多么奇怪,只要它占据了空间,就会在三维网格中显现出来。

wKgZO2ne6-OAaDXEAABDX4b9gqs686.jpg

图片源自:网络

这种从底层逻辑上的改变,极大地提升了自动驾驶的安全性上限。它不再依赖于见过才认识,而是基于存在即感知的逻辑。当车辆行驶在路面上时,占据感知网络就像在实时构建一个数字孪生的三维世界,将所有的物理实体都以概率的形式填充在格子里。这种对环境的精细刻画,不仅为避障提供了依据,也为后续的路径规划提供了更加可靠的底图。

wKgZPGne6-OACEqjAAARwcz1hbg182.jpg

最后的话

占据感知网络让自动驾驶系统从单纯的图像识别进化到了空间感知。它通过对三维空间的体素化重构,打破了传统检测框架的束缚,使得车辆能够更从容地应对复杂多变的交通环境。随着算力的提升和算法的优化,这种技术正在让自动驾驶变得更加安全和智能。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    794

    文章

    14976

    浏览量

    181352
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶占用网络还需要数据标注吗?

    能够通过空间体素化的方式来感知世界,甚至可以识别那些从未见过的异形障碍物,那它是不是不再需要传统意义上的数据标注了?事实上,占据网络不仅没有
    的头像 发表于 04-17 08:53 356次阅读
    <b class='flag-5'>自动驾驶</b>占用<b class='flag-5'>网络</b>还需要数据标注吗?

    卷积神经网络如何让自动驾驶识别障碍物

    自动驾驶的发展过程感知系统一直承担车辆“眼睛”的角色,其核心任务是让计算机理解复杂多变的物理世界。卷积神经网络(CNN)作为一种专门用于处理图像和视频等网格状数据结构的深度学习模型
    的头像 发表于 04-11 09:59 1403次阅读
    卷积神经<b class='flag-5'>网络</b>如何让<b class='flag-5'>自动驾驶</b><b class='flag-5'>识别</b><b class='flag-5'>障碍物</b>?

    预期功能安全是什么?(上)

    风险: 现实路况的长尾场景(如突发障碍物、特殊天气组合)难以穷尽,系统应对未知风险的能力不足。 以上这些问题直接威胁驾乘安全,也制约着自动驾驶技术的规模化落地。 而传统安全(如ISO26262功能安全
    发表于 04-10 09:21

    占用网络是怎么让自动驾驶识别异形障碍物的?

    感知系统对于自动驾驶来说,就像是眼睛和翻译官的角色。这套系统不仅要捕捉到周围环境的光影信号,更需要将这些支离破碎的像素点转化为计算机能够理解的物理实体。
    的头像 发表于 03-14 13:46 2104次阅读
    占用<b class='flag-5'>网络</b>是怎么让<b class='flag-5'>自动驾驶</b><b class='flag-5'>识别</b>异形<b class='flag-5'>障碍物</b>的?

    自动驾驶中常提的占用网络检测存在哪些问题?

    自动驾驶感知技术在过去几年中经历了很大的变化,从最初的二维图像检测到鸟瞰图投影,再到如今备受关注的占用网络感知技术的提升,让自动驾驶的能力
    的头像 发表于 02-24 15:53 1151次阅读

    自动驾驶端到端为什么会出现黑盒现象?

    自动驾驶领域,端到端(End-to-End)是指从感知环境的原始数据到车辆实际控制指令,全部交给一个统一的深度学习模型来完成。这和传统的模块化自动驾驶系统不一样,模块化自动驾驶系统会
    的头像 发表于 02-20 09:25 9519次阅读
    <b class='flag-5'>自动驾驶</b>端到端为什么会出现黑盒现象?

    SLAM如何为自动驾驶提供空间感知能力?

    ,并精准地判断自己与障碍物的距离。这种看似本能的空间感知能力,在工程学领域被具象化为同步定位与地图构建技术,即我们常说的SLAM。在自动驾驶的发展进程,SLAM不仅是车辆在未知环境
    的头像 发表于 02-09 09:12 533次阅读
    SLAM如何为<b class='flag-5'>自动驾驶</b>提供空间<b class='flag-5'>感知</b>能力?

    占用网络为什么让自动驾驶感知更精准?

    [首发于智驾最前沿微信公众号]自动驾驶技术的演进过程,本质上是人类试图赋予机器“理解物理世界几何结构”能力的过程。在过去很长一段时间里,感知系统高度依赖于对特定目标的“分类与识别”。如果系统在训练
    的头像 发表于 01-19 09:26 520次阅读
    占用<b class='flag-5'>网络</b>为什么让<b class='flag-5'>自动驾驶</b><b class='flag-5'>感知</b>更精准?

    自动驾驶汽车如何检测石头这样的小障碍物

    [首发于智驾最前沿微信公众号]最近有一位小伙伴留言,想让我聊聊自动驾驶汽车对于石头这样的小障碍物,是使用什么视觉任务检测的。在直接回答“如何检测”之前,其实要思考一个更根本的问题,对于一个像石头这样
    的头像 发表于 12-24 16:53 1262次阅读
    <b class='flag-5'>自动驾驶</b>汽车如何检测石头这样的小<b class='flag-5'>障碍物</b>?

    自动驾驶中常提的GOD有什么作用?

    [首发于智驾最前沿微信公众号]在自动驾驶领域,“障碍物检测”是一个非常重要且经常会被提到的问题,在障碍物检测领域,其实还有一个更细分的领域,那便是“通用障碍物检测”(GOD,Gener
    的头像 发表于 11-03 09:06 1625次阅读
    <b class='flag-5'>自动驾驶</b>中常提的GOD有什么作用?

    如何处理自动驾驶感知传感器脏污问题?

    [首发于智驾最前沿微信公众号]自动驾驶系统依赖多种传感器来感知外界环境,摄像头负责将光学图像转换为图像数据供算法解析,激光雷达生成描述物体三维形状的点云数据,毫米波雷达探测目标的距离与速度,超声波
    的头像 发表于 10-21 13:50 653次阅读
    如何处理<b class='flag-5'>自动驾驶</b><b class='flag-5'>感知</b>传感器脏污问题?

    自动驾驶汽车如何处理“鬼探头”式的边缘场景?

    、最可执行的动作。这整个链条看起来简单,但每一步都需要大量的技术支持。 自动驾驶汽车如何理解道路? 自动驾驶汽车想要精准避开障碍物,首先是要“看见”障碍物
    的头像 发表于 08-29 11:11 934次阅读
    <b class='flag-5'>自动驾驶</b>汽车如何处理“鬼探头”式的边缘场景?

    如何确保自动驾驶汽车感知的准确性?

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要自动驾驶,首先要做的就是能对周边环境实现精准感知,也就是能“看”清道路,那自动驾驶汽车如何在复杂、快速变化的道路环境
    的头像 发表于 08-23 15:06 1807次阅读
    如何确保<b class='flag-5'>自动驾驶</b>汽车<b class='flag-5'>感知</b>的准确性?

    自动驾驶汽车如何正确进行道路识别

    [首发于智驾最前沿微信公众号]自动驾驶汽车在行驶过程必须准确识别道路环境,以便做出安全有效的决策,不同于人类开车,可以思考,自动驾驶汽车对于道路的
    的头像 发表于 06-29 09:40 1874次阅读
    <b class='flag-5'>自动驾驶</b>汽车如何正确进行道路<b class='flag-5'>识别</b>?

    新能源车软件单元测试深度解析:自动驾驶系统视角

    )和AI模块(如激光雷达目标检测)。例如,在测试自动驾驶路径规划模块时,可同步注入CAN总线信号(车速、转向角)和虚拟点云数据(模拟障碍物),实现多维度耦合验证。 ‌ 智能覆盖率引导: ‌ 通过
    发表于 05-12 15:59