0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶汽车是如何进行“场景理解”的?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-12-11 09:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]场景理解这个词听起来可能有点深奥,但在自动驾驶里,它其实就是指车辆“看到周围环境之后,能不能真正搞明白正在发生什么”。要把这个概念讲清楚,不能只停留在感知系统能识别出多少物体,关键在于怎么把“看到的东西”转化为“有用的信息”,让决策和控制模块能基于这些信息做出安全、可靠的行动。

wKgZPGk6G2mANfhvAABxx8efK2U292.jpg

图片源自:网络

wKgZO2k6G2mAZgyFAAAQo00DEvw743.jpg

场景理解到底是什么?为什么它这么重要?

所谓场景理解,就是把路面上所有能观察到的信息整合起来,形成对当前情境的“理解”。它不只是检测出行人、车辆、车道线、交通标志等个体信息,还要弄清楚这些对象之间的关系、它们接下来的可能动向,以及哪些信息对下一步决策最关键。比如说,前方有个骑车人靠边行驶,场景理解系统要能判断他是准备停车、要转弯,还是有可能会突然逆行;遇到复杂路口,它得识别信号灯状态、理解各方行驶意图,并判断哪些轨迹是安全可行的。

想达成更好的场景理解效果,决策层所做的每一个动作,都要依赖于上层提供的抽象信息。感知系统只负责把像素或点云变成“事实”,但如果这些事实没有被组织成“世界模型”并附带“不确定性评估”,规划模块就可能基于错误或不稳定的信息做决定,从而带来危险。一个好的场景理解系统,能够把嘈杂、部分缺失甚至暂时矛盾的感知输出,转化成稳定、连贯、并带有置信度的语义信息,供规划和控制模块使用。

wKgZPGk6G2qAfFPhAAAR42n7O-I294.jpg

如何描述这个世界——表示学习与多层次语义

场景理解首先要解决的是“怎么把这个世界描述出来”的问题。传感器输出的图像、点云、雷达回波、IMU数据都太原始、太低层,直接用来决策既低效又危险。我们需要把它们抽象成适合自动驾驶的表示形式,这需要考虑多个维度。

空间几何信息是基础。物体的三维位置、速度、朝向和边界框,是任何动作规划都必需的信息。基于这些数据可以做碰撞检测、车道保持和速度控制。点云和立体视觉/深度信息是构建几何表示的主要来源,而视觉系统也可以通过多视角和神经网络来估计深度。

wKgZO2k6G2uAPuMXANjglQ9o894107.jpg

图片源自:网络

语义信息是更高一层的表达。把“这是一辆车/行人/自行车”升级为“这是一辆正在并线的货车/一位推婴儿车的行人/一辆停在路边的网约车”,会直接影响系统对它的处理方式。语义需要更细致,要能把行为模式(比如匀速、加速、减速、转头观察)也考虑进来。

对象之间的关系与意图也需要被表示出来。它们之间的相对位置、可能的遮挡关系、谁是相对被动的、谁具有较高危险性,都是场景理解的重点。例如,一辆停在路边的车打开了车门,这时“车门”和“相邻行人”之间的关系,就比单独的“门”这个对象重要得多。意图则是对对象未来行为的概率化预测,通常不是给出一个确定的轨迹,而是提供几种可能性及各自的置信度。

时间维度的表示也非常关键。交通场景不是静态的,而是连续演变的过程。利用历史轨迹来估计物体的惯性和行为模式,能提高对未来动向的预测准确性。很多系统会把表示设计成时序图、轨迹簇或隐状态向量,这样规划模块就能看到“这个行人过去几秒是怎么移动的,从而推测他接下来可能做什么”。

还有就是多模态融合的表示。不同传感器在不同条件下的可靠性不一样,场景表示需要融合这些信息并体现不确定性。一个理想的表示,既包含精确的几何信息,也包含高层的语义标签和概率化的不确定性描述,并且能在实时性限制下快速更新。

wKgZO2k6G26Aao6cAAASG3BOmsQ036.jpg

从数据到推理——学习、预测与逻辑推理的结合

有了合适的表示方式,下一步就是如何从数据中训练出能生成这些表示的系统,以及在推理时如何把学到的模式和逻辑规则结合起来。

wKgZPGk6G2-AEy8MAGB2BBf_mHY074.jpg

图片源自:网络

在这个过程中,数据是基础,但数据本身不等于理解。标注好的数据可以训练出物体检测、分割和轨迹预测模型,但真实世界的场景千变万化,数据不足或存在偏差会导致模型在边缘场景中失效。因此需要真实道路数据、仿真生成数据、合成数据,以及针对边缘场景专门采集的数据等多源数据。自监督学习和无监督表示学习是降低对标注依赖的方向,通过让模型从未标注的视频中学习运动一致性、物体恒常性等规律,可以提升泛化能力。

模型选择与架构设计将直接影响理解能力。端到端的大模型可以学习从像素到控制的映射,但缺点是可解释性和可验证性差。模块化架构把感知、追踪、预测、场景理解和决策分开,有利于工程化、故障排查和逐步验证。因此在很多系统中会采用混合方案,用深度学习完成感知与短期预测,再用符号规则、行为树或基于模型的推理来处理安全相关约束和长期规划。

不确定性建模是必不可少的。场景理解不能只给出一个确定的答案,还必须提供置信度和可能的替代解释。贝叶斯方法、概率图模型、蒙特卡洛采样、基于高斯过程的预测,或者利用神经网络输出分布(比如预测多个可能模式并给出权重),都是常用的手段。规划层会根据这些不确定性来调整保守程度,如在不确定程度高的路口减速、扩大安全距离。

因果推理和规则约束能提高系统的鲁棒性。学习模型擅长捕捉统计相关性,但有时需要基于物理规律和交通规则来做判断,比如在湿滑路面上刹车距离应该更长,或者红灯时在没有特殊标识的情况下不能右转。把物理模型、交通法规和常识规则嵌入系统,可以在学习模型失灵时充当“最后一道防线”。

在线学习与闭环更新也非常重要。车辆会遇到新的场景,系统需要能够回收失败样本、进行标注并重新训练,或者采用更轻量的在线适应方法快速调整模型。从工程角度看,这涉及到数据采集、标注流程、仿真验证与部署策略,是场景理解体系能否持续改进的关键。

wKgZO2k6G3KACUDKAAASAJELks8593.jpg

工程实践——实时性、鲁棒性与可验证性

就算场景理解在理论上有完美的表示方式和优秀的模型,要真正落地到车辆上,还必须面对严苛的工程约束。场景理解的核心之一,就是如何在有限的计算资源和严格的实时性要求下,做到既准确又可验证。

实时性意味着系统必须在几百毫秒甚至更短的时间内完成感知、理解与预测,然后把结果交给规划模块。为此,表示方式和模型常常需要在工程上做折中,用稀疏表示来减少计算量,用候选采样替代全空间搜索,用轻量级网络做前置筛选,再把重点区域送到重模型做精细推理。硬件协同设计也很关键,把关键运算放在专用加速器或车规级SoC上,能显著提升吞吐量和能效。

wKgZPGk6G3KAUBDkAABmNOwp7ns412.jpg

图片源自:网络

想提升场景理解的鲁棒性,就要让自动驾驶系统能轻松应对传感器故障、恶劣天气、遮挡和对抗情况等多种挑战。传感器降级策略、传感器之间的冗余备份,以及基于模型的不确定性检测,都能提升整体鲁棒性。如果视觉系统在浓雾中失效,毫米波雷达和激光雷达可以提供几何信息;如果某个传感器丢包,系统要能快速切换到备用策略,并通知规划层收紧安全边界。

可验证性和可解释性对安全至关重要。监管和产品化都要求能够证明系统在特定条件下是安全的。模块化设计有利于形式化验证,可以把一些安全关键判断转化成可检验的断言(比如保持最小跟车距离),并用大量仿真和场景库做覆盖测试。同时,还需要建立故障日志和可追溯的诊断机制,当场景理解出现错误判断时,能快速定位是感知失误、表示错误还是模型泛化问题。

仿真在工程实践中发挥着巨大作用。现实世界中难以收集所有罕见的边缘场景,通过高保真仿真可以构造复杂交互、极端天气和危险情况,验证系统的反应。把仿真和真实数据结合起来,并将仿真生成的数据用于训练或测试,能加速场景理解能力的提升。

最后还要关注验证覆盖率和数据分布偏差的问题。没有任何系统能通过“所有场景”的验证,但可以采取风险优先的方式,可以把验证资源投入到最危险或最常见的失效模式上,建立一个动态更新的风险目录,持续把新出现的问题纳入训练和测试流程。

wKgZO2k6G3OAWsY9AAARwcz1hbg905.jpg

最后的话

场景理解的核心不是某一个单点技术,而是一组紧密耦合的能力,合适的世界表示、基于丰富数据与合理架构的学习与推理、以及面向实际应用的实时性、鲁棒性与可验证性。它既需要深度学习的表达能力,也需要物理模型与规则的约束,还需要完善的数据闭环来持续改进。

对工程团队来说,场景理解是一项长期的、需要分阶段推进的工作。每一次对表示的优化、每一类边缘场景的数据补采、每一次验证覆盖率的提升,都会直接改善车辆在真实道路上的表现。把“看见”变成“理解”,再把“理解”转化为“可靠行动”,这是自动驾驶安全落地的核心路径。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14675

    浏览量

    176679
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    汽车自动驾驶的太阳光模拟应用研究

    测试装备,通过提供可控、可重复的测试环境,已成为汽车自动驾驶研发、验证与标定过程中不可或缺的核心工具。汽车自动驾驶的光挑战与测试需求luminbox
    的头像 发表于 12-10 18:04 61次阅读
    <b class='flag-5'>汽车</b><b class='flag-5'>自动驾驶</b>的太阳光模拟应用研究

    自动驾驶汽车如何确定自己的位置和所在车道?

    [首发于智驾最前沿微信公众号]我们平时开车时,判断自己在哪条路、哪个车道,只需要看一眼导航、扫几眼车道线、再听听提示就够了。但对自动驾驶汽车来说,这件事既简单又复杂。简单在于自动驾驶汽车
    的头像 发表于 11-18 09:03 584次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>汽车</b>如何确定自己的位置和所在车道?

    无引导线的左转场景下,自动驾驶如何规划轨迹?

    场景下,想要很好地处理好无引导线左转是一个非常大的挑战。但想要让自动驾驶汽车满足所有的出行需求,这一场景必须解决,那在无引导线的左转场景下,
    的头像 发表于 09-18 09:12 446次阅读
    无引导线的左转<b class='flag-5'>场景</b>下,<b class='flag-5'>自动驾驶</b>如何规划轨迹?

    自动驾驶汽车如何处理“鬼探头”式的边缘场景

    [首发于智驾最前沿微信公众号]自动驾驶遇到“鬼探头”式的边缘场景时应该如何处理?其实对于自动驾驶汽车来说,无论是常规场景,还是边缘
    的头像 发表于 08-29 11:11 532次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>汽车</b>如何处理“鬼探头”式的边缘<b class='flag-5'>场景</b>?

    如何确保自动驾驶汽车感知的准确性?

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要自动驾驶,首先要做的就是能对周边环境实现精准感知,也就是能“看”清道路,那自动驾驶汽车如何在复
    的头像 发表于 08-23 15:06 1382次阅读
    如何确保<b class='flag-5'>自动驾驶</b><b class='flag-5'>汽车</b>感知的准确性?

    塑造自动驾驶汽车格局的核心技术

    自动驾驶汽车长期以来一直是科幻小说中的情节,但在如今的2025年,它似乎已经离我们越来越近,智能辅助驾驶已经出现在越来越多的新能源汽车中。但距离完全的
    的头像 发表于 08-21 16:03 710次阅读

    自动驾驶汽车如何正确进行道路识别?

    [首发于智驾最前沿微信公众号]自动驾驶汽车在行驶过程中必须准确识别道路环境,以便做出安全有效的决策,不同于人类开车,可以思考,自动驾驶汽车对于道路的识别需要更多的技术辅助。对于
    的头像 发表于 06-29 09:40 1351次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>汽车</b>如何正确<b class='flag-5'>进行</b>道路识别?

    自动驾驶汽车是如何准确定位的?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的快速发展,车辆的精准定位成为安全驾驶与路径规划的核心基础。相比于传统人类驾驶依赖路标和视觉判断,自动驾驶
    的头像 发表于 06-28 11:42 891次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>汽车</b>是如何准确定位的?

    卡车、矿车的自动驾驶和乘用车的自动驾驶在技术要求上有何不同?

    自动驾驶技术也得到了充足的应用,但因应用场景不同,技术的侧重方向也有所区别。今天就来和大家聊一聊这个话题。 应用场景:开放道路vs封闭场地 首先要理解的是,
    的头像 发表于 06-28 11:38 730次阅读
    卡车、矿车的<b class='flag-5'>自动驾驶</b>和乘用车的<b class='flag-5'>自动驾驶</b>在技术要求上有何不同?

    自动驾驶安全基石:ODD

    电子发烧友网综合报道 自动驾驶ODD(Operational Design Domain)即设计运行域,是指自动驾驶系统被设计为安全、有效运行的具体条件范围。它定义了自动驾驶汽车在哪些
    的头像 发表于 05-19 03:52 5815次阅读

    新能源车软件单元测试深度解析:自动驾驶系统视角

    。 ‌自动驾驶软件的特殊性‌ ‌ 感知层: ‌激光雷达、摄像头等传感器数据处理算法的单元测试需覆盖极端场景。例如,激光雷达点云滤波算法在雨雪天气下的噪声抑制能力需通过边界测试验证。某厂商曾在测试中遗漏
    发表于 05-12 15:59

    NVIDIA Halos自动驾驶汽车安全系统发布

    自动驾驶汽车的开发。正确的技术与框架对确保自动驾驶汽车驾驶员、乘客和行人的安全至关重要。 因此,NVIDIA 推出了NVIDIA Halos综合安全系统,将 NVIDIA 的
    的头像 发表于 03-25 14:51 974次阅读

    理想汽车推出全新自动驾驶架构

    2025年3月18日,理想汽车自动驾驶技术研发负责人贾鹏在NVIDIA GTC 2025发表主题演讲《VLA:迈向自动驾驶物理智能体的关键一步》,分享了理想汽车对于下一代
    的头像 发表于 03-19 14:12 908次阅读