0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是自动驾驶决策系统?发展有何挑战?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-10-26 09:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]把自动驾驶汽车想象成一个不断学习并做决定的人,车上的“眼睛”负责看(感知)、“记忆/推理”负责想(预测与决策)、“手脚”负责做(规划与控制),决策系统则处在这个链条的中间位置。它把来自感知(相机、雷达、激光雷达、定位、地图等)的信息和预测模块(对周围行人、车辆未来行为的猜测)整合起来,输出“我下一步要怎么走、以什么速度走、如何避让”等指令。决策并不是单一的动作,而是一个层级化的流程,先想清楚要干什么(行为层,像是“变道”“左转”“减速跟车”),再把这个行为转成一条具体的、安全可执行的轨迹(轨迹层),最后把轨迹交给底层控制器去跟踪(控制层)。

wKgZO2j9f46ANwvrANjglQ9o894337.jpg

决策系统要同时满足安全(永远优先)、舒适(不要让乘客晕)、合法(遵守交通规则)、高效(不无谓地慢)以及可解释(出了问题能查原因)等要求。但这些要求恰恰会产生冲突,最安全的动作可能太保守影响效率,最快的动作可能带来风险,所以决策系统本质上是在这些要求之间做权衡的过程。

wKgZPGj9f5GAH3tVAAAQo00DEvw672.jpg

经典与主流的方法:层级、优化与规则

长期以来,自动驾驶的决策与规划主要沿着“层级化+优化/采样”的路线发展,系统会先基于地图和当前交通情形选择一个合理的策略,例如在交叉口是“先等候再左转”还是“突出加速通过”,通过这些合理的策略,可以确保自动驾驶汽车安全行驶。

为了能够生成更安全的轨迹,常用的方法分为两类,即采样/搜索类和优化类。采样类方法通过生成若干候选轨迹(基于轨迹库或随机采样),评估每条轨迹的代价(碰撞风险、舒适性、距离、法规约束等),然后选择代价最低的那一条。这类方法实现直观,但当情形复杂时需要大量候选样本,计算量容易爆炸。

wKgZO2j9f5KAQUOrABg9H_QDbac099.jpg

优化类方法把轨迹看成一个连续的函数,用数学优化求最小代价路径,常见的工具包括基于拉格朗日的优化、迭代线性二次调节(iLQR)、以及模型预测控制(MPC)。MPC特别受欢迎,因为它把动力学约束、状态与控制约束直接纳入优化问题,还能以有限时域滚动优化的方式去应对环境变化,这使得控制既能考虑未来又能实时运行。

除了纯数学的优化外,规则/符号化方法也被广泛用于保证安全行驶。例如Mobileye提出的Responsibility-Sensitive Safety(RSS)提出了一套数学化的“常识驾驶规则”,用来判断何时应该采取防御性动作,从而为系统提供白盒式的安全保证。RSS强调可验证性与可解释性,是工业界推行“可证明安全”思路的代表之一。

在很多商用系统里,还会加一层“安全裁判”或“监护层”(supervisorysafetylayer),它不是去生成轨迹,而是在主规划动作可能造成危险时进行拦截或修正。近年常把学习型模块(负责复杂场景下做出灵活行为)与基于物理/规则的安全模块(保证万一学习出错时仍不致于发生危险)结合起来,形成“学习+证据化安全”的混合结构。

wKgZPGj9f5OAFsGtAAAR42n7O-I150.jpg

近两年的新技术热点

现在自动驾驶行业有一个非常明显的趋势,第一个是把预测与规划之间的界限变得模糊,过去感知负责“看”,预测负责“猜未来”,规划负责“决定”;现在越来越多的工作尝试把世界建模(worldmodeling)、多主体行为预测与轨迹生成紧耦合,甚至把规划也放到同一个学习框架里去训练。

Transformer架构因其优秀的时序与交互建模能力被广泛采用。像MTR(Motion TRansformer)和Agent Former这样的工作展示了Transformer在多主体、长时序轨迹预测上的强劲表现;它们能够用自注意力机制去捕捉不同交通参与者之间的交互,从而生成更合理、具多模态性的未来轨迹预测。

wKgZO2j9f5SAXAuFABgXl6QD2ic075.jpg

与之相关的第二个趋势是扩散(diffusion)模型被引入到轨迹预测与采样生成领域。扩散模型擅长从复杂分布中生成高质量且多样化的样本,扩散方法能更好地表达未来的不确定性,生成的轨迹模式通常比传统高斯混合或简单回归更丰富。

第三个大趋势是BEV(Bird’s Eye View,俯视图),把原始相机/雷达/激光点云数据先投影或转换成车辆局部的俯视格网或向量化地图,再在这个BEV表示上做感知、轨迹预测和规划。BEV的好处在于它把空间结构显式化,使得后续的规划模块可以直接在统一的空间中做代价评估与轨迹优化。

第四个值得注意的方向是“大模型”与多模态模型的尝试。一些公司和研究团队尝试把大型多模态神经网络应用到驾驶场景,用更大的模型去整合相机帧、点云、地图和历史轨迹,甚至把语言或世界知识纳入决策过程。像是Waymo与Google的多模态/大模型合作方向在内部探索将大型多模态模型用于世界建模和轨迹生成的可能性(如EMMA),其目标是用更通用的模型来缩短“模块间信息断层”、增强推理能力,但同时也面临计算与工程化挑战。

上面这些技术趋势的共同点是更强调“联合建模”和“不确定性建模”。传统系统里每一层独立优化,信息在层与层之间被“压缩”传递;新趋势尝试在更大的端到端或半端到端框架里联合训练,以避免信息损失,同时用概率模型或生成模型来保留和利用不确定性(比如何时可能发生紧急刹车、其他车辆可能的多种轨迹等),从而让规划在面对多种可能未来时更稳健。

wKgZPGj9f5SADqUZAAASG3BOmsQ544.jpg

安全、可验证性与工程化挑战

技术强并不意味着立刻可以上路,自动驾驶决策系统面临极高的工程与合规门槛。安全与可验证性就是其中一个,机器学习模型尤其是端到端、深度网络通常是“黑盒”,在极端或稀有场景下可能会产生不可预测的行为。为此,在实际应用时一直强调在系统中保留可解释和可验证的模块,或者在学习模块外加上可证明的安全层,并结合控制屏障函数(Control Barrier Functions,CBF)等技术来保证系统满足安全约束。近年来有方案把实时MPC与CBF结合,证明在城市场景下能以可计算的代价提供安全保障,这类方法在可证明安全方面是有实际意义的进展。

实时性与算力也是决策系统发展需要考虑的难题,扩散模型、巨型Transformer、以及多模态大模型在训练与推理上都很吃资源。实际车辆的算力、功耗、散热和延迟都有硬性限制,任何决策模型必须在严格的延迟预算内给出输出。常见的做法是混合采用,在边缘用轻量化或确定性模块做“快尚能”决策(fast-fallback),在云或离线环境中用大模型做策略更新、数据采样或仿真训练。

还有一个难题就是对稀有/危险场景的处理,在现实的交通场景中,会出现很多危险但少见的边缘场景,但正因为它们危险,系统必须在这类场景上能够灵活处理。其中解决办法包括大量合成数据、基于仿真的极端场景生成(scenariogeneration)、重要性采样与对抗式训练,或者用基于规则的强制安全边界来覆盖学习系统的盲点。此外,如何对学习系统做形式化验证仍然是一个开放问题,这就需要结合可解释AI、可证实安全理论与充分的实测/仿真验证框架。

法规与社会信任其实一直是自动驾驶发展最难平衡的问题,决策系统的行为牵涉到责任归属和伦理问题。像Mobileye的RSS试图把“常识驾驶”数学化,虽然这方便证明和沟通,但也引出了责任与法律层面的讨论。有很多技术的做法是把透明性与可追溯性做为产品化的基本要求,决策日志、黑匣子式的数据记录与回放、以及在系统内置的可解释性接口,都是建立社会信任的必要手段。

wKgZPGj9f5WActycAAASAJELks8537.jpg

最后的话

自动驾驶决策系统既依赖严谨的控制理论与优化算法,也依赖对复杂交通场景的统计学习与数据驱动建模,虽然经典的分层优化与规则化方法在安全性与可解释性上有天然优势,但Transformer、扩散模型、BEV表示和多模态大模型等新技术更是为系统带来了更强的建模能力和面对不确定性的柔性。

虽然技术快速进步很吸引人,但真正能在复杂道路场景中稳定、可解释、可监管地运行,仍然需要时间、系统化的工程实施以及规范化的验证流程。研究方向上的每一个“新潮词”都值得关注,但在把它推向道路时要多一分谨慎、多一分验证。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14682

    浏览量

    176775
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶BEV Camera数据采集系统:高精度时间同步解决方案

    1 自动驾驶数据采集的时间同步挑战与重要性 随着自动驾驶技术的快速发展,车辆准确感知周围环境的能力变得至关重要。在分布式多传感器系统中,信号
    的头像 发表于 12-11 17:11 1040次阅读
    <b class='flag-5'>自动驾驶</b>BEV Camera数据采集<b class='flag-5'>系统</b>:高精度时间同步解决方案

    自动驾驶中毫米波雷达到底作用?

    毫米波雷达、超声波雷达等感知硬件,更像是一个配角,成为自动驾驶技术实现的辅助硬件。那在自动驾驶中毫米波雷达到底作用?
    的头像 发表于 12-10 17:07 1144次阅读
    <b class='flag-5'>自动驾驶</b>中毫米波雷达到底<b class='flag-5'>有</b><b class='flag-5'>何</b>作用?

    自动驾驶仿真测试什么具体要求?

    、动力响应和操控稳定性,自动驾驶系统的复杂性主要体现在感知、决策与控制等软件层面,其运行行为高度依赖于交通环境、传感器输入和系统逻辑。这也就意味着,传统的物理测试方法已经难以全面覆盖
    的头像 发表于 10-15 09:14 381次阅读
    <b class='flag-5'>自动驾驶</b>仿真测试<b class='flag-5'>有</b>什么具体要求?

    自动驾驶SoC芯片到底优势?

    [首发于智驾最前沿微信公众号]近年来,随着智能网联汽车技术的快速发展,车载计算芯片已成为智能驾驶系统的中枢。传统的MCU(单片机)芯片在处理速度和算力方面已难以满足自动驾驶对于异构数据
    的头像 发表于 09-21 10:56 2282次阅读
    <b class='flag-5'>自动驾驶</b>SoC芯片到底<b class='flag-5'>有</b><b class='flag-5'>何</b>优势?

    端到端自动驾驶相较传统自动驾驶到底提升?

    [首发于智驾最前沿微信公众号]自动驾驶技术自诞生以来,便承载了人类对安全、高效、智能出行的美好憧憬。传统自动驾驶系统以层次化、模块化的架构为主,将感知、定位、规划与决策、控制四大核心功
    的头像 发表于 09-02 09:09 517次阅读
    端到端<b class='flag-5'>自动驾驶</b>相较传统<b class='flag-5'>自动驾驶</b>到底<b class='flag-5'>有</b><b class='flag-5'>何</b>提升?

    自动驾驶中感知、决策、控制都起到什么作用?

    自动驾驶的感知、决策与控制是一个高度耦合的系统工程。感知负责把复杂、噪声且有不确定性的外界信息转换为具有语义和概率描述的内部状态;决策基于这些状态做出策略选择,并生成满足动力学和安全约
    的头像 发表于 08-31 15:40 1441次阅读
    <b class='flag-5'>自动驾驶</b>中感知、<b class='flag-5'>决策</b>、控制都起到什么作用?

    数据驱动自动驾驶:核心要素与发展全景解析

    的核心支撑,其价值贯穿感知、决策、控制等全链路技术环节。本文将从技术应用、政策导向、发展趋势等维度,系统剖析数据在自动驾驶领域的关键作用与演进方向。一、数据驱动
    的头像 发表于 07-17 11:04 1556次阅读
    数据驱动<b class='flag-5'>自动驾驶</b>:核心要素与<b class='flag-5'>发展</b>全景解析

    自动驾驶中域控制器作用?

    的汽车电子电气(E/E)系统,为自动驾驶的高效感知、实时决策与精确执行提供了坚实保障。 自上世纪末以来,随着汽车电子化、智能化水平的不断提升,车载ECU数量逐年攀升,曾一度达到数十颗乃至上百颗,分散式的架构设计带来了线束复杂
    的头像 发表于 07-07 10:36 664次阅读
    <b class='flag-5'>自动驾驶</b>中域控制器<b class='flag-5'>有</b><b class='flag-5'>何</b>作用?

    卡车、矿车的自动驾驶和乘用车的自动驾驶在技术要求上有何不同?

    [首发于智驾最前沿微信公众号]自动驾驶技术的发展,让组合辅助驾驶得到大量应用,但现在对于自动驾驶技术的宣传,普遍是在乘用车领域,而对于卡车、矿车的
    的头像 发表于 06-28 11:38 735次阅读
    卡车、矿车的<b class='flag-5'>自动驾驶</b>和乘用车的<b class='flag-5'>自动驾驶</b>在技术要求上有何不同?

    自动驾驶技术测试哪些?

    自动驾驶技术哪些测试? 对于自动驾驶系统而言,测试可以分为 仿真测试、实验室测试以及道路测试 等多个层面,每个层面都有不同的侧重点与目标,但它们共同构成了一个完整的测试体系。 
    的头像 发表于 06-10 09:00 731次阅读
    <b class='flag-5'>自动驾驶</b>技术测试<b class='flag-5'>有</b>哪些?

    新能源车软件单元测试深度解析:自动驾驶系统视角

    的潜在风险增加,尤其是在自动驾驶等安全关键系统中。根据ISO 26262标准,自动驾驶系统的安全完整性等级(ASIL-D)要求单点故障率必须低于10^-8/小时,这意味着每小时的故障概
    发表于 05-12 15:59

    AI将如何改变自动驾驶

    [首发于智驾最前沿微信公众号]五一假期继续闲聊一下,还欢迎大家随意留言,随着人工智能(AI)的发展,很多车企及自动驾驶供应商正尝试将AI融入自动驾驶系统,为何大家都在积极推动这一技术?
    的头像 发表于 05-04 09:58 635次阅读

    自动驾驶中基于规则的决策和端到端大模型区别?

    自动驾驶架构的选择上,也经历了从感知、决策控制、执行的三段式架构到现在火热的端到端大模型,尤其是在2024年特斯拉推出FSD V12后,各车企更是陆续推出自家的端到端大模型,这一概念也成为各车企发布会的重头戏。
    的头像 发表于 04-13 09:38 3451次阅读
    <b class='flag-5'>自动驾驶</b>中基于规则的<b class='flag-5'>决策</b>和端到端大模型<b class='flag-5'>有</b><b class='flag-5'>何</b>区别?

    自动驾驶大模型中常提的Token是个啥?对自动驾驶影响?

    、多模态传感器数据的实时处理与决策。在这一过程中,大模型以其强大的特征提取、信息融合和预测能力为自动驾驶系统提供了有力支持。而在大模型的中,一个“Token”的概念,有些人看到后或许
    的头像 发表于 03-28 09:16 1002次阅读

    光庭信息自动驾驶系统亮相CES 2025

    自动驾驶的魅力在于将人类从繁琐的驾驶任务中解放出来,随着 AI 大模型和大数据技术的突破,自动驾驶技术的发展及实际应用也成为 CES 2025 的重头戏之一。展会上,光庭信息自主研发的
    的头像 发表于 01-13 14:23 1245次阅读