0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶从模块化到One Model的进阶之路

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-11-23 09:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]如果将自动驾驶汽车看作是一台懂得“看、想、做”的机器,它首先要做的就是借助传感器全面感知周围环境,然后对这些信息进行“思考”,并做出预测与决策,预测决策结果最终可以转化为具体的控制指令并执行。自动驾驶的工作逻辑已经非常清晰,但技术实现路径却一直在迭代,并沿着一条清晰的轨迹演进。从专注“理解”的感知模型化,到赋予“思维”的规控模型化,再到协同增效的多模块端到端,最终一定会走向One Model端到端。

wKgZO2kiZ8aAfN2aAAAQo00DEvw727.jpg

感知模型化,专注“理解清楚”

自动驾驶的第一阶段,主要是做好理解清楚世界这件事。在这个阶段,感知系统非常重要,其实现路径高度依赖于多传感器(摄像头、毫米波雷达、激光雷达)的前端融合,而BEV(鸟瞰视角)空间与Transformer架构,因其能统一处理不同来源的特征并建立全局关联,成为实现这一目标的主要工具,通过硬件与软件的融合,可显著提升目标检测、地图分割与轨迹跟踪的可靠性。在这一阶段,需要考虑感知精度、低误报率、对光照和天气变化的鲁棒性等,同时也要保证实时性与可部署性。

这一阶段,自动驾驶模块边界清晰,工程责任明确,便于验证和上线。感知模块输出的是明确的如目标的2D/3D框、车道线、语义地图等中间结果,上层预测与规划模块也可以直接读取这些结果,更容易做安全检查和异常处理。

独立的感知模块使得数据标注和训练流程相对可控,但也正因如此,系统存在模块间信息离散、有损传递等问题。那些经人为接口(如目标类别、边界框)抽象后的结果,也无法保留传感器原始数据中的全部细节。这种信息损失在多数情况下尚可接受,但在需要细粒度环境理解、长时序依赖分析或跨模态信息融合的复杂场景中,就会严重阻碍系统做出最佳决策,从而限制其性能上限。

wKgZO2kiZ8eAIixYAAAR42n7O-I337.jpg

规控模型化,让“思考”与“行动”也神经化

在规控模型化阶段,预测、决策、规划等“规控”功能开始用神经网络实现,但系统仍保留“感知”与“规控”两个相对独立的模型。也就是说,系统的感知部分可以产出的是一个清晰、可解释的语义世界图,而规控部分的预测和规划任务,则交给了深度学习网络来完成,不再依赖传统的规则或优化器。这种架构将学习能力延伸至更高层,使行为策略能够从数据中学习更复杂的模式,同时也保留了模块化带来的可控性。

规控模型化的确可以让自动驾驶汽车变得更聪明,因为感知和规控是两个独立的模块,出了问题也容易定位和调试。但也正因为两者是分开的,两个模块之间传递信息,就像在传纸条,总会有细节丢失。可能感知模块看到的一个细微动作对决策至关重要,但传过去时却被压缩或丢弃了,这就导致决策模型无法充利用全部信息。而且两个模块各练各的,即便感知练到满分,也不代表它给规控的信息就是最有利于最终决策的,这样反而无法提升自动驾驶的整体性能。

这一阶段其实是自动驾驶发展过程中一个折中的阶段,由于希望上层更智能,又不愿放弃模块化带来的可解释性与验证便利,只能做这种选择。很多头部公司也正尝试在规控端引入更多学习能力,同时通过设计更丰富的感知中间表达和更紧密的特征接口,来缓解信息损失的问题。

wKgZO2kiZ8iAQ_mUAAASG3BOmsQ024.jpg

多模块端到端,打通关节,信息传递更完整

多模块端到端的关键在于接口形式的改变,感知与规划之间不再通过人为设计的语义标签或边界框传递信息,而是使用隐式的特征向量进行连接。也就是说,系统在逻辑上仍保留如感知、预测、规划的“模块化”划分,但这些模块之间传递的是高维连续特征,允许梯度跨模块反向传播。这样一来,训练过程可以同时影响所有模块,实现跨模块联合优化,从而可以实现全局最优解。UniAD等架构就是这一方案的典型代表,将检测、跟踪、预测、规划等任务置于同一框架下联合训练,各任务共享特征表示,从而互相促进。

多模块端到端的好处是信息保留更完整,网络可以不依赖人类预设的格式,就学到对下游任务最有价值的中间表达。因为模块依然存在,可以在部署时保留一定边界,便于逐步替换或回退,降低了风险。这种架构更是让训练效率显著提升,通过共享特征和联合损失函数,模型能更充分地利用数据,即使是稀缺场景,也能通过联合训练获得更好的泛化能力。

引入多模块端到端设计后,系统复杂度也明显上升,这不仅意味着训练需要消耗更多的数据与算力,也使得整个流程对超参数和损失权重的设置更加敏感。随之而来的还有模型可解释性的降低,当不同任务(如检测与规划)的学习目标不一致时,调试难度会大幅增加。由于各模块深度集成,若系统在某个场景失效,将很难快速定位到具体的原因,这极大地拖慢了认证进程。此外,尽管梯度能够跨模块流动以寻求全局最优,但也同时引入了训练不稳定和梯度冲突的风险,这必须依靠专门的训练策略和平衡机制来维持稳定。

wKgZO2kiZ8mAX4wBAAASAJELks8063.jpg

One Model端到端,自动驾驶完美方案

One Model端到端,是一种更彻底的端到端思路,该架构的目标是从原始传感器信号(如图像像素、雷达点云)到最终控制指令或轨迹,全部由一个统一的深度学习模型完成。这里不再有传统意义上的感知、预测、规划等模块划分,模型内部通过自学形成完成任务所需的全部中间表达和处理路径。这种架构能完整利用传感器的每一分信息,避免人为接口造成的信息瓶颈,从而在复杂场景中实现更高的性能与更好的泛化能力。

wKgZPGkiZ8qAZ4oiAABk5aNzvp4152.jpg

图片源自:网络

One Model端到端需要极大的数据与算力支撑,以覆盖足够多的驾驶场景与边界情况。模型容量、训练样本覆盖面以及监督信号的设计(如行为克隆、逆强化学习、强化学习等混合策略)都会直接影响最终性能。由于这类模型更接近“大模型”范式,可借鉴自然语言处理或视觉大模型中的预训练-微调策略,先利用海量无标签或弱标签数据预训练,再用少量高质量决策数据进行微调。

该架构中,由于模型一体化,可解释性与可验证性问题也出现了,当系统内部没有清晰的模块边界,如何构建安全论证、通过法规或行业认证就成了难题。自动驾驶模型想合规利用,需要解释系统在特定情境下为何做出某个行为,而“一体化”的黑箱模型很难满足这一要求。这一方案的鲁棒性与可控性也是需要考虑的问题,若系统在稀有场景出错时,如何快速定位、修复与回滚?传统模块化可以只替换一个模块,而“大模型”可能需要重新训练或大幅微调。在安全关键系统中,冗余设计(如双通道独立感知链路)是常态,但“一体化”模型如何设计冗余、如何在部分传感器失效时降级,是必须解决的难问题。

虽然很多人将One Model端到端视为自动驾驶的“终极形态”,但短期内它更可能作为研究前沿或特定场景(如封闭园区、低速环境)的试验方案,想真正将其落地,还需很长一段路要走。

wKgZO2kiZ8qAJ3U3AAARwcz1hbg088.jpg

最后的话

将上述四个阶段放在一起看,可以将自动驾驶系统理解为一条从“可解释、可控”逐步走向“信息完整、潜在性能更强”的技术演进路径,感知模型化适合将“看清楚”做到极致;规控模型化让“思考”与“行动”更智能;多模块端到端在效率与完整性之间找到平衡;One Model端到端虽代表理论上的性能上限,却伴随验证、解释与部署上的巨大挑战。无论选择哪种架构,自动驾驶的最终目的还是服务于人,只有在确保安全的前提下将技术用到极致,才是真正有用的技术架构。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14677

    浏览量

    176690
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    消费电子EMC整改:助被动修复主动防御的进阶之路

    消费电子EMC整改:助被动修复主动防御的进阶之路|南柯电子
    的头像 发表于 12-03 09:52 155次阅读

    一文读懂特斯拉自动驾驶FSD辅助端的演进

    [首发于智驾最前沿微信公众号]自动驾驶行业发展至今,特斯拉一直被很多企业对标,其FSD系统的每一次更新,都会获得非常多人的关注。早期自动驾驶是一个分层的、由多模块组成的系统,感知、定位、预测、规划
    的头像 发表于 10-11 09:13 397次阅读
    一文读懂特斯拉<b class='flag-5'>自动驾驶</b>FSD<b class='flag-5'>从</b>辅助<b class='flag-5'>到</b>端<b class='flag-5'>到</b>端的演进

    自动驾驶相较传统自动驾驶到底有何提升?

    [首发于智驾最前沿微信公众号]自动驾驶技术自诞生以来,便承载了人类对安全、高效、智能出行的美好憧憬。传统自动驾驶系统以层次模块化的架构为主,将感知、定位、规划与决策、控制四大核心功
    的头像 发表于 09-02 09:09 512次阅读
    端<b class='flag-5'>到</b>端<b class='flag-5'>自动驾驶</b>相较传统<b class='flag-5'>自动驾驶</b>到底有何提升?

    为什么自动驾驶端大模型有黑盒特性?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术落地,端端(End-to-End)大模型也成为行业研究与应用的热门方向。相较于传统自动驾驶系统中的模块化结构,端
    的头像 发表于 07-04 16:50 599次阅读
    为什么<b class='flag-5'>自动驾驶</b>端<b class='flag-5'>到</b>端大模型有黑盒特性?

    新能源车软件单元测试深度解析:自动驾驶系统视角

    、道路塌陷)的测试用例库,通过虚拟仿真和真实路测数据回灌验证算法的鲁棒性。 ‌第二部分:自动驾驶软件单元测试技术体系****‌ ‌测试对象分类与测试策略‌ ‌ 数据驱动型模块(如传感器融合
    发表于 05-12 15:59

    一文带你厘清自动驾驶端架构差异

    [首发于智驾最前沿微信公众号]随着自动驾驶技术飞速发展,智能驾驶系统的设计思路也经历了传统模块化架构
    的头像 发表于 05-08 09:07 794次阅读
    一文带你厘清<b class='flag-5'>自动驾驶</b>端<b class='flag-5'>到</b>端架构差异

    AI将如何改变自动驾驶

    自动驾驶带来哪些变化?其实AI可以改变自动驾驶技术的各个环节,感知能力的提升到决策框架的优化,安全性能的增强到测试验证的加速,AI可以让自动驾驶
    的头像 发表于 05-04 09:58 635次阅读

    自动驾驶经历了哪些技术拐点?

    如今以AI为核心驱动的自动驾驶系统,各大车企都在不断加码研发投入,试图在未来市场中占据制高点。那自动驾驶发展至今,经历了哪些技术拐点呢? 自动驾驶系统的发展历程
    的头像 发表于 04-27 15:54 632次阅读
    <b class='flag-5'>自动驾驶</b>经历了哪些技术拐点?

    L0L5自动驾驶技术的演进阶

    高盛(Goldman Sachs)估计,2030年,L3级自动驾驶汽车或占全球新车销量的10%。自动驾驶汽车需要经过多达6个层级的技术演进,才能最终实现上路自主驾驶
    的头像 发表于 04-24 10:42 1186次阅读

    NVIDIA Halos自动驾驶汽车安全系统发布

    NVIDIA 整合了云端车端的安全自动驾驶开发技术套件,涵盖车辆架构 AI 模型,包括芯片、软件、工具和服务。 物理 AI 正在为自动驾驶
    的头像 发表于 03-25 14:51 974次阅读

    自动驾驶地图数据规范》聊高精地图在自动驾驶中的重要性

    自动驾驶地图作为L3级及以上自动驾驶技术的核心基础设施,其重要性随着智能驾驶技术的发展愈发显著。《自动驾驶地图数据规范》(DB11/T 2041-2022)由北京市规划和自然资源委员会
    的头像 发表于 01-05 19:24 2876次阅读
    <b class='flag-5'>从</b>《<b class='flag-5'>自动驾驶</b>地图数据规范》聊高精地图在<b class='flag-5'>自动驾驶</b>中的重要性

    原理图模块化,BOM 物料位号处理

    原理图模块化,BOM 物料位号的处理问题 原理图模块化,把常用的模块保存成一个PART(在TOOL 菜单下 选择 Generate Part)。保存成OLB格式。使用的时候,就像使用元器件一样,
    发表于 01-03 08:22

    自动驾驶域控研究:One board/One Chip方案将对汽车供应链产生深远影响

    佐思汽研发布了《2024-2025年自动驾驶域控制器和中央计算机(CCU)行业研究报告》。 自动驾驶域控发展的三个阶段:Multi board、One board、One Chip 佐
    的头像 发表于 12-30 11:38 2822次阅读
    <b class='flag-5'>自动驾驶</b>域控研究:<b class='flag-5'>One</b> board/<b class='flag-5'>One</b> Chip方案将对汽车供应链产生深远影响

    自动驾驶技术研究与分析

    传递和全局优化的优势,成为智能驾驶技术发展的重要方向。与传统模块化架构相比,端端技术通过深度神经网络实现从传感器数据输入车辆控制信号输出的完整优化路径,大大提升了系统的可靠性和效率
    的头像 发表于 12-19 13:07 1524次阅读