0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型中常提的快慢思考会对自动驾驶产生什么影响?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-11-22 10:59 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2024年7月,理想汽车发布的基于端到端模型、VLM视觉语言模型和世界模型的全新自动驾驶技术架构标志着其全栈自研的智能驾驶研发进入了新阶段。该架构的算法原型创新性地受到了诺贝尔奖得主丹尼尔·卡尼曼提出的“快慢系统”理论启发,旨在让自动驾驶系统模拟人类的思考与决策过程。理想汽车结合端到端与VLM模型,推出了业界首个在车端部署的双系统方案,并成功将VLM视觉语言模型部署于车端芯片上。这套“系统1”与“系统2”相互配合的拟人化设计,目标正是让自动驾驶在处理95%的常规场景时高效敏捷,在应对5%的复杂未知场景时深入周全,从而提供更智能、更拟人的驾驶体验。那所谓的“快慢系统(思维)”到底是个啥?

什么是“快思维”和“慢思维”?

我们可以把“快思维”和“慢思维”理解为两种不同的认知模式。快思维反应迅速,依赖直觉和模式匹配;慢思维则讲究逐步推敲,进行多步逻辑推理或长期规划。把这一框架对应到大模型上,快思维相当于模型在时间有限的情况下做出的即时、一次性预测或决策;慢思维则是模型通过多轮推理、检索外部证据、模拟验证等过程得出的结论。两者并无绝对的“聪明”之分,而是适用于不同场景的工具,有的任务要快,有的任务要深。

在大模型内部,这两种“思维”可以体现在模型结构或运行策略上。快思维表现为轻量化的前向推理、缓存或索引命中、近似决策机制;慢思维则表现为多步链式推理、检索增强生成、多次抽样与自我验证,或将问题交由更大模型或模拟器进行深度计算。合理组合这两种能力,才能让系统既反应迅速,又能应对复杂和不确定的情况。

在自动驾驶中,为什么要区分快/慢思维?

自动驾驶是一个既需要毫秒级响应,又需要理解数秒甚至数分钟情境的系统。日常行驶中,车辆需要不断做出如保持车道、跟车、刹车等短时决策,这些都对延迟极为敏感;同时,系统还要对更长时间尺度的情况进行判断,例如预测其他车辆的意图、处理复杂路口的优先权问题、根据地图和交通规则制定策略规划等。引入快思维与慢思维的概念,有助于设计分层、高效且可验证的系统架构。

快思维在车辆中承担类似“反射”和“低阶控制”的角色。当感知模块检测到障碍物,或雷达、激光、摄像头融合出紧急预警时,决策模块必须在极短时间内输出制动或避让指令。这就要求系统具备高确定性、低延迟、可验证性,并依赖经过优化的模型和硬件。慢思维则负责更复杂的推理任务,例如在视觉信息不全时补全场景、在密集车流中做多步交互预测、在规则冲突或罕见场景下进行合规评估并生成安全策略。慢思维可以调用更多数据、仿真工具和外部知识库,允许检验与回滚。

这两种能力互为支撑。快思维保障即时安全,慢思维提升长期正确性与系统稳健性。没有快思维,车辆在突发情况下会因计算延迟错失响应时机;没有慢思维,车辆在复杂或模糊场景中容易犯逻辑错误或应对不当。

如何将两种思维融入系统?

要将“快”与“慢”落地,不是简单地将一个大模型一分为二,而是构建一个分层、异步、具备监控与回退机制的系统。感知与低阶控制部分通常运行在车端实时操作系统上,采用裁剪后的深度网络、确定性滤波器及规则约束,以实现低延迟和高可靠性。这一层还集成了置信度估计与安全边界机制,一旦检测到不确定性上升,即可触发更保守的操作。

慢思维模块可部署在车端,也可部署在边缘或云端,具体取决于延迟和隐私要求。其任务包括检索历史轨迹、运行多模型预测、基于物理或世界模型进行前瞻模拟,以及利用更大的语言或推理模型进行语义理解与法规解释。为提高稳健性,系统可采用自我一致性抽样、多次推理取多数结果,以及后验验证器来筛选输出。此外,将慢思维得出的策略或模型“折叠”回快思维层是常见做法,例如通过知识蒸馏、生成训练样本或直接更新小模型参数,从而将深度推理的成果固化为低延迟的运行时行为。

快、慢思维在工程上的关键点包括频率分层与接口定义。不同模块运行频率各异,信息通过明确的异步接口传递,高频信号保障控制稳定,低频的慢思维输出则作为意图或策略建议供高频控制器参考。冗余与仲裁机制也至关重要,当快慢思维意见冲突时,需要一套可验证的仲裁规则,而非简单采信某一方。系统还需具备完善的日志与可追溯能力,慢思维的推理链路应被完整记录,以支持审计与回放。

具体应用与注意事项

可以现象一下这样一个交通场景,前方车辆突然减速并靠近路肩,旁边有行人可能随时穿越。此时,快思维负责立即计算出当前如减速、保持车道或在有空间时瞬时避让等最安全的动作。这一步依赖传感器融合与优化后的控制器,时间尺度在毫秒到几十毫秒之间。与此同时,慢思维并行工作,基于历史轨迹与周边车辆的行为模型,预测该车、行人及其他交通参与者在未来几秒到十几秒内可能的动作,评估多种情境下的风险。如果慢思维判断存在高概率的复杂交互,如相邻车辆可能强行切入,它会将更保守的策略下发给快思维层,比如提前降速或发出更强警示等。

当然,一定要警惕大模型的“幻觉”与不确定性。慢思维模型在缺乏真实传感器细节时可能给出不可靠的推理,这对自动驾驶而言十分危险。因此,必须将慢思维定位为决策支持而非唯一裁决者。实施“可验证的否决权”非常关键,任何来自慢思维的建议,都必须通过一套可测试的安全条件,才能被高频控制器采纳。还有一个风险是延迟与资源竞争,若慢思维占用了本应属于快思维的计算资源,系统整体性能将受损。因此要通过资源隔离、优先级调度和模型压缩来避免这一问题。

智驾最前沿以为,在高保真仿真环境和闭环测试中持续验证慢思维策略,确保其在极端边界条件下仍输出可控结果;将慢思维的结论通过数据蒸馏等方式部分固化到快思维的小模型中,兼顾深度推理与低延迟响应;部署时设置包括实时健康检查、置信度阈值等多层监控,并在置信度降低时立即触发保守模式或路边停靠。同时,保持慢思维的可解释性,记录推理轨迹以支持事故回放、责任认定与监管合规。

最后的话

将大模型的“快思维”和“慢思维”引入自动驾驶,不是简单地把两个智能体放入车内,而是要将它们设计为互补的模块,快思维保障毫秒级的安全响应与可验证的低阶控制;慢思维提供跨时间维度的预测、策略评估与复杂语义理解。两者之间需有清晰的接口、优先级设定、冗余与仲裁机制,避免“深度思考”影响“即时反应”。

他们的重点在于分层架构、资源隔离、仿真验证,以及将慢思维输出的知识通过蒸馏或规则化固化到快思维中。安全性与可追溯性不容妥协,任何慢推理的建议在采纳前都必须经过安全检查。如此,车辆才能在突发情况下“做对事”,在复杂场景中“想清楚为什么这样做”,两种能力协同作用,才能真正提升自动驾驶系统的稳健性与可部署性。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14669

    浏览量

    176508
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶中常的卷积神经网络是个啥?

    自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像处理中尤其常见,因为图像本身就可以看作是由像素排列成的二维网格。
    的头像 发表于 11-19 18:15 1831次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的卷积神经网络是个啥?

    自动驾驶中常的“强化学习”是个啥?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,有些方案中会提到“强化学习(Reinforcement Learning,简称RL)”,强化学习是一类让机器通过试错来学会做决策的技术。简单理解
    的头像 发表于 10-23 09:00 326次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“强化学习”是个啥?

    自动驾驶上常的VLA与世界模型有什么区别?

    自动驾驶中常的VLA,全称是Vision-Language-Action,直译就是“视觉-语言-动作”。VLA的目标是把相机或传感器看到的画面、能理解和处理自然语言的大模型能力,和最
    的头像 发表于 10-18 10:15 753次阅读

    自动驾驶中常的“专家数据”是个啥?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,经常会听到一个概念,那便是“专家数据”。专家数据,说白了就是“按理应该这么做”的那类示范数据。它不是随机抓来的日志,也不是随便标注的标签,而是来源可靠
    的头像 发表于 10-09 09:33 291次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“专家数据”是个啥?

    自动驾驶中常的ODD是个啥?

    [首发于智驾最前沿微信公众号]在自动驾驶中,经常会听到一个概念,那就是ODD。所谓ODD,全称为Operational Design Domain,中文常译为“运行设计域”或者“作业域”。直观一点
    的头像 发表于 09-22 09:04 540次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ODD是个啥?

    交叉口的信号指示会对自动驾驶汽车产生什么影响?

    交叉口”)作为城市道路中常见的两种交通场景,对自动驾驶系统的运行策略有着本质区别。作为人类驾驶员,无论是否有信号指示,都可以在交叉口灵活处理,但对于自动驾驶汽车来说,是否有信号灯将会
    的头像 发表于 08-24 11:19 1400次阅读

    自动驾驶中常的硬件在环是个啥?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶技术时,经常会提及一个技术,那就是硬件在环,所谓的硬件在环是个啥?对于自动驾驶来说有啥作用?今天智驾最前沿就带大家来聊聊这一技术。 所谓硬件在环
    的头像 发表于 08-14 08:54 876次阅读

    自动驾驶中常的RTK是个啥?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶关键技术时,经常会听到一个技术,那就是RTK,很多人看到RTK后一定会想,这到底是个啥技术?为啥这个技术很少在发布会上看到,但对于自动驾驶来说却非常关键
    的头像 发表于 08-10 10:35 747次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的RTK是个啥?

    自动驾驶中常的“先验数据”是个啥?主要用在哪些方面?

    自动驾驶领域,“先验数据”指的是在车辆运行之前就已经获取并可供系统使用的静态或已知信息,相当于车辆驾驶的“经验”或“环境背景知识”。这些信息不依赖于实时传感器捕获,而是通过离线测绘、模型推算或专家
    的头像 发表于 07-26 10:02 563次阅读

    自动驾驶中常的惯性导航系统是个啥?可以不用吗?

    每次提到自动驾驶硬件时,大家可能第一反应想到的是激光雷达、车载摄像头、毫米波雷达等,但想要让自动驾驶车辆实际落地,有一个硬件也非常重要,那就是惯性导航系统。在很多讨论自动驾驶技术的内容中,惯性导航系统的出场频次远低于激光雷达、车
    的头像 发表于 07-24 18:12 1527次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的惯性导航系统是个啥?可以不用吗?

    自动驾驶中常的世界模型是个啥?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作一种
    的头像 发表于 06-24 08:53 737次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的世界<b class='flag-5'>模型</b>是个啥?

    自动驾驶中常的“点云”是个啥?

    [首发于智驾最前沿微信公众号]在自动驾驶系统中,点云技术作为三维空间感知的核心手段,为车辆提供了精确的距离和形状信息,从而实现目标检测、环境建模、定位与地图构建等关键功能。那所谓的“点云”,到底是个
    的头像 发表于 05-21 09:04 822次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“点云”是个啥?

    自动驾驶中常的“NOA”是个啥?

    近年来,自动驾驶技术发展迅速,业界不断探索如何在复杂交通场景中实现真正的无人驾驶。城市NOA作为自动驾驶的一项前沿技术,正成为各大厂商相互争夺的关键技术。 何为NOA? NOA,全称
    的头像 发表于 04-09 09:03 2167次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是个啥?

    自动驾驶模型中常的Token是个啥?对自动驾驶有何影响?

    近年来,人工智能技术迅速发展,大规模深度学习模型(即大模型)在自然语言处理、计算机视觉、语音识别以及自动驾驶等多个领域取得了突破性进展。自动驾驶作为未来智能交通的重要方向,其核心技术之
    的头像 发表于 03-28 09:16 974次阅读

    自动驾驶中常的鲁棒性是个啥?

    随着自动驾驶技术的快速发展,鲁棒性(Robustness)成为评价自动驾驶系统的重要指标之一。很多小伙伴也会在自动驾驶相关的介绍中,对某些功能用鲁棒性进行描述。一个鲁棒的系统能够在复杂多变的环境中保
    的头像 发表于 01-02 16:32 8343次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的鲁棒性是个啥?