0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶中提到的WEWA架构是个啥?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-09-26 09:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]最近有小伙伴在留言区留言,想让我聊聊现在非常火热的WEWA架构,相较于VLA,WEWA有何区别,今天就简单聊聊这个内容,也期待大家在评论区留言讨论。

wKgZPGjV5iKAVdV8AAAQo00DEvw956.jpg

什么是WEWA?

WEWA全称可以理解为“World Engine+World Action”。它把实现自动驾驶的思路拆成两层,一层在云端,负责“造世界、训练模型、把难题推演透”;另一层在车端,负责“看世界、理解世界、直接下决定并把车开出去”。云端是大脑的训练工厂,车端是实时决策与执行的现场指挥。这样做有一个好处,那就是可以把稀有但危急的边缘场景用数据和模型在云端“补齐”,把实力更强的行为模型蒸馏、裁剪后放到车上,让车能用尽可能低的延迟、尽可能接近人类的方式去处理突发状况。

WEWA的“World Engine”其实更侧重生成和仿真,尤其是长尾和“难例”场景的合成;“World Action”则是车端的行为模型,依赖多模态感知(摄像头、毫米波/雷达/激光雷达、车内外麦克风等),并通过一种多专家(Mixture of Experts,MoE)机制在运行时选择或组合最佳决策路径。训练在云,推理在车,这是它最核心的运作节奏。

wKgZPGjV5iOALEsIAAAR42n7O-I025.jpg

WEWA和VLA有何区别?

与现在自动驾驶行业非常火热的VLA相比,WEWA有什么区别?VLA的核心思想是把视觉理解和语言推理联系起来,让模型用类似“语言”的中间表示来解释、推理世界,进而生成动作。这种方式的优点是可解释性更强,好的VLA系统在推理链路上能让工程师更容易理解为什么会做出某个决策,也便于用文本/符号做高层规划或嵌入人机交互。

WEWA则选择跳过“语言”这一步,直接把世界状态映射到动作。它不把感知到的信息先翻译成符号化的语言再推理,而是把云端训练出的世界模型(擅长物理推演与行为预测)蒸馏成车端可运行的行为模型,由多模态输入直接驱动决策与轨迹输出。这样做的直接效果就是省去了从“感知→符号化语言→推理→动作”这段可能产生的精度损耗与时间延迟。

VLA路线通常更仰仗大规模真实路测数据,把大量实车里程当作模型上限的重要组成部分;而WEWA更强调用高质量的仿真与合成数据去补齐那些在现实中几乎见不到但安全关键的边缘场景。

wKgZO2jV5iOAE8c6AAASG3BOmsQ973.jpg

WEWA的几个技术优势

汽车是高实时性、高安全边界的系统,任何多一步的数据转换或延迟都会放大风险。WEWA的设计选择正是从这类工程约束出发的,因此它在几个地方有明显的工程优势。

1)低延时更利于“车端即时控制”

WEWA把训练好的行为模型蒸馏到车端并与多模态感知直接联动,避免了把信息先翻译成语言符号再做二次推理的过程。少一次转换,就少一次可能的精度损失和延迟。华为ADS4就是采用WEWA技术架构,据其官方介绍,这一架构下的端到端时延降低了约一半,这种延时改进在高速与突发场景下直接等同于多一层安全缓冲。

2)更高效覆盖长尾“难例”

真正危及安全的罕见场景在现实中其实非常稀少,单靠车队跑数据很难在可接受的时间内覆盖所有会导致严重后果的边缘场景。WEWA把“难例扩散生成模型”放在云端,通过合成与仿真生成高密度的极端场景用于训练,云端能在短时间内把非常多、非常罕见但具有代表性的危险场景喂给模型,提升模型在这些极端场景下的鲁棒性。VLA路线虽也重视仿真,但往往更依赖真实路测去获得临界状态数据,这会受限于采集效率和时间窗口。

3)蒸馏与MoE带来资源与性能的折衷

WEWA架构下,云端可以训练体量更大的“世界模型”,车端运行的是蒸馏后、经过剪枝和专门优化的“世界行为模型”。再结合MoE这种运行时只激活部分专家(而不是总调用全部模型)的策略,能在有限算力下实现接近大模型的决策能力。这能让整套系统在车端对算力的需求更温和,也让软硬件协同调优的可能性变多。

4)端云协同提升迭代效率

WEWA把复杂训练放在云端,更新和能力提升可以通过OTA把改进快速推到车上;同时,云端的仿真与真实回放能形成闭环,理论上能更快把在车上发现的“新难例”补回到训练集中去,这种端云的正反馈对能力加速很有帮助。

以上这些都是WEWA的技术卖点,但其也有一些潜在的问题。仿真生成的场景质量决定了训练结果的上限,如果生成模型没把物理细节或光学特性还原好,训练出的行为模型在现实会遭遇分布偏差。还有就是跳过“语言”层,所带来的可解释性劣势也是必须面对的事实,没有清晰的中间符号,工程师在调试复杂失败案例时会更难定位问题根源。再者,蒸馏虽能压缩模型,但在极端态下有可能丧失一些细微但关键的决策能力,如何在压缩与安全之间做平衡,是需要解决的问题。

wKgZO2jV5iSASAk9AAASAJELks8490.jpg

体验才是检验一切的标尺

无论架构上讲得多漂亮,只有用户体验和道路实测才是判断一个技术最好的场所。WEWA要保证的是在真实路况下“看起来顺、开起来安全”。体验好不好往往由系统在突发情境下反应是否自然、是否能避免过度干预、能否在复杂场景下给出稳定而可预测的行为等几个直观感受决定的。

VLA把语言中间表示作为桥梁,某些场景下能更容易解释“为什么这么做”,这对用户信任和工程调试有帮助。但解释性并不等于效果好,解释性强的推理若因延迟或精度损失导致决策迟钝或不稳,用户同样不会买单。因此这两条路线的终极较量,还是体现在“谁能在真实道路上、在成千上万小时的运行中,把安全与舒适都做实”的能力。

其实用户体验是一个长期的迭代的过程。哪怕初期某个架构在某些场景表现更优,持续的场景采集、仿真增强、模型更新和OTA能力同样决定最终胜负。厂商之间或会越来越多地把注意力放在闭环能力上,车上出了事情是否能快速回传并被云端吸收?云端又是否能快速把改进推回车上?这个循环的快慢直接影响能力演进速率。

wKgZO2jV5iWAN8nnAAARwcz1hbg461.jpg

最后的话

WEWA的思路是把有限的车端资源和高实时性需求放在首位,用云端补齐真实世界难以采集的长尾场景,通过蒸馏和MoE在车端做出及时且稳健的决策。这样做的好处在于延迟更低、能更系统地覆盖难例、并且在量产与成本上有更现实的考量。VLA的长处在于解释性、用真实数据打磨行为和把语言能力作为更高阶的人机交互与推理工具。

其实对用户而言真正有价值的,是在复杂路况下系统不会“慌”,在突发场景下决策既安全又合乎人的直觉。这意味着技术路线之争的背后,本质是对“可信赖体验”的追求,系统不仅不能出错,更要让人安心。无论是WEWA的实时响应还是VLA的行为可解释,最终都是为了实现一种连贯、自然的驾驶风格,让乘客在无意识中感受到技术的可靠性。也只有当系统能像人类一样从容应对不确定性,才能真正赢得用户的长期信任,推动自动驾驶从功能走向陪伴。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14682

    浏览量

    176787
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶中提到的“深度相机”是

    自动驾驶的实现离不开各类传感器的支持,其中纯视觉方案成为很多技术方案的选择,但由于摄像头无法感知到环境深度信息,因此有部分技术方案提到了“深度相机”的技术。
    的头像 发表于 12-13 13:35 320次阅读

    自动驾驶中常提的“强化学习”是

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,有些方案中会提到“强化学习(Reinforcement Learning,简称RL)”,强化学习是一类让机器通过试错来学会做决策的技术。简单理解
    的头像 发表于 10-23 09:00 349次阅读
    <b class='flag-5'>自动驾驶</b>中常提的“强化学习”是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常提的“专家数据”是

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,经常会听到一概念,那便是“专家数据”。专家数据,说白了就是“按理应该这么做”的那类示范数据。它不是随机抓来的日志,也不是随便标注的标签,而是来源可靠
    的头像 发表于 10-09 09:33 300次阅读
    <b class='flag-5'>自动驾驶</b>中常提的“专家数据”是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常提的ODD是

    [首发于智驾最前沿微信公众号]在自动驾驶中,经常会听到一概念,那就是ODD。所谓ODD,全称为Operational Design Domain,中文常译为“运行设计域”或者“作业域”。直观一点
    的头像 发表于 09-22 09:04 561次阅读
    <b class='flag-5'>自动驾驶</b>中常提的ODD是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常提的硬件在环是

    [首发于智驾最前沿微信公众号]在谈及自动驾驶技术时,经常会提及一技术,那就是硬件在环,所谓的硬件在环是?对于自动驾驶来说有
    的头像 发表于 08-14 08:54 899次阅读

    自动驾驶中常提的RTK是

    [首发于智驾最前沿微信公众号]在谈及自动驾驶关键技术时,经常会听到一技术,那就是RTK,很多人看到RTK后一定会想,这到底是技术?为啥这个技术很少在发布会上看到,但对于
    的头像 发表于 08-10 10:35 768次阅读
    <b class='flag-5'>自动驾驶</b>中常提的RTK是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常提的惯性导航系统是?可以不用吗?

    每次提到自动驾驶硬件时,大家可能第一反应想到的是激光雷达、车载摄像头、毫米波雷达等,但想要让自动驾驶车辆实际落地,有一硬件也非常重要,那就是惯性导航系统。在很多讨论
    的头像 发表于 07-24 18:12 1538次阅读
    <b class='flag-5'>自动驾驶</b>中常提的惯性导航系统是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?可以不用吗?

    自动驾驶中常提的世界模型是

    对外部环境进行抽象和建模的技术,让自动驾驶系统在一简洁的内部“缩影”里,对真实世界进行描述与预测,从而为感知、决策和规划等关键环节提供有力支持。 什么是世界模型? 我们不妨先把“世界模型”想象成一种“数字化的地
    的头像 发表于 06-24 08:53 782次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界模型是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常提的HMI是

    [首发于智驾最前沿微信公众号]在自动驾驶汽车领域,HMI(Human–Machine Interface,人机交互界面)正成为很多车企相互竞争的一大领域。之所以如此,是因为在车辆从“人控”过渡到“机
    的头像 发表于 06-22 13:21 2117次阅读

    自动驾驶中常提的“点云”是

    ?对自动驾驶有何影响? 点云是? 点云(Point Cloud)是一种在三维空间中由大量离散点组成的数据集合,每个点包含自身的笛卡尔坐标(X、Y、Z),并可附带颜色、强度、时间戳
    的头像 发表于 05-21 09:04 840次阅读
    <b class='flag-5'>自动驾驶</b>中常提的“点云”是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶行业常提的高阶智驾是

    的调整,也见证了这个行业的技术演进。“高阶智驾”作为现阶段在各大车企发布会经常提到的一词,也预示着自动驾驶行业正加速走入下半场。高阶智驾不仅在功能上远超传统的高级辅助驾驶系统,更在核
    的头像 发表于 04-18 12:24 869次阅读
    <b class='flag-5'>自动驾驶</b>行业常提的高阶智驾是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常提的“NOA”是

    近年来,自动驾驶技术发展迅速,业界不断探索如何在复杂交通场景中实现真正的无人驾驶。城市NOA作为自动驾驶的一项前沿技术,正成为各大厂商相互争夺的关键技术。 何为NOA? NOA,全称
    的头像 发表于 04-09 09:03 2203次阅读
    <b class='flag-5'>自动驾驶</b>中常提的“NOA”是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶大模型中常提的Token是?对自动驾驶有何影响?

    、多模态传感器数据的实时处理与决策。在这一过程中,大模型以其强大的特征提取、信息融合和预测能力为自动驾驶系统提供了有力支持。而在大模型的中,有一“Token”的概念,有些人看到后或许会问: Token是
    的头像 发表于 03-28 09:16 1002次阅读

    自动驾驶行业中的Tier1与Tier2是?有何区别?

    责任分工。那么,Tier1和Tier2到底是?两者之间又有哪些具体区别? Tier1和Tier2的定义 在自动驾驶行业中,Tier1和Tier2分别是供应链中的两重要环节,它们在
    的头像 发表于 03-16 10:50 1800次阅读

    自动驾驶中常提的鲁棒性是

    随着自动驾驶技术的快速发展,鲁棒性(Robustness)成为评价自动驾驶系统的重要指标之一。很多小伙伴也会在自动驾驶相关的介绍中,对某些功能用鲁棒性进行描述。一鲁棒的系统能够在复杂
    的头像 发表于 01-02 16:32 8383次阅读
    <b class='flag-5'>自动驾驶</b>中常提的鲁棒性是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?