0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小鹏汽车与北京大学研究论文成功入选AAAI 2026

小鹏汽车 来源:小鹏汽车 2026-01-04 11:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,AAAI 2026公布了论文录用结果,该会议是人工智能领域的国际顶级会议之一。据悉,AAAI 2026共收到23,680份论文投稿,其中4,167篇论文被录用,录用率仅为17.6%。

由小鹏汽车和北京大学计算机学院多媒体信息处理全国重点实验室联合完成的论文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》成功入选。

这篇论文最大的贡献在于,提出了一种专门为端到端自动驾驶VLA模型定制的、高效的视觉Token剪枝框架——FastDriveVLA。

随着AI大模型技术的加速演进,VLA(视觉-语言-动作)模型由于在复杂场景理解与动作推理方面展示出巨大潜力,正在被广泛地应用于端到端自动驾驶系统中。VLA模型在处理视觉信息时,会将图像编码为海量视觉Token(词元)。

视觉Token是VLA模型“看懂世界”,并“做出决策”的基石,其质量、数量与选择策略直接决定模型的性能、效率与可信度。然而,直接转换的处理方式会导致车端计算负荷变大,同时还会影响模型的推理效率和决策执行。

此前,视觉Token剪枝已被证实了是加速VLA模型推理的可行方法之一。但传统的视觉Token剪枝方法或依赖文本-视觉注意力关联,或基于Token相似度去重,在驾驶场景中均存在明显局限。

为了解决这一问题,小鹏汽车联合北大共同提出了FastDriveVLA——一种专门为自动驾驶设计的、基于重建的视觉Token剪枝框架。

该框架的提出受到了人类驾驶员在驾驶时会专注于相关前景信息(如行人、道路、车辆、交通标志、交通信号灯、交通障碍物)的启发,引入了一种新颖的对抗性前景-背景重建策略,以增强VLA模型识别有价值Token的能力,从而教会AI“像人一样开车”,自动过滤无关紧要的视觉信息,只关注有用的核心信息。

8c2f5604-e3aa-11f0-8c8f-92fbcf53809c.png

FastDriveVLA 框架

在训练阶段,论文中提出了一种新颖的“前景-背景对抗重建”策略,以增强 ReconPruner 对前景视觉 Token 的感知能力;

在推理阶段,ReconPruner可直接嵌入自动驾驶VLA模型,用于 Token 剪枝。

FastDriveVLA包含一个即插即用的视觉Token剪枝器ReconPruner。在车端模型的推理阶段, ReconPruner可直接嵌入自动驾驶VLA模型用于视觉Token的剪枝,即插即用,无需重新训练整个模型。为了辅助该剪枝器的训练,还专门构建了包含来自6个摄像头视角的24.1万个图像-掩码对的nuScenes-FG数据集。这一大规模的自动驾驶前景分割标注数据集,可广泛用于未来自动驾驶的研究。

8c9a2cea-e3aa-11f0-8c8f-92fbcf53809c.png

nuScenes-FG。

该数据集为 nuScenes 场景提供了 24.1 万个前景分割标注。

这种“去繁从简”只关注核心驾驶信息的思路,让FastDriveVLA取得了惊艳的效果。最终,nuScenes自动驾驶数据集上的测试显示,采用这一剪枝框架,在不同剪枝率下均取得当前最优即SOTA效果:

当剪枝比例达25%,驾驶性能几乎不下降,其L2轨迹误差与碰撞率指标甚至超越未剪枝的基准模型;

当剪枝比例达50%,在所有指标上表现更平衡;

与此同时,VLA模型的推理效率得到了显著提升。当视觉Token数量从3249减少到812时,FastDriveVLA 实现了近7.5倍的计算量(FLOPs)减少。在 CUDA (指从GPU启动一个计算任务到真正拿到该任务的计算结果之间所经历的时间)延迟方面,FastDriveVLA 将预填充时间(prefill)与解码时间(decode)分别减少了3.7倍与1.3倍。

小鹏汽车联合北大提出的FastDriveVLA,建立了自动驾驶VLA模型的高效视觉Token剪枝的新范式,同时树立了车端大模型高效部署上车的新标杆。

此次论文入选AAAI 2026,是小鹏汽车今年第二次参与人工智能领域的国际顶级会议。早在今年6月,小鹏汽车曾作为CVPR WAD唯一邀请演讲中国车企,分享自动驾驶基座模型研发进展。在今年11月的科技日上,小鹏汽车正式推出第二代VLA,创新性地去掉了“语言转译”环节,首次实现从视觉信号到动作指令的端到端直接生成,颠覆了行业传统的「V-L-A」架构,探索全新物理AI模型范式。这些成果都为全球自动驾驶的研究和实践注入了全新的动力。

这一系列成果也彰显了小鹏汽车从模型架构设计、模型训练到模型蒸馏、部署上车的全栈自研能力。未来,小鹏汽车将继续以L4为目标,在AI大模型领域加大投入,加速物理AI大模型上车,让更安全、高效、舒适的智驾体验惠及全球用户。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52337
  • 自动驾驶
    +关注

    关注

    795

    文章

    15056

    浏览量

    181989
  • 小鹏汽车
    +关注

    关注

    4

    文章

    654

    浏览量

    16870

原文标题:小鹏联合北大发布论文登国际AI顶会AAAI 2026,树立车端大模型高效部署上车新标杆⁠!

文章出处:【微信号:XPENGMOTORS,微信公众号:小鹏汽车】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    北京大学与阿里巴巴达摩院合作研究成果荣登国际顶级学术期刊自然

    昨天,国际顶级学术期刊《自然》(Nature)发表了北京大学与阿里巴巴达摩院的合作研究成果,利用AI和开源卫星影像绘制出首张全国尺度高精度风光设施分布图。
    的头像 发表于 05-22 16:12 282次阅读

    【“芯”篇章】中星联华走进高校系列-北京大学

    1前言2026年5月19日中星联华科技携手北京大学集成电路学院,成功举办「芯篇章——走进高校」系列技术大讲堂北京学站活动。本次讲座以「ADC/DAC/PLL/SerDes与高速信号完整
    的头像 发表于 05-20 14:03 183次阅读
    【“芯”篇章】中星联华走进高校系列-<b class='flag-5'>北京大学</b>站

    致真精密仪器晶圆级原子力显微镜成功交付北京大学

    近日,致真精密仪器自主研发的晶圆级原子力显微镜在北京大学集成电路学院顺利完成交付及验收。此次交付验收,标志着公司在高端微纳表征设备领域取得了又一重要进展,以自主创新的硬核实力,为顶尖学府的科研攻关提供精准可靠的支撑。
    的头像 发表于 05-08 15:55 191次阅读

    北京大学学生汽车文化协会走进华为智擎展台参观交流

    北京大学学生汽车文化协会汇聚了一批对汽车科技抱有浓厚兴趣与研究能力的优秀青年学子,始终致力于链接产业前沿,为成员提供沉浸式的行业体验。此次借北京
    的头像 发表于 05-07 16:38 265次阅读

    英创汇智入选2026北京市先进级智能工厂

    近日,北京市经济和信息化局正式公布2026北京市先进级智能工厂(第一批)认定名单,北京英创汇智汽车技术有限公司
    的头像 发表于 04-09 09:15 842次阅读

    理想汽车马赫100芯片论文入选ISCA 2026

    近日,理想汽车论文《M100: An Orchestrated Dataflow Architecture Powering General AI Computing》入选ISCA 2026
    的头像 发表于 03-30 17:37 1676次阅读
    理想<b class='flag-5'>汽车</b>马赫100芯片<b class='flag-5'>论文</b><b class='flag-5'>入选</b>ISCA <b class='flag-5'>2026</b>

    北京大学采购南京大展的DZ-TGA101热重分析仪

    科研中的“微观探照灯”。近日,北京大学临床医学院正式采购南京大展DZ-TGA101热重分析仪,用于材料的研究和测试。DZ-TGA101热重分析仪具有宽泛的温度范围
    的头像 发表于 03-30 10:45 534次阅读
    <b class='flag-5'>北京大学</b>采购南京大展的DZ-TGA101热重分析仪

    地平线11篇论文强势入选CVPR 2026

    论文收录结果。地平线凭借深厚的技术积淀与前瞻的科研布局,共有11篇论文成功入选,覆盖端到端自动驾驶、3D重建、世界模型、具身智能等多个核心领域,充分彰显地平线在前沿技术领域的顶尖研发水平。
    的头像 发表于 03-18 15:18 984次阅读
    地平线11篇<b class='flag-5'>论文</b>强势<b class='flag-5'>入选</b>CVPR <b class='flag-5'>2026</b>

    后摩智能4篇论文入选人工智能顶会ICLR 2026

    继斩获NeurIPS、ICCV、AAAI、ACMMM四大顶会认可后,后摩智能再传捷报——4篇论文成功入选国际顶级人工智能会议ICLR 2026(International Confer
    的头像 发表于 02-09 14:18 1088次阅读

    Nullmax DiffRefiner轨迹预测框架入选AAAI 2026

    1月20日至27日,第40届 (AAAI 2026) 于新加坡召开,汇聚世界顶尖学者与先锋研究者,以智慧碰撞共绘人工智能的未来图景。
    的头像 发表于 01-22 16:16 624次阅读
    Nullmax DiffRefiner轨迹预测框架<b class='flag-5'>入选</b><b class='flag-5'>AAAI</b> <b class='flag-5'>2026</b>

    地平线五篇论文入选NeurIPS 2025与AAAI 2026

    近日,两大顶级学术会议录用结果相继揭晓,地平线凭借在机器人算法领域的深度钻研,共有5篇论文从全球数万份投稿中脱颖而出,分别入选NeurIPS 2025与AAAI 2026
    的头像 发表于 11-27 11:39 1467次阅读
    地平线五篇<b class='flag-5'>论文</b><b class='flag-5'>入选</b>NeurIPS 2025与<b class='flag-5'>AAAI</b> <b class='flag-5'>2026</b>

    理想汽车12篇论文入选全球五大AI顶会

    2025年三季度以来,理想汽车基座模型团队在国际顶级AI学术会议上取得重大突破,共有12篇高质量研究论文入选AAAI、NeurIPS、EMN
    的头像 发表于 11-21 14:44 1096次阅读
    理想<b class='flag-5'>汽车</b>12篇<b class='flag-5'>论文</b><b class='flag-5'>入选</b>全球五大AI顶会

    摩尔线程新一代大语言模型对齐框架URPO入选AAAI 2026

    近日,摩尔线程在人工智能前沿领域取得重要突破,其提出的新一代大语言模型对齐框架——URPO统一奖励与策略优化,相关研究论文已被人工智能领域的国际顶级学术会议AAAI 2026收录。这一
    的头像 发表于 11-17 16:03 656次阅读
    摩尔线程新一代大语言模型对齐框架URPO<b class='flag-5'>入选</b><b class='flag-5'>AAAI</b> <b class='flag-5'>2026</b>

    Nullmax端到端轨迹规划论文入选AAAI 2026

    11月8日,全球人工智能顶会 AAAI 2026 公布论文录用结果,Nullmax 研发团队的端到端轨迹规划论文成功入选。该
    的头像 发表于 11-12 10:53 1184次阅读

    知存科技助力北京大学校友论坛圆满落幕

    近日,由知存科技倾情支持的北京大学校友论坛在热烈的氛围中圆满落幕。作为第九届集微半导体大会的特色环节,今年的北大校友论坛吸引了数十位来自半导体产业不同领域的校友齐聚上海张江科学会堂,共叙母校情谊
    的头像 发表于 07-17 10:18 1023次阅读