0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

佐思汽研发布《2023-2024年汽车AI大模型技术和应用趋势报告》

佐思汽车研究 来源:佐思汽车研究 2024-02-28 14:21 次阅读

2023年以来,越来越多车型开始接入大模型,越来越多Tier1推出汽车大模型解决方案。特斯拉FSD V12的出色进展和SORA的推出,更加速了AI大模型在座舱和智驾领域的落地。

端到端自动驾驶大模型的发展突飞猛进

2023年2月,采用端到端自动驾驶模型的特斯拉FSD v12.2.1已经开始陆续在美开启推送,不仅仅是员工和测试人员。根据首批客户的反馈,FSD V12 相当强大,让以前不相信不敢用自动驾驶的普通人也敢于使用FSD了。譬如,特斯拉 FSD V12 可绕行路边积水,一位特斯拉的工程师评论说:这种开法很难用明确的代码来实现,但特斯拉的端到端方案几乎毫不费力地实现了。

自动驾驶AI大模型的发展可以分为四个阶段:

1.0时代就是在感知层面使用大模型(Transformer);

2.0时代就是模块化,感知规控决策都用大模型;

3.0时代就是端到端大模型(一“端”是传感器的原始数据,另一“端”直接输出驾驶动作);

4.0时代就是从垂直领域的人工智能走向通用领域的人工智能(AGI的世界模型)。

现在多数公司处于2.0时代。特斯拉FSD V12已处于3.0时代。其他主机厂和Tier1纷纷跟进FSD V12的端到端大模型。2024年1 月 30 日,小鹏汽车宣布,小鹏的端到端模型下一步将会全面上车。据悉,蔚来和理想的“基于端到端”自动驾驶模型也将在2024年上线。

FSD V12驾驶决策交由AI算法生成,用海量视频数据训练出的端到端神经网络,替换掉了超过30万行C++代码。FSD V12提供了一条有待验证的全新路径,若得以走通,将对行业产生颠覆性影响。

2月16日,OpenAI发布文本生成视频模型SORA,标志着AI视频应用即将大规模应用的前夜。SORA不仅支持通过文本或图像生成长达60秒的视频,其视频生成能力、复杂场景和角色生成能力、以及对物理世界模拟的能力,都显著超越了之前的技术。

SORA和FSD V12都是通过视觉让AI能够理解甚至模拟真实的物理世界。Elon Mask认为,“FSD 12和Sora不过是AI通过视觉认知世界、理解世界上的两个开花结果,FSD最终用于驾驶行为,Sora则是用来生成视频。”

SORA的爆火,进一步证明了FSD V12的合理性。马斯克称「特斯拉已经能够制作真实世界视频大约一年了」。

d760aeb0-d5f2-11ee-a297-92fbcf53809c.jpg

来源:Twitter

AI大模型快速演化,带来全新机会

最近三年,自动驾驶大模型经历了若干次的演化,领先车企的自动驾驶系统几乎每年要重写一次。这也给后来者提供了切入机会。

CVPR2023上,商汤、OpenDriveLab、地平线等联合发布的端到端的自动驾驶算法UniAD,获得了2023年的最佳论文。

2024年初,中科慧拓技术团队和中科院自动化所共同提出的生成式端到端自动驾驶模型GenAD,将生成式人工智能(Generative AI)和端到端自动驾驶技术结合,是业界首个生成式端到端自动驾驶模型。该技术颠覆了UniAD的渐进式流程端到端方案,探讨了一种新的端到端自动驾驶范式,关键在于采用生成式人工智能的方式预测自车和周围环境在过去场景中的时序演变方式。

d76f1e64-d5f2-11ee-a297-92fbcf53809c.png

来源:中科慧拓

2024年2月,地平线和华中科技大学提出了VADv2,一个基于概率规划的端到端驾驶模型。VADv2以流方式输入多视角图像序列,将传感器数据转换为环境标记嵌入,输出动作的概率分布,并从中采样一个动作来控制车辆。仅使用摄像头传感器,VADv2在CARLA Town05基准测试中实现了最先进的闭环性能,显著优于所有现有方法。它能够在完全端到端的方式下稳定运行,甚至不需要基于规则的封装。

d77c9026-d5f2-11ee-a297-92fbcf53809c.png

来源:地平线

在Town05长距离基准测试中,VADv2取得了85.1的驾驶分数,98.4的路程完成度,以及0.87的违规分数,如表1所示。与之前的最先进方法相比,VADv2在路程完成度更高的同时,显著提高了驾驶分数,增加了9.0。值得注意的是,VADv2仅使用摄像头作为感知输入,而DriveMLM同时使用了摄像头和激光雷达。此外,与之前仅依赖摄像头最佳方法相比,VADv2显示出更大的优势,驾驶分数的显著提高达到了16.8。

d78cb58c-d5f2-11ee-a297-92fbcf53809c.png

来源:地平线

也是在2024年2月,清华大学交叉信息研究院和理想汽车提出了 DriveVLM。DriveVLM的整体流程如下图所示。一系列图像被大型视觉语言模型(VLM)处理,以执行特定的链式思维(CoT)推理,得出驾驶规划结果。这个大型VLM包括一个视觉编码器和一个大型语言模型(LLM)。

d79dd2ae-d5f2-11ee-a297-92fbcf53809c.png

来源:清华大学交叉信息研究院

由于VLMs在空间推理和高计算需求方面的局限性,DriveVLM团队又提出了DriveVLM-Dual,一个结合了DriveVLM与传统自主驾驶流水线优势的混合系统。DriveVLM-Dual可选择性地将DriveVLM与传统的3D感知和规划模块相结合,例如3D目标检测器、占用网络和运动规划器,使系统能够实现3D定位和高频规划能力。这种双重系统设计,类似于人脑的慢速和快速思考过程,能够有效适应驾驶场景中不断变化的复杂性。

大模型兴起,AI和云计算公司受关注

AI大模型兴起,算力、算法和数据三者缺一不可。擅长算法,储备了大量算力的AI公司(如科大讯飞、商汤科技、旷视科技等),以及具备强大智算中心的云计算公司(如浪潮、火山引擎、腾讯云等)受到主机厂关注。

商汤在AI大模型领域布局了座舱多模态大模型SenseChat-Vision、AIDC智算中心(6000P算力)、自动驾驶大模型DriveMLM。2024年初,商汤推出DriveMLM,在闭环测试最权威榜单CARLA上取得很好的成绩。DriveMLM是介于模块化和端到端方案之间的中间方案,具备可解释性。

d7add4ec-d5f2-11ee-a297-92fbcf53809c.jpg

来源:商汤科技

在自动驾驶的Corner Case采集上,火山引擎和毫末智行一起将大模型应用在场景生成和标注提效上。在火山引擎提供的云服务能力支持下,毫末DriveGPT大模型的预标注,整体效率提升了10倍。

2023年,腾讯发布了在智能汽车云、智驾云图、智能座舱等领域的升级产品和方案。算力方面,腾讯智能汽车云带来3.2Tbps带宽,算力性能提升3倍,通信性能提升10倍,计算集群GPU利用率提升60%以上,为智能驾驶大模型训练提供高带宽、低延迟的智算能力支撑。

在训练加速方面,腾讯智能汽车云结合太极Angel训练加速框架,训练速度相比业界主流框架提高1倍,推理速度相比业界主流框架提升1.3倍。博世、蔚来汽车、英伟达、奔驰、文远知行等企业目前都是腾讯智能汽车云的用户。2024年,腾讯将进一步加强AI大模型的建设。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 特斯拉
    +关注

    关注

    66

    文章

    6009

    浏览量

    125675
  • 自动驾驶
    +关注

    关注

    773

    文章

    13032

    浏览量

    163218
  • FSD
    FSD
    +关注

    关注

    0

    文章

    59

    浏览量

    5901
  • OpenAI
    +关注

    关注

    8

    文章

    757

    浏览量

    5913
  • 大模型
    +关注

    关注

    2

    文章

    1516

    浏览量

    1104

原文标题:汽车AI大模型研究:端到端突飞猛进,大模型演化带来全新机会

文章出处:【微信号:zuosiqiche,微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    2024智能汽车技术研发测试洞察报告发布

    汽车行业在适应与电动、自动驾驶和混合动力车辆相关的日益增长的市场需求和挑战时,正在经历重大变革。在这里,我们将关注我们报告2024智能汽车技术
    的头像 发表于 04-17 10:26 458次阅读
    《<b class='flag-5'>2024</b>智能<b class='flag-5'>汽车技术</b>与<b class='flag-5'>研发</b>测试洞察<b class='flag-5'>报告</b>》<b class='flag-5'>发布</b>

    2024中国AI模型产业发展报告

    日前,人民网财经研究院、至顶科技联合发布《开启智能新时代:2024年中国AI模型产业发展报告》(以下简称《
    的头像 发表于 03-30 08:26 418次阅读
    <b class='flag-5'>2024</b>中国<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>产业发展<b class='flag-5'>报告</b>

    华域汽车系统股份有限公司发布2023年年度报告

    2024年3月29日,华域汽车系统股份有限公司发布2023年年度报告
    的头像 发表于 03-29 14:05 189次阅读

    2024小米汽车产业链分析及新品上市全景洞察报告

    2024小米汽车产业链分析及新品上市全景洞察报告 *附件:小米汽车全面洞察报告.pdf 本文主
    发表于 03-29 13:46

    2024款鸿蒙OS 最新HarmonyOS Next_HarmonyOS4.0系列教程分享

    预测报告。该机构预测,华为自主研发的鸿蒙系统(HarmonyOS)将在今年(2024)超越苹果iOS,成为中国市场继谷歌安卓之后的第二大操作系统。 此HarmonyOS
    发表于 02-28 10:29

    长安汽车发布2023-2024产品规划及销量目标

    长安汽车宣布,2023 年其总销售量预计超过 255 万辆,其中自主品牌新能源汽车销售量预计突破 47 万辆,自主品牌海外销预计达 23 万辆。更进一步地说,2024 年,长安
    的头像 发表于 02-03 10:51 301次阅读

    混合动力汽车研究:电动化计划推迟 PHEV&amp;增程式占比将抬升至40%

    佐思汽研发布2023-2024年全球和中国混合动力汽车研究报告》。
    的头像 发表于 01-25 13:54 1420次阅读
    混合动力<b class='flag-5'>汽车</b>研究:电动化计划推迟 PHEV&amp;增程式占比将抬升至40%

    OpenHarmony社区运营报告202312月)

    论坛”)——第 6 期(武汉站)于华中科技大学梧桐语问学中心明德报告厅圆满举办。本次技术论坛从“终端操作系统十大技术挑战”出发,将主题聚焦在“大模型时代的系统软件”,从学术界和工业界交
    发表于 01-10 15:44

    达实智能荣获“2023-2024中国数字城市建设推荐品牌”荣誉

    2024年1月8日,2024智慧物联与安防生态大会暨第二十九届全国安防界迎春团拜会在深圳举办。达实智能董事长刘磅受邀出席大会,被授予“2023中国安防行业终身成就奖”;达实智能子公司达实物联网获得“
    的头像 发表于 01-09 11:43 466次阅读

    [AI原生应用]2024到来?

    AI模型
    电子发烧友网官方
    发布于 :2024年01月02日 16:43:46

    2023奖杯收到

    今天非常高兴收到了论坛发送的2023“年度优秀版主”奖杯,今年不知不觉间就将结束,期待即将到来的2024。加油论坛,加油各位坛友!
    发表于 12-09 22:26

    OpenHarmony社区运营报告20238月)

    代表15个OpenHarmony技术俱乐部代表和8个TSG代表出席此次会议总参会人数60+。 四、技术发展 20238月3日OpenHarmony 4.0 Beta2版本
    发表于 09-12 18:35

    OpenHarmony社区运营报告20237月)

    Fork,55个SIG。 2、合作社区官方账号发布内容数据汇总 截至20237月27日,9个合作社区共发布内容(含技术文章、视频教程)2
    发表于 08-11 16:30

    《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》发布

    《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》发布 日前,中共深圳市委办公厅、深圳市人民政府办公厅印发《深圳市加快推动人工智能高质量发展高水平应用行动方案
    的头像 发表于 05-31 18:54 1520次阅读

    OpenHarmony社区运营报告20234月)

    本月快讯 • 20234月9日,OpenAtom OpenHarmony(以下简称“OpenHarmony”)3.2 Release新版本发布。相比一前的OpenHarmony 3
    发表于 05-22 10:30