0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小鹏汽车新一代感知架构XNet信息解读

jf_C6sANWk1 来源:阿宝1990 2023-07-04 09:41 次阅读

在刚刚过去的CVPR会议上,作为国内唯一一家被邀请登台演讲的造车新势力,小鹏汽车向参会者介绍了小鹏汽车在国内量产辅助驾驶系统的经验。

作为小鹏汽车最新一代的感知架构,XNet在量产中发挥的作用不容小觑。

笔者有幸采访到小鹏汽车自动驾驶中心感知首席工程师 Patrick,更进一步得了解XNet的性能、架构,以及小鹏的自驾团队为搭建XNet所做的努力。

1.XNet实现的性能提升

XNet实现了感知结构的升级,拥有更好的性能,主要包括3个方面。

1.1超强环境感知能力,实时生成“高精地图”

d5e913a4-1a06-11ee-962d-dac502259ad0.png

XNet可以根据周围环境实时构建“高精地图”。从上图我们可以看到,车辆正在经过一个环岛,图中显示的车道线不是来自于高精地图,而是来自于XNet的感知输出。XNet不光可以输出车道线,还有停止线、人行道、可行驶区域等。这是将来小鹏汽车应对无图场景,做高级别城市辅助驾驶的最核心的能力之一。

1.2更强的360度感知,博弈更强、变道成功率更高

在上一代感知架构中,盲区问题很难解决。在最靠近本车的地方,尤其是车辆的下边界,感知系统的检测效果往往不好。XNet采用多相机多帧、前融合的感知方案,可以根据图像内的车身信息推测车辆在BEV视角下的3D位置信息,解决了相机上下视野受限的问题;还可以更加有效地同时融合多相机的信息,尤其是分节到两个相机视野中的物体,从而避免盲人摸象式的物体感知。

另外,输入包含时序信息的视频流后,XNet对近车物体的识别能力有大幅提升,可以更加稳定地检测到近车物体。那么,自动驾驶系统的博弈能力就更强,汽车变道的成功率更高。

1.3更精准识别动态物体速度和意图,博弈能力大幅提升;运动感知冗余,在城市场景安全性更高

XNet不仅能够检测物体的位置,还能够检测物体的速度甚至是完成对物体未来运动轨迹的预测。毫米波雷达通常很难检测在本车前横跨车道的车辆的速度,而XNet可以很容易地检测到这个速度,对毫米波雷达有明显的增强作用。在毫米波雷达比较擅长的场景,XNet也可以提供冗余,从而提高城市场景整体的安全度。

2.XNet的架构

XNet为什么可以实现更好的性能呢?Patrick介绍了XNet的具体架构和工作流程。

XNet采用多相机多帧的方式,把来自每一个相机的视频流,直接注入到一个大模型的深度学习网络里,进行多帧时序前融合,输出BEV视角下的动态目标物的4D信息(如车辆,二轮车等的大小、距离、位置及速度、行为预测等),以及静态目标物的3D信息(如车道线和马路边缘的位置)。

如下图所示。

d65525d0-1a06-11ee-962d-dac502259ad0.png

每张输入的摄像头图像经过网络骨干(backbone)和网络颈部(neck,具体来讲是BiFPN网络)后生成图像空间的多尺度特征图。

这些特征图经过XNet最关键的部分—BEV视图转换器(BEV view transformer)后,形成BEV下的单帧特征图。

不同时刻的单帧特征图在BEV视角下,根据自车的位姿进行时空融合,形成BEV下的时空特征图。

这些时空特征图是进行BEV解码推理的基础,在时空特征图后接两个解码器,完成动态XNet和静态XNet的结果解码和输出。动态结果包括pose、size、velocity等,静态结果包括boundary、mark line等。

至此,感知部分基本就完成了。

3.团队为搭建XNet所做的努力

要实现上述架构并不容易,在采集、标注、训练、部署四个方面,小鹏的自驾团队都做了大量的工作来优化整个流程。

3.1采集

实车数据和仿真数据是数据的两大来源。

小鹏有接近十万辆用户车,这些车都可以用来完成数据采集的任务。如下图所示,车端模型会报告自动驾驶系统目前处理得不够好的问题,针对这些问题,小鹏的自驾团队会在车端设置相应的触发器来定向采集相应的数据。然后,这些数据会被上传到云端,经过筛选和标注后用于模型训练和后续的OTA升级。

d6710c28-1a06-11ee-962d-dac502259ad0.png

此外,仿真数据也是数据的重要来源。吴新宙在1024科技日上举了一个例子—行车过程中,前面一辆大卡车因为轮胎脱落与地面摩擦起火,这种情形在实际生活中是极为罕见的。对于这样出现频率极低的情形,实车采集很困难,即使小鹏已经有了近十万辆量产车,收集到足够多的数据可能也需要数年时间。

对于这样的情形,仿真数据可以起到很好的辅助作用。如下图所示,小鹏的自驾团队可以根据实车数据,采用unreal5引擎产生成千上万个类似的case ,模拟各种各样车轮脱落的情形。

d6af8052-1a06-11ee-962d-dac502259ad0.png

当然,仿真数据不能滥用,需要尽可能地贴近现实。小鹏的自驾团队主要从光影真实和场景真实两方面来尽量保证仿真数据的真实性。

小鹏的自驾团队采用了技术上领先的unreal5作为渲染引擎,这样通过仿真生成的图片看起来比较真实,没有卡通感,保证了“光影真实”。

此外,生成仿真数据时,是先找到模型的弱势场景,然后对这些场景做数字孪生(digital twin),再在此基础上进行定向修改。具体来说,可以先用4D自动标注从真实场景里提取4D结构化信息—包括动态物体的4D轨迹、和静态场景的3D布局等,然后用渲染引擎对结构化信息进行渲染填充,形成仿真图片。这样,生成的场景就是在模拟真实世界可能发生的场景,保证了“场景真实”。

3.2标注

要训练XNet,需要50万到100万个短视频,其中的动态目标的数量可能是数亿级甚至十亿级的。按照当前人工标注的效率,需要1000人的团队花两年时间才能完成训练XNet所需数据的标注。

小鹏汽车打造了全自动标注系统,此系统的标注效率是人工的近45000倍,全自动标注系统仅需16.7天就可以完成标注工作。此外,全自动标注系统质量更高,信息更全(包含3D位置、尺寸、速度、轨迹等信息),产量更大(峰值日产 30000 clips,相当于 15个NuScene数据集 )。

全自动标注系统是如何做到高效的呢?

首先,从人工标注到自动标注,人的角色发生了很大的变化。人工标注场景下,人是标注员;在自动标注场景下,人是质检员,只是去判别和纠正自动标注系统做的不好的地方,人效会有数量级的提升。

其次,在自动标注场景下,占数据集大多数的训练数据是自动化质检的,只有评测数据集是人工质检,需要人工操作的数据量有数量级的减少。

最后,自动标注让产出瓶颈从人力资源转到了计算资源。在云端,计算资源可以很方便地拓展,可以灵活地按需部署大量资源进行生产。

3.3训练

小鹏与阿里云合作打造了中国最大的自动驾驶计算中心—“扶摇”,“扶摇”的算力可达600PFLOPS,相当于成千上万个Orin组成的训练平台。借助扶摇的强大算力,小鹏的自驾团队采用云端大规模多机训练的方式,把XNet的训练时间从276天缩短到了11个小时,实现了602倍的训练效率的提升。

如下图所示,假如采用单机全精度方式,训练整个XNet需要276天。小鹏的自驾团队通过优化训练scheme从而减少epoch、优化网络结构和算子、为Transformer定制混合精度训练的方式,将单机训练时间从276天缩短到了32天。然后,团队充分利用云端算力,将单机训练改为80机并行训练,训练时间从32天缩短到了11小时。

d6c87954-1a06-11ee-962d-dac502259ad0.png

此外,团队引入了Golden Backbone模型,将基础网络能力的提升和模型的发布解耦,实现了训练效率的提升。具体来说,如下图所示,Golden Backbone可以和数据挖掘、自动标注、自动驾驶超算平台等形成一个闭环。在这个环里,只要有持续的数据输入,Golden Backbone的能力就可以持续地得到优化。需要发布模型的时候,只需在Golden Backbone的基础上做一些优化,而无需从头开始训练。

d6e7b562-1a06-11ee-962d-dac502259ad0.png

3.4部署

在部署层面,小鹏的自驾团队有很多积累。经过团队优化后,Transformer的运算时间减少到了原来的5%。此外,原本需要122%的Orin-X算力才能运行的模型,现在只需9%的Orin-X算力就能运行。

在部署上,小鹏的自驾团队有哪些亮点呢?根据Patrick的介绍,主要是分三步走。

“首先是Transformers层的重写。经过对模型板端运行时间的分析,我们发现原版的Transformers层占用时长是大头。于是,我们尝试了很多种Transformers的变种构建方法,找到了一个模型效果好,在板端运行快的版本。”

“然后是网络骨干的剪枝。我们重写了Transformers以后发现,网络骨干(backbone)是我们的性能瓶颈。于是我们对网络骨干进行了剪枝,降低了骨干部分的运行时间。”

“最后是多硬件的协同调度。在我们的基于Orin-X的计算平台上,有三种计算单元—GPU、DLA还有CPU。这三种硬件对网络的不同算子的支持度各有不同。我们把网络的不同构件放到最适合它运行的地方,然后统一调度三种计算硬件,让三者协同完成网络推理。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驾驶系统
    +关注

    关注

    0

    文章

    16

    浏览量

    6571
  • 小鹏汽车
    +关注

    关注

    4

    文章

    443

    浏览量

    14553
  • 高精地图
    +关注

    关注

    0

    文章

    27

    浏览量

    2574

原文标题:小鹏汽车新一代感知架构XNet信息解读

文章出处:【微信号:阿宝1990,微信公众号:阿宝1990】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    小鹏汽车与大众汽车宣布签署E/E架构技术合作框架协议

    是其垂直集成的全栈软硬件技术的核心。它支持ADAS和Connectivity OS等软件与底层硬件和车辆平台解耦,实现跨平台软件的快速迭代。小鹏汽车新一代E/E架构采用基于中央计算和域控制器的
    的头像 发表于 04-23 14:49 136次阅读
    小鹏<b class='flag-5'>汽车</b>与大众<b class='flag-5'>汽车</b>宣布签署E/E<b class='flag-5'>架构</b>技术合作框架协议

    未来已来,多传感器融合感知是自动驾驶破局的关键

    数据“坐标统、时序对齐”,图像与雷达数据完成像素级实时“时空对齐同步”并以“多维像素”格式输出。 “多维像素”是昱感微的核心技术创新之,它是指在可见光摄像头像素信息上加上其它传感器对于同源目标
    发表于 04-11 10:26

    汽车的AeroHT展现了其eVTOL技术,将其X2飞行汽车带到了广州上空

    随着许多eVTOL开发人员正在为他们的首次飞行做准备,AeroHT继续展示为什么它是该领域的领导者之。今天早些时候,小汽车的空中部门在中国广州市上空进行了首次成功的全电动X2“飞行汽车
    发表于 03-18 08:44

    汽车ECU般采用芯片架构?使用什么系统?

    汽车ECU般采用芯片架构,使用什么系统?
    发表于 02-01 06:09

    工业信息采集平台 软件界面介绍

    关键字:蓝测控典型界面,蓝测控交互界面,蓝测控图形界面,蓝测控历史界面,蓝测控自定义界面 软件测控平台对UI程序界面,实现形式没有
    发表于 12-28 17:07

    国产六核CPU,三屏异显,赋能新一代商显

    处理器共同推出米尔MYC-YD9360核心板及开发板,赋能新一代车载智能、电力智能、工业控制、新能源、机器智能等行业发展,满足多屏的显示需求。
    发表于 12-22 18:07

    国芯科技:新一代汽车电子MCU产品“CCFC3007PT” 内部测试成功

    自主PowerPC架构C*Core CPU内核研发的新一代适用于汽车电子动力总成、底盘控制器、动力电池控制器以及高集成度域控制器等应用的多核MCU芯片,是基于客户更高算力、更高信息安全
    发表于 12-20 16:56

    TI 新一代明星CPU

    功耗,走红了全球。 今天给大家分享的是 TI 新一代明星CPU——AM62x,它相比上一代AM335x在工艺、外设、性能等多方面都有很大提升。 这里结合米尔电子的“MYC-YM62X核心板及开发板”给
    发表于 12-15 18:59

    跟随华秋 走进新一代产业园电子电路主题展

    ,电子信息制造业规模以上企业营业收入突破24万亿元。为贯彻落实《方案》精神,深圳新一代产业园积极组织了园区企业-华秋,开展了电子电路主题展,并邀请党内群众学习。本次主题展也得到了相关领导的认可和肯定
    发表于 10-27 11:15

    华秋带您走进新一代产业园电子电路主题展

    ,电子信息制造业规模以上企业营业收入突破24万亿元。为贯彻落实《方案》精神,深圳新一代产业园积极组织了园区企业-华秋,开展了电子电路主题展,并邀请党内群众学习。本次主题展也得到了相关领导的认可和肯定
    发表于 10-27 11:12

    S32G3实力出境!看了才知道,新一代汽车架构为什么要选它?

    新一代汽车架构而生的!具体来讲,S32G3搭载了多达4个双核锁步的Arm Cortex-M7和多达8个可锁步的Arm Cortex-A53内核,还配备了网络加速器、功能安全支持和先进的硬件安全引擎,可以支持支持新型汽车架构的各种
    的头像 发表于 10-20 10:15 449次阅读
    S32G3实力出境!看了才知道,<b class='flag-5'>新一代</b><b class='flag-5'>汽车架构</b>为什么要选它?

    长安汽车电气架构信息总览

    电气架构是是一台车智能化的基础,去年这个时候,整理了国内大部分电气架构的现状(回看戳:国内主机整车EEA架构汇总)。今天来看看国内长安汽车的。
    发表于 09-21 10:52 842次阅读
    长安<b class='flag-5'>汽车</b>电气<b class='flag-5'>架构</b><b class='flag-5'>信息</b>总览

    STM32U599平衡图显性能与功耗的新一代产品

    STM32U599平衡图显性能与功耗的新一代产品,内容包含: STM32U5x9 的高性能与高阶图形加速器 、STM32U5的矢量图形 、STM32U5x9 的低功耗设计 、LPBAM - sensor hub等。
    发表于 09-05 07:21

    汽车电子电气架构为什么要做中央集成?

    汽车电子电气架构是指汽车中的各类传感器、电子控制单元(ECU)、线束拓扑和电子电气分配系统的整合,它决定了汽车信息交互和复杂功能的实现。
    发表于 08-18 10:02 568次阅读
    <b class='flag-5'>汽车</b>电子电气<b class='flag-5'>架构</b>为什么要做中央集成?

    感知进入3.0时代,新一代传感器发展有力

    来源:亿欧智库 编辑:感知芯视界 随着智能汽车感知环境的复杂度不断提高,传统传感器已经无法满足更高级别自动驾驶功能与更好人机交互体验感。 从智驾层面来看,感知传感器的性能会影响后续
    的头像 发表于 08-09 22:38 258次阅读