0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ADS2.0算法演进与对算力的新需求

佐思汽车研究 来源:佐思汽车研究 作者:Dr. Luo 2022-06-14 11:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

爱因斯坦有曰,“瀚宇初开,万物当生也。万物可谓振动,能光旋律之荡漾焉。”(注:作者中译)。AI新技术革命时代,大算力芯片也拨响了自动驾驶ADS的琴弦。大珠小珠般的AI算法在大算力驱动下应运而振,应时而动,解决了ADS从L2到L5逐级演进中的众多技术难题。ADS每增加一级,算力需求也会呈现十倍速上升,L4级别可预计的算力需求在1000TOPS,L5级别估计在2000-10000TOPS。如图1所示,后摩尔时代工艺更新性能提升放缓,延续性创新的边际效益递减,新兴的大算力架构在不断涌现,加上驾驶AI算法高速迭代演进,在未来5-10年内可能会为后来的技术追赶者提供非常奇妙的一个直线超车的机会窗口。

8f14599e-eb8f-11ec-ba43-dac502259ad0.png

图1. 大算力时代自动驾驶ADS领域的机遇与挑战

当前ADS自动驾驶采用决策层后融合的方式,其局限性主要表现在在极端恶劣气候与复杂遮挡等不确定性场景下分别进行单模结构化信息提取后再进行融合决策,每个通道信息会有不同层面丢失,很难能够进行多模有效互补与特征提取共享,算力内卷且性能远低于预期。 未来ADS算法会进入一个全新的2.0阶段,4D空间下基于时空的多模感知与融合推理, 也就是特征提取/统计推断/应急预测相结合,实现在动态复杂的有噪声干扰等场景下,全程安全无碰撞的高效行驶。挑战可以体现在,动态随机的人车物交互,多变天气路况,以及突发交通事件等。

ADS算法2.0从决策层后融合走向特征级前融合,当前行业ADS2.0算法主要演进方向为:

多模感知:主要是针对Camera/LiDAR/Radar海量数据流进行特征提取,DL网络主流趋势是卷积CNN或者贝叶斯NN+Transformer的组合架构,在统一的特征空间实现多模感知,特征融合共享以及多任务来提升算力的整体效率。

融合推理:主要是基于模型与基于数据的双学习模式,DL网络主流趋势是基于目标交互GNN或基于统计模型的贝叶斯RL强化学习或On-Policy应急学习,实现ADS安全可信的预测规划与控制。

ADS2.0算法演进与对算力的新需求,可以总结为:

演进趋势1:感知定位预测决策控制模块化处理流程中, 从决策层后融合走向感知层前融合,算法能够在统一空间支持多模融合,多任务共享;

演进趋势2:预测与规划联合建模,从可获得的Off-policy数据进行学习,能够自学习处理不确定性下的安全性问题,解决可解释问题,持续学习解决新场景问题;

算力新需求:从compute-bound(矩阵-矩阵乘)走向memory-bound(矩阵-矢量乘),从偏计算走向偏存取。

当前市场上主流算力NPU芯片,都存在几个共性问题,一是算法效率低,多数只针对CNN(例如3x3卷积)优化;二是内存墙问题:处理单元PE存算分离,数据共享难;三是能耗墙问题:数据重复搬移,耗能增加>30-70%。所以,当前针对某些特定算法的芯片,无法解决未来ADS 2.0的需求。

从工程实践上看,ADS 2.0算法需通过“硬件预埋,算法迭代,算力均衡”,提供一个向前兼容的解决方案,以通用大算力(CPU的5-10倍性能提升,NPU的100-500倍性能提升)来解决未来不确定性的算法演进:

底层架构的演进:从存算分离过渡到近内存计算,最终走向内存计算;

数据通道与模型:高速数据接口;数据压缩+模型压缩+低精度逼近计算+稀疏计算加速;

并行的顶层架构:模型-硬件联合设计,以及硬设计可配置+硬件调度+软运行可编程调度引擎。

未来,自动驾驶算法不会止步于ADS 2.0,而能够真正支持人类自动驾驶梦想的算法ADS 3.0趋势,我们估计会采用一个DNN网络来进行端到端学习。设想一下,有足够的专家驾驶数据用来做模仿学习或采用RL自学习模式,可以有效降低数据标注的信息瓶颈与严重依赖,从而能够从多模多样化数据层面进行非直接的推理或者博弈类的对抗学习。ADS 3.0目前来看模型的可信与可解释程度依然远低于预期。ADS系统的总体演进趋势,可以总结为:

场景演进:负载多样性

➤从数量有限的摄像头设置走向 Camera + LiDAR + Radar 多模态组合。

趋势演进:算法多样性

➤从CNN+Rule-based方案走向CNN, RNN,Transformer, GNN, Bayesian, Deep ReinforcementLearning, Dynamic DNN, NAS Generated DNN, Variably Quantized DNN多算法组合。

大算力时代,ADS系统首先是模仿人类的驾驶行为,通过注意力机制,期望在感知定位预测规划控制领域提供远超人类的决策能力。这需要我们在AI的三要素(算法、算力、数据)基础上添加第四要素,知识或者常识。

8f88890e-eb8f-11ec-ba43-dac502259ad0.png

而上述要素,均需要在充分理解算法的快速迭代的大趋势下,拥有充足的超大通用算力,ADS系统在离线模仿学习人类驾驶先验知识经验与规则的基础上,能够提供在线自主学习能力,通过自学习激励与博弈共赢策略应对众多不确定性的人机交互的复杂环境,能够对决策不充分的场景下做到安全应对和提供可信解释能力。此外,大算力芯片也需要能够通过额外的算力,对芯片内百万级的并行计算单元提供故障检测与安全规避能力,对大量多模传感器的部分或者完全失效进行有效检测与应对决策处理,对驾驶环境针对传感器的主动攻击与外界目标非主动干扰进行有效检测与实时决策处理。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97167
  • ADS1220
    +关注

    关注

    24

    文章

    488

    浏览量

    126298
  • 自动驾驶
    +关注

    关注

    791

    文章

    14677

    浏览量

    176715

原文标题:自动驾驶行业快速迭代演变的算法和算力浅论

文章出处:【微信号:zuosiqiche,微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    湘军,让变成生产

    脑极体
    发布于 :2025年11月25日 22:56:58

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    反而压到了310W。更有意思的是它的异构架构:NPU+CPU+DVPP的组合,居然能同时扛住训练和推理场景,之前做自动驾驶算法时,用它跑模型时延直接降了20%。 但疑惑也有:这种密度下,散热怎么解决?而且昇腾的生态适配速度能
    发表于 10-27 13:12

    与电力的终极博弈,填上了AIDC的“电力黑洞”

    ),专注于提供人工智能训练与推理所需的服务、数据服务和算法服务。AIDC采用异构计算架构,结合GPU、FPGA、ASIC等多种AI加速芯片,形成高并发分布式系统,以满足大模型训练和推理的极高
    的头像 发表于 09-22 02:43 7405次阅读

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的AI
    的头像 发表于 09-19 15:26 1170次阅读
    什么是AI<b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    什么是AI模组?

    未来,腾视科技将继续深耕AI模组领域,全力推动AI边缘计算行业的深度发展。随着AI技术的不断演进和物联网应用的持续拓展,腾视科技的AI
    的头像 发表于 09-19 15:25 441次阅读
    什么是AI<b class='flag-5'>算</b><b class='flag-5'>力</b>模组?

    一文看懂AI集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI集群。AI的三要素,是算法和数据。而AI
    的头像 发表于 07-23 12:18 1003次阅读
    一文看懂AI<b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    下一代云端生产的核心特征与技术演进

    43EFLOPS(FP16),量子1138Qubit。这种多模态的协同调度,为AI推理、大模型训练等复杂场景提供支撑。 网智脑
    的头像 发表于 04-22 07:42 439次阅读
    下一代云端生产<b class='flag-5'>力</b>的核心特征与技术<b class='flag-5'>演进</b>

    芯片的生态突围与革命

    电子发烧友网报道(文 / 李弯弯)大芯片,即具备强大计算能力的集成电路芯片,主要应用于高性能计算(HPC)、人工智能(AI)、数据中心、自动驾驶等需要海量数据并行计算的场景。随着 AI 与大数
    的头像 发表于 04-13 00:02 2619次阅读

    智能最具潜力的行业领域

    ‌; 数据治理与联合创新‌:民生银行与华为、阿里云等共建AI实验室,通过“数据湖+模型体系”提升服务精准度‌; 需求驱动‌:金融大模型推理对GPU
    的头像 发表于 04-11 08:20 1043次阅读
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潜力的行业领域

    DeepSeek推动AI需求:800G光模块的关键作用

    随着人工智能技术的飞速发展,AI需求正以前所未有的速度增长。DeepSeek等大模型的训练与推理任务对
    发表于 03-25 12:00

    接棒,慧荣科技以主控技术突破AI存储极限

    电子发烧友网报道(文/黄山明)在AI的高速增长下,尤其是以DeepSeek为代表的AI大模型推动存储需求激增,增长倒逼存升级。而存储是AI生态的基础,存
    的头像 发表于 03-19 01:29 2353次阅读
    存<b class='flag-5'>力</b>接棒<b class='flag-5'>算</b><b class='flag-5'>力</b>,慧荣科技以主控技术突破AI存储极限

    中心的如何衡量?

    作为当下科技发展的重要基础设施,其的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算衡量的详细阐述:一、
    的头像 发表于 01-16 14:03 4270次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?

    科技云报到:要更要“利”,“精装”触发大模型产业新变局?
    的头像 发表于 01-16 10:24 811次阅读

    迅为瑞芯微RK3562开发板主频2.0内置NPU达1TOPS,核心板扩展更多功能

    A53+Mali G52架构,主频2GHZ,内置1TOPSNPU,RK809动态调频。支持OpenGLES1.1/2.0/3.2、0penCL2.0、Vulkan 1.1内嵌高性能
    发表于 12-24 15:07