0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智能驾驶芯片TOP20排名

佐思汽车研究 来源:佐思汽车研究 2023-12-28 10:29 次阅读

智能驾驶芯片排名并不简单只看AI算力,CPU、存储带宽、功耗和AI算力数值一样重要,这个下文会详细分析。CPU算力也很重要,智能驾驶系统软件异常复杂,会消耗大量的CPU运算资源,软件系统包含众多中间件诸如SOME/IP、自适应AUTOSAR、DDS、ROS等,基础软件包括订制的Linux BSP、OS抽象层、虚拟机,还有与底层硬件关联的内存管理、各种驱动、各种通讯协议等等。除此之外,应用层中的路径规划、高精度地图、行为决策等也大量消耗CPU资源,同时CPU也管理AI运算时的任务调度、存储搬运指令等,整体的任务调度、决策自然也是CPU的任务。CPU是绝对的核心,AI是CPU的附属功能,只是在做图像特征提取、分类、BEV变换、矢量地图映射或空间分布占有时才用到AI。

排名的权重依次是AI算力、存储带宽、CPU算力、GPU算力、制造工艺。存储带宽和AI算力同等权重,GPU也是锦上添花,大部分车载AI处理部分只能对应INT8位数据,而GPU可以对应FP32数据,有些时候可能有很大作用。实际AI算力数字完全是个黑箱,操作空间极大,参考意义不大。最能准确衡量算力的是MAC阵列数量,谷歌的TPU V1是65000个FP16 MAC,运行频率0.7GHz,那么算力就是65000*0.7G*2=91TOPS。特斯拉第一代FSD两个NPU,每个NPU是9216个INT8 MAC,运行频率是2GHz,算力就是2*2*2G*9216=73.7TOPS。制造工艺方面,自然还是越先进,功耗越低。

智能驾驶芯片TOP20

ba61d316-a465-11ee-8b88-92fbcf53809c.jpg

图片来源:公开资料整理

如何计算存储带宽,芯片本身都有存储管理器,这通常是CPU的一部分,决定存储带宽的有两点,首先是CPU支持的存储类型,即存储的物理层和控制器,其次是CPU的存储带宽,LPDDR的存储带宽最高一般是256比特,GDDR可以到384比特,HBM可以到4096甚至8192比特,这些都关联成本,厂家在设计芯片时,会在成本和性能之间找一个平衡点,有些厂家偏重成本,那就64比特甚至32比特,有些偏重性能,如真正的AI芯片,无一例外都是HBM的,成本都在1500美元以上。

常见汽车内存性能与价格对比

ba656a26-a465-11ee-8b88-92fbcf53809c.png

图片来源:公开资料整理

上表为常见汽车内存性能与价格对比,显然,一分价钱一分货。英伟达H100是HBM3的最大采购者,每GB的采购价格大约14美元。还有一点需要指出,目前没有车规级GDDR6存储芯片。

目前智能驾驶芯片除了百度和特斯拉,都采用了LPDDR。

历代LPDDR的参数

ba74953c-a465-11ee-8b88-92fbcf53809c.jpg

图片来源:公开资料整理

存储带宽等于CPU的存储位宽乘以存储器的Datatransfer rate, DDR (MT/s)再除以8换算为大写的GB,例如英伟达Orin其存储位宽是256比特,支持LPDDR5,传输速率为6400MT/s,那么存储带宽为256*6400M/8=204.8GB/s,再比如特斯拉一代FSD,存储位宽是128比特,支持LPDDR4,传输速率为3200MT/s,存储带宽就是128*3200M/8=51.2GB/s。

存储带宽如此重要的原因是Roof-line模型,Roof-lineModel 解决的,是“计算量为A且访存量为B的模型在算力为C且带宽为D的计算平台所能达到的理论性能上限E是多少”这个问题。

模型计算量指的是输入单个样本(对于CNN而言就是一张图像),模型进行一次完整的前向传播所发生的浮点运算个数,也即模型的时间复杂度,单位是FLOPS。访存量:指的是输入单个样本,模型完成一次前向传播过程中所发生的内存交换总量,也即模型的空间复杂度。在理想情况下(即不考虑片上缓存),模型的访存量就是模型各层权重参数的内存占用(Kernel Mem)与每层所输出的特征图的内存占用(Output Mem)之和。计算量除以访存量就可以得到模型的计算强度I (Intensity),它表示此模型在计算过程中,每Byte内存交换到底用于进行多少次浮点运算。单位是FLOP/Byte。模型在计算平台上所能达到的每秒浮点运算次数(理论值)。单位是 FLOP/s,即P。

ba8d2a5c-a465-11ee-8b88-92fbcf53809c.png

算力决定“屋顶”的高度(绿色线段),带宽决定“房檐”的斜率(红色线段)

模型计算的理论性能自然不可能超过其硬件的最大理论性能,如果有一个异常消耗算力的模型,其需要的算力超过了计算平台的理论性能,那么计算平台的利用率是100%,也就是红色线段部分,这时的风险就是处理图像的帧率或者说FPS会达不到目标帧率,对智能驾驶来说,主流帧率是30FPS,低速智能驾驶可以再降低一点,高速需要再升高一点。由于需要的算力太高,计算平台满负荷运转也无法适应,帧率会下降,此时高速行驶的话就会有风险,一般来说,厂家不会推荐算力需求远超理论性能上限的模型。

在低于100%利用率的绿色线段部分,模型理论性能 P 的大小完全由计算平台的带宽上限(房檐的斜率)以及模型自身的计算强度 I (Intensity)所决定,因此这时候就称模型处于 Memory-Bound 状态。可见,在模型处于带宽瓶颈区间的前提下,计算平台的带宽即房檐越陡,或者说模型的计算强度 I 越大,模型的理论性能 P 可呈线性增长。斜率越低,意味着即使计算强度快速增加,计算平台算力的增加还是很缓慢,计算平台的利用率很低,比如计算平台的理论算力是100TOPS,斜率很低,很高计算强度的模型利用率也可能不到50%,换句话说,存储带宽决定了计算平台的性能利用率,因此存储带宽重要性丝毫不亚于算力,甚至高于算力。这也是为何特斯拉二代FSD排名第二的主要原因,GDDR6的带宽相对LPDDR有压倒性优势。

特斯拉第二代FSD

ba991074-a465-11ee-8b88-92fbcf53809c.png

图片来源:网络

特斯拉第二代FSD采用了三星的7纳米工艺,之所以用三星代工,主要可能还是价格和地理因素,三星代工的价格远低于台积电,只有台积电价格的一半左右,台积电的亚利桑那厂效率低下,从2020年开工建设,预计到2025年才能投产,而三星的德克萨斯奥斯汀二代工厂仅用两年就完工投产,而特斯拉总部离奥斯汀也很近。第一代FSD使用三星的14纳米工艺,WikiChip的数据显示,三星7nm LPP HD高密度cell方案的晶体管密度在95.08 MTr/mm²,而HP高性能方案的晶体管密度则在77.01 MTr/mm²;三星14纳米UHP方案的晶体管密度则在26.22MTr/mm²,HP方案晶体管密度则在32.94 MTr/mm²,基本上三星7纳米是14纳米密度的3倍以上,意味着特斯拉至少可以塞进3倍多的MAC阵列,AI性能可以提升三倍,一代FSD的AI性能是73.7TOPS@INT8,3倍就是221.1,再像英伟达那样搞个稀疏模型加速,算力数字可以再增长一倍,加上二代FSD芯片面积明显比一代要大,且NPU增加到3个,因此估计算力在500TOPS上下。特斯拉二代FSD也大幅度加强了CPU,使用三星Exynos 20核心配置,这也说明CPU在智能驾驶中很重要。

安霸的CV3熟悉的人可能不多,其存储带宽支持最高的LPDDR5X,且是最高的256比特,采用三星的5纳米工艺制造,目前得到了德国大陆汽车公司的支持。

安霸CV3-AD内部框架图

ba9dae7c-a465-11ee-8b88-92fbcf53809c.png

图片来源:Ambarella

安霸CV3-AD最高包括了16核心的Coretex-A78AE,CPU算力也是极高。也通过了ASIL-B级认证。AI算力方面是等效于500TOPS。英伟达的位宽是256比特,特斯拉和Mobileye大多是128比特,征程6未公布存储信息

百度的昆仑芯2很少人知晓,实际这不能算百度的,它是百度芯片部分独立后的产物,公司全称是昆仑芯(北京)科技有限公司,前身为百度智能芯片及架构部,于2021年4月完成独立融资,首轮估值约130亿元。2022年11月29日,在百度Apollo Day技术开放日上,第二代昆仑芯在百度无人驾驶车辆RoboTaxi的驾驶系统上已经做了完整的适配,在高阶自动驾驶系统中运行正常。2011年,昆仑芯科技正式独立,开始从事AI计算相关的工作,早期使用FPGA芯片来对AI进行计算加速。2011-2015年之间,昆仑芯科技部署了超过5000片FPGA芯片用在百度数据中心,到了2017年累计部署超过12000片的FPGA芯片。并在2018年决定自研AI芯片,正式启动昆仑芯系列产品的研发和设计。2020年,第一代昆仑芯开始大规模地部署,2022年,第二代昆仑芯在数据中心、工业领域、自动驾驶等领域大规模地部署和落地。第一代昆仑芯是14纳米的人工智能芯片, 这款芯片采用了先进的HBM内存、2.5D的封装,芯片刚量产就在百度数据中心里面部署了超过2万片。一年后第二代昆仑芯量产,采用了更先进的7纳米工艺、XPU第二代的架构,也是业界第一颗采用GDDR6高速显存技术的AI芯片。昆仑芯科技正在研发更先进的第三代AI芯片,针对高阶自动驾驶系统,未来会考虑推出定制的车规高性能的SoC(系统级芯片)。

英伟达对存储系统一向比较重视,全线都是最高的256比特。高通SA8650与座舱领域的SA8255非常近似,CPU和GPU基本完全相同,AI算力做了特别加强,存储位宽是比较少见的96比特,SA8650是取代上一代SA8540P的,主要是增加了针对功能安全的部分,增加了4个Cortex-R52内核。Mobileye对成本异常重视,也从不公布其存储带宽和支持存储类型,只能猜测。Xavier虽是早期产品,但存储位宽是最高的256比特,所以排名很靠前。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    112

    文章

    15223

    浏览量

    171192
  • 智能驾驶
    +关注

    关注

    3

    文章

    2081

    浏览量

    48213
  • HBM
    HBM
    +关注

    关注

    0

    文章

    231

    浏览量

    14383
  • GPU芯片
    +关注

    关注

    1

    文章

    289

    浏览量

    5689
  • LPDDR
    +关注

    关注

    0

    文章

    35

    浏览量

    6256

原文标题:智能驾驶芯片TOP20排名

文章出处:【微信号:zuosiqiche,微信公众号:佐思汽车研究】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Fabless100榜单发布,国科微荣登处理器芯片公司TOP5

    的技术服务以及巨大的发展潜力荣登2024 Fabless100榜单综合实力与增长潜力排名TOP20席位,同时上榜处理器芯片公司TOP5。 中国IC设计Fabless100榜单由AspenCore分析师团队根据
    的头像 发表于 04-03 11:49 289次阅读
    Fabless100榜单发布,国科微荣登处理器<b class='flag-5'>芯片</b>公司<b class='flag-5'>TOP</b>5

    带PFC电路的20 W单级反激式电源TOP247YN20W数据手册

    电子发烧友网站提供《带PFC电路的20 W单级反激式电源TOP247YN20W数据手册.pdf》资料免费下载
    发表于 03-22 09:30 0次下载

    NGI为全球TOP20汽车零部件供应商提供高精度BMS测试方案

    电压采集精度也越来越高,据了解,目前市面高精度汽车BMS精度部分已优于3mV,甚至1mV。 ❐客户背景 本次合作客户Y为全球TOP20的汽车零部件供应商,全球销售量超1000亿元,员工超50000人,专注于汽车内外饰、汽车座椅、座舱电子及被动安全领
    发表于 02-28 10:17 114次阅读
    NGI为全球<b class='flag-5'>TOP20</b>汽车零部件供应商提供高精度BMS测试方案

    华羿微电入围2024西安龙门榜TOP20

    “西安龙门榜TOP20”覆盖了西安电子信息、汽车、航空航天、高端装备、新材料能源和生物医药等产业领域,表现出强劲的硬科技实力。华羿微电成功入围该榜单展现了公司良好的发展潜力,体现了公司在行业市场以外的金融资本市场受到的认可。
    的头像 发表于 01-24 16:14 183次阅读

    荣登机器之心、胡润、36氪多个权威榜单,阿丘科技综合实力备受认可!

    近日,阿丘科技再获4项大奖,凭借技术研发硬实力与强劲的发展潜力,获得多家专业媒体与权威机构的肯定。机器之心人工智能领军企业TOP20由人工智能领域知名媒体机器之心评选的“「AI中国」机器之心2023
    的头像 发表于 01-19 08:24 362次阅读
    荣登机器之心、胡润、36氪多个权威榜单,阿丘科技综合实力备受认可!

    服务机器人企业YOGO ROBOT荣登《2023中国智能制造创新技术应用TOP20

    日前,YOGOROBOT凭借创新精神及产品商业化落地能力,荣登《2023中国智能制造创新技术应用TOP20》。这是YOGOROBOT深扎服务机器人沃土,以创新驱动产品与服务升级,矢志不渝为客户创造
    的头像 发表于 01-17 11:54 516次阅读
    服务机器人企业YOGO ROBOT荣登《2023中国<b class='flag-5'>智能</b>制造创新技术应用<b class='flag-5'>TOP20</b>》

    龙腾半导体再登“龙门榜TOP20”榜单

    2024创投大会于1月9日至1月11日在西安隆重举办,大会以“向实、向新、向强”为主题,聚焦金融支持科技创新,推动科技、产业、金融良性循环,大会通过全方位展示西安创投发展进程、项目签约成果、创投政策发布、基金主题推介等一系列丰富环节,引领创投之都迈向高质量发展阶段。
    的头像 发表于 01-11 15:54 349次阅读

    再传捷报!百望云荣登投资家网“2023年度企业服务领域创新企业TOP20

    近日,投资家网旗下投资家研究院重磅发布“投资家网·2023中国价值企业榜”。经过层层严格评选,百望云荣登“2023年度企业服务领域创新企业TOP20”,再次说明了业界权威机构认可百望云的创新能力
    的头像 发表于 12-29 19:58 109次阅读
    再传捷报!百望云荣登投资家网“2023年度企业服务领域创新企业<b class='flag-5'>TOP20</b>”

    亿铸科技登榜2023硬科技新锐之星TOP20

    12月22日,中国新经济科技产业媒体朋湖网发布了“2023年度科技产业系列榜单”,亿铸科技登榜2023硬科技新锐之星TOP20
    的头像 发表于 12-25 15:14 346次阅读
    亿铸科技登榜2023硬科技新锐之星<b class='flag-5'>TOP20</b>

    芯进电子入榜“2023未来之星·川商最具价值投资企业TOP20

    10月12日,2023(第四届)未来大会在成都举行,大会上重磅发布了备受关注的“2023未来之星·川商最具价值投资企业TOP20”榜单。芯进电子从332家参选企业中,脱颖而出,上榜“川商最具价值投资
    的头像 发表于 10-14 08:30 347次阅读
    芯进电子入榜“2023未来之星·川商最具价值投资企业<b class='flag-5'>TOP20</b>”

    四维图新旗下杰发科技荣获 2023年度智能座舱通讯与计算芯片方案TOP10供应商

    杰发科技凭借其高性价比的座舱方案、丰富的量产车型、座舱芯片出货量超百万颗的市场佳绩,荣获“2023年度智能座舱通讯与计算芯片方案TOP10供应商”。 高工
    的头像 发表于 09-05 18:15 368次阅读
    四维图新旗下杰发科技荣获 2023年度<b class='flag-5'>智能</b>座舱通讯与计算<b class='flag-5'>芯片</b>方案<b class='flag-5'>TOP</b>10供应商

    华大北斗高精度芯片助力上汽爵MG7智能驾驶

    驶,让高阶智能驾驶不再只是电动车的专属,带来目前燃油轿车中最领先的智能辅助驾驶体验。华大北斗“芯片级”高性能、高精度导航定位解决方案成功应用
    发表于 08-30 14:44

    全球PLC制造商Top20有哪些?

    作为工业自动化的一种典型应用,始于汽车制造,PLC最初是做为取代继电器线路、进行顺序控制为主而产生的,后来PLC厂家逐步增加了模拟量运算、PID功能以及更可靠的工业抗干扰技术等功能,并随着网络化的需求增加了各种通信接口。
    的头像 发表于 08-03 16:08 3196次阅读
    全球PLC制造商<b class='flag-5'>Top20</b>有哪些?

    全球PLC制造商Top20

    作为工业自动化的一种典型应用,始于汽车制造,PLC最初是做为取代继电器线路、进行顺序控制为主而产生的,后来PLC厂家逐步增加了模拟量运算、PID功能以及更可靠的工业抗干扰技术等功能,并随着网络化的需求增加了各种通信接口。
    的头像 发表于 08-01 17:19 2711次阅读
    全球PLC制造商<b class='flag-5'>Top20</b>

    全球TOP20科学仪器厂商,没有一家是中国企业!如何破局?

    落后20年 中国科学仪器,一向是触目惊心地落后。在全球Top20的仪器厂家之中,呈现了85331的阵型。其中8家是美国,5家是日本,德国和瑞士各3家,还有一家英国企业,没有一家中国企业入列。而在
    的头像 发表于 05-16 08:41 744次阅读