0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HBM3发力自动驾驶市场,其性能未来可期

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-03-31 11:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)人工智能的蓬勃发展促使产业对AI基础设施提出了更高的性能要求,先进计算处理单元,尤其是ASICGPU,为了在机器学习、HPC提供稳定的算力表现,传统的内存系统已经不太能满足日益增加的带宽了。与此同时,在我们报道的不少AI芯片、HPC系统中,HBM或类似的高带宽内存越来越普遍,为数据密集型应用提供了支持。

提及HBM,不少人都会想到成本高、良率低等缺陷,然而这并没有影响业内对HBM的青睐,诸如AMD的Radeon Pro 5600M、英伟达的A100 等消费级/企业级GPU,或是思科的路由ASIC芯片Silicon One Q100、英特尔与AMD-Xilinx的FPGA,都用到了HBM内存。就在今年1月底,JEDEC终于正式发布了HBM的第四代HBM3的标准。

HBM3性能未来可期

HBM3发力自动驾驶市场,其性能未来可期

HBM2/2E与HBM3的架构对比 / SK海力士

HBM3带来的性能提升大家应该都比较清楚了,传输速率是HBM2的两倍,达到了6.4Gb/s,使得每个堆栈最高可达819GB/s的带宽。可用的独立通道也从HBM2的8个扩充至16个,加上每个通道两个伪通道的设计,HBM3可以说支持到32通道了,提供更优秀的时序来提升系统性能。

HBM3发力自动驾驶市场,其性能未来可期

HBM3 8Hi和12Hi的机械结构对比 / SK海力士

HBM3的TSV堆叠层数支持4-high、8-high和12-high,这倒是和HBM2e没有什么差别。从SK海力士提供的机械结构图来看,无论是8Hi还是12Hi,其封装大小和高度都是一样的,只不过是减小了中间堆叠的裸片高度。这仅仅是第一代HBM3,未来HBM3会扩展至16-high的TSV堆栈,单设备的内存密度范围也将达到4GB至64GB,不过第一代HBM3设备的话,目前用到的依然是16GB的内存层。

此外,在散热上,通过增加dummy bump、增加HBM3裸片大小并降低间隙高度,HBM3成功将温度降低了25%,实现了更好的散热性能。在7位ADC的支持下,HBM3的温度传感器也能以1℃的分辨率输出0到127℃的温度信息。

首个用上HBM3的平台

以在GTC22上亮相的H100 GPU为例,这是全球首个支持PCIe 5.0并利用HBM3的GPU,其内存容量达到了80GB。这个容量与上一代A100一致,但带宽却有了质的飞跃,与采用HBM2的A100相比,H100的内存带宽提升了两倍,达到了3TB/s。

HBM3发力自动驾驶市场,其性能未来可期

英伟达各个系列GPU加速卡的内存带宽 / 英伟达

你可能会感到疑惑,既然HBM3可以提供每个堆栈16GB以上的内存,从H100的芯片图上看来有6个HBM3,为何只有80GB呢?是不是英伟达为了成本有所阉割?

其实原因很简单,6个HBM3的其中一个为Dummy Die,所以真正可用的HBM3内存只有5x16也就是80GB,所以英伟达在H100的白皮书也明确提到了这80GB是由5 Stacks的HBM3内存组成。如此做的原因很可能是出于良率的考量,毕竟我们已经提到了HBM良率低的包袱,而且上一代80GB HBM2e的A100也是如此设计的。

HBM找到了新的市场

根据SK海力士给出的市场预期,HBM市场正在以40%的年复合增长率席卷HPC、AI和CPU等应用,如今这其中还多出来一个特殊的应用,那就是ADAS和自动驾驶。如今的自动驾驶芯片上几乎看不到HBM的存在,即便是英伟达的Jetson AGX Orin,用的也只是256位的LPDDR5内存,带宽最高只有204.8GB/s。

这种情况再正常不过了,谁叫如今的ADAS或自动驾驶方案还用不到HBM的大带宽。花钱去设计HBM,还不如在芯片的计算性能上多下功夫。然而到了L4或L5的自动驾驶中,又是另外一幅光景了。低延迟和准确的数据处理对于激光雷达、摄像头等传感器来说,可谓至关重要,这两大自动驾驶等级下的带宽至少也要1TB/s。

据研究机构的预测,到了2030年,L4以上的自动驾驶系统将占据20%的市场,到了2035年,这一比例将上升至45%。为了不在突破L3时遇到带宽的瓶颈,引入HBM可以说是越早越好,甚至从L3就可以开始考虑了,毕竟现在不少自动驾驶芯片已经标榜着L3乃至L4以上的能力。

比如L3级别的自动驾驶,带宽要求在600GB/s到1TB/s之间,单车可以使用两个HBM2e或者一个HBM3;而L4到L5级别的自动驾驶,带宽要求在1TB/s到1.5TB之间,单车可用3个HBM2e或两个HBM3。

结语

虽然HBM3标准已经发布,芯片设计公司(英伟达、AMD、英特尔)、IP公司(新思、CadenceRambus)、晶圆代工厂的封装技术(台积电Cowos-S、三星H-Cube、英特尔EMIB)以及存储厂商(三星、SK海力士)都开始了相关的部署,但HBM3的普及仍然需要时间。

预计2023年到2024年,我们可以见到第一代HBM3内存在HPC上的普及,2025年到2026年第二代才会开始放量,届时我们也能看到下一代HBM4的性能前瞻。至于HBM上自动驾驶芯片倒是不必急求,汽车产品的上市周期一向很长,从HBM3的推进速度来看,估计L4和L5才能充分利用HBM3乃至HBM4的全部优势。

原文标题:HBM3首发GPU,又要进军自动驾驶

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5102

    浏览量

    134487
  • 自动驾驶
    +关注

    关注

    791

    文章

    14681

    浏览量

    176748
  • HBM
    HBM
    +关注

    关注

    2

    文章

    426

    浏览量

    15706
  • HBM3
    +关注

    关注

    0

    文章

    74

    浏览量

    468

原文标题:HBM3首发GPU,又要进军自动驾驶

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶仿真测试有什么具体要求?

    [首发于智驾最前沿微信公众号]在自动驾驶技术快速迭代、功能边界不断扩展的今天,如何系统、严谨且高效地验证一个自动驾驶系统的性能,成为研发、测试与监管共同面对的核心难题。相较于传统汽车主要关注机械
    的头像 发表于 10-15 09:14 381次阅读
    <b class='flag-5'>自动驾驶</b>仿真测试有什么具体要求?

    自动驾驶公司小马智行进入新加坡市场

    9月20日,自动驾驶公司小马智行宣布正式进入新加坡市场,与新加坡最大交通运营服务商康福德高(ComfortDelGro Corporation)合作在当地部署自动驾驶车辆和相关服务,为居民日常出行提供便利。
    的头像 发表于 09-22 17:34 620次阅读

    赋能未来自动驾驶如何从科幻驶入现实?

    当一辆汽车以120km/h飞驰时,每0.1秒的决策延迟就意味着3.3米的“生死距离”。而现在,自动驾驶车辆能在毫秒间完成刹车、变道甚至紧急避障——这背后,是算在无声地重塑人类出行方式。感知系统
    的头像 发表于 09-16 11:40 508次阅读
    算<b class='flag-5'>力</b>赋能<b class='flag-5'>未来</b>:<b class='flag-5'>自动驾驶</b>如何从科幻驶入现实?

    自动驾驶系统的算越高就越好吗?

    [首发于智驾最前沿微信公众号]自动驾驶系统的“算”是指车载计算平台中用于执行感知、决策、规划和控制等算法的硬件性能指标。之前给大家分享了算的概念及作用,从概念上看,算
    的头像 发表于 08-11 18:30 671次阅读

    卡车、矿车的自动驾驶和乘用车的自动驾驶在技术要求上有何不同?

    [首发于智驾最前沿微信公众号]自动驾驶技术的发展,让组合辅助驾驶得到大量应用,但现在对于自动驾驶技术的宣传,普遍是在乘用车领域,而对于卡车、矿车的自动驾驶发展,却鲜有提及。其实在卡车、
    的头像 发表于 06-28 11:38 734次阅读
    卡车、矿车的<b class='flag-5'>自动驾驶</b>和乘用车的<b class='flag-5'>自动驾驶</b>在技术要求上有何不同?

    小马智行与广州公交集团达成战略合作,自动驾驶商业化

    5月28日,小马智行与广州市公共交通集团有限公司(下称“广州公交集团”)签署战略合作框架协议。根据协议内容,双方将利用各自优势,在自动驾驶汽车和出行平台业务、自动驾驶汽车后服务市场业务、自动驾
    的头像 发表于 05-28 17:10 953次阅读

    新能源车软件单元测试深度解析:自动驾驶系统视角

    ‌ AWS RoboMaker等云平台支持万级测试用例的并行执行。某自动驾驶初创企业利用云端GPU集群,将AI模型单元测试时间从3周缩短至6小时。 ‌标准体系演进‌ UL 4600标准要求单元测试需证明
    发表于 05-12 15:59

    自动驾驶经历了哪些技术拐点?

    ,到如今以AI为核心驱动的自动驾驶系统,各大车企都在不断加码研发投入,试图在未来市场中占据制高点。那自动驾驶发展至今,经历了哪些技术拐点呢? 自动驾
    的头像 发表于 04-27 15:54 636次阅读
    <b class='flag-5'>自动驾驶</b>经历了哪些技术拐点?

    伟创携手英伟达与Torc开启自动驾驶卡车新纪元

    近年来,自动驾驶技术的发展如火如荼。作为世界领先的汽车级计算平台提供商的伟创成为自动驾驶8级卡车商业化先驱——Torc的合作伙伴,并携手技术巨头英伟达(NVIDIA),合作开发了用于自动驾驶
    的头像 发表于 03-26 16:10 819次阅读

    理想汽车推出全新自动驾驶架构

    2025年3月18日,理想汽车自动驾驶技术研发负责人贾鹏在NVIDIA GTC 2025表主题演讲《VLA:迈向自动驾驶物理智能体的关键一步》,分享了理想汽车对于下一代
    的头像 发表于 03-19 14:12 917次阅读

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    的应用不断增加,尤其是在需要低延迟和实时数据处理的场景中,如自动驾驶、工业自动化和物联网设备。可编程性和灵活性使其能够适应多样化的边缘计算需求。• 数据中心与高性能计算:在数据中心中
    发表于 03-03 11:21

    自动驾驶未来 - 了解如何无缝、可靠地完成驾驶

    。 汽车行业正在向自动驾驶汽车靠拢,发展势头越来越强,目标不仅是让驾驶员的生活更简单,而且要消除道路上的碰撞。 自动驾驶汽车已经上路,因
    的头像 发表于 01-26 21:52 918次阅读
    <b class='flag-5'>自动驾驶</b>的<b class='flag-5'>未来</b> - 了解如何无缝、可靠地完成<b class='flag-5'>驾驶</b>

    从《自动驾驶地图数据规范》聊高精地图在自动驾驶中的重要性

    自动驾驶地图作为L3级及以上自动驾驶技术的核心基础设施,重要性随着智能驾驶技术的发展愈发显著。《自动驾
    的头像 发表于 01-05 19:24 2889次阅读
    从《<b class='flag-5'>自动驾驶</b>地图数据规范》聊高精地图在<b class='flag-5'>自动驾驶</b>中的重要性

    如何实现自动驾驶规控算法的仿真验证

    随着自动驾驶技术的不断进步,市场需求的持续增长,自动驾驶产业迎来广阔的发展前景。L3及以上级别的自动驾驶技术有望逐步落地普及,为人们带来更加
    的头像 发表于 12-30 09:39 1593次阅读
    如何实现<b class='flag-5'>自动驾驶</b>规控算法的仿真验证