0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI训练不可或缺的存储,HBM3 DRAM再升级

晶芯观察 来源:电子发烧友网 作者:黄晶晶 2023-04-23 00:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶) SK海力士近日发布全球首次实现垂直堆叠12个单品DRAM芯片,成功开发出最高容量24GB的HBM3 DRAM新产品。


图源:SK海力士


目前已向数多全球客户公司提供了24GB HBM3 DRAM样品正在进行性能验证,预计从今年下半年起将其推向市场。而现有HBM3 DRAM的最大容量是垂直堆叠8个单品DRAM芯片的16GB。无论是堆叠数量还是容量上,此次发布的新品都有显著提升。

HBM(高带宽存储器)是高价值、高性能存储器,垂直互连多个DRAM芯片。目前SK海力士在HBM市场处于领先地位,约有60%-70%的份额。


图源:SK海力士


SK海力士于2013年首次开发HBM DRAM(第一代)产品,随后以HBM2(第二代)、HBM2E(第三代)、HBM3(第四代)的顺序开发。早在去年6月,SK海力士宣布其HBM3将与NVIDIA H100Tensor CoreGPU结合用于加速计算,SK hynix于2022年第三季度开始发货。今年年初随着ChatGPT的火爆,HBM订单激增。那么SK海力士有哪些技术来提升HBM的性能呢,以下结合SK海力士多位技术专家的分享进行一些解读。

训练计算需匹配高性能存储

训练GPT-3、Megatron-Turing NLG 530B等超大语言模型所要求的算力提升速度呈数倍到数百倍的增长。尤其是ChatGPT的训练,ChatGPT人工智能语言模型的背后就是Transformer架构。这个架构突破了传统的循环神经网络(RNN)和长短时记忆网络(LSTM)的局限性,能够在大规模数据集上进行高效训练。为了实现高效训练计算,就需要有与之匹配的高性能存储。


图源:SK海力士


SK海力士于2021年10月推出全球首款HBM3,并在2022年6月实现量产。据介绍,该款HBM3每个引脚传输速率达6.4Gbps,1024位宽接口,最高带宽可达819GB/s,较HBM2E(460GB/s)高约78%。16Gb内核密度、尖端的TSV垂直堆叠技术,满足了系统对更高密度的要求,该技术可实现12层堆叠内存立方体,从而实现最大24GB封装密度。HBM3配备On-die ECC(纠错码)可靠性功能,可自我检测和纠正数据错误,从而在SoC和DRAM之间实时传输海量数据。


图源:SK海力士

先进的封装技术

此次新产品采用了先进(Advanced)MR-MUF和TSV技术。SK海力士表示,通过先进MR-MUF技术加强了工艺效率和产品性能的稳定性,又利用TSV技术将12个比现有芯片薄40%的单品DRAM芯片垂直堆叠,实现了与16GB产品相同的高度。这两项技术也是SK海力士先进封装技术的重要组成。

首先来看先进MR-MUF技术。根据SK海力士的官方资料,MR-MUF(Mass Reflow Molded Underfill, 批量回流模制底部填充)将半导体芯片贴附在电路上,并在堆叠芯片时使用“EMC (Epoxy Molding Compound, 液态环氧树脂模塑料”填充芯片之间或芯片与凸块之间间隙的工艺。这种新的工艺主要是比之前的NCF技术工艺有了很大提升。此前的NCF技术是在芯片之间使用薄膜进行堆叠。与NCF相比,MR-MUF导热率高出两倍左右,工艺速度和良率都有提升。

图源:SK海力士

另一个是TSV(Through Silicon Via, 硅通孔技术)。TSV技术是在DRAM芯片打上数千个细微的孔,并通过垂直贯通的电极连接上下芯片的先进封装技术。这种技术已经成为一种提升DRAM性能和密度的重要手段,可以应用于3D-TSV DRAM和HBM。

图源:SK海力士

HBM主要用于弥补SoC高带宽需求与主存储器最大带宽供应能力之间的带宽缺口。SK海力士专家表示,特别是在AI应用中,每个SoC的带宽需求可能都会超过几TB/s,这是常规主存储器无法满足的。例如具有3200Mbps DDR4 DIMM的单个主存储器通道只能提供25.6GB/s的带宽。即使是具有8个存储器通道的CPU平台,其速度也只能达到204.8GB/s。而围绕单个SoC的4个HBM2堆叠可提供大于1TB/s的带宽。根据不同的应用程序,HBM既可以单独用作缓存,也可以用作两层存储中的第一层。

图源:SK海力士

实际上除了GPU搭载了HBM之外,CPU也实现了封装HBM。去年底,英特尔就正式推出了全球首款配备 HBM 内存的 x86 CPU——Intel Xeon Max 系列。根据下图介绍,它具有64 GB的HBM2e 内存,分为4个16 GB的集群,总内存带宽为1 TB / s,每个内核的HBM都超过1 GB。


图源:Intel

当前HBM的技术方向主要是在速度、密度、功耗、占板空间等方面的提升。SK海力士通过提高引脚数据速率、I/O总线位宽等方式提升速率;通过扩展Die堆叠层数和物理堆叠高度,以及增加核心Die密度以优化堆叠密度。通过评估内存结构和操作方案,最大限度地降低每带宽扩展的绝对功耗;为了实现总内存Die尺寸最小化,则是通过在不扩大现有物理尺寸的情况下增加存储单元数量和功能。

小结

显然,人工智能、数据中心的应用还将拉动HBM的需求,但从成本来看,HBM的平均售价至少是DRAM的三倍,前不久受ChatGPT的拉动,HBM的价格更是水涨船高,消息人士称,与性能最高的DRAM相比HBM3的价格上涨了五倍。不过,这一市场前景也正是DRAM存储厂商投入技术和产品的动力。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 块存储
    +关注

    关注

    0

    文章

    6

    浏览量

    2454
  • HBM3
    +关注

    关注

    0

    文章

    75

    浏览量

    525
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    完结9章 AI训练师 入门与实战 教程资料2026

    AI 分布式存储:我觉得这才是大模型真正的地基,但没人愿意聊 所有人都在聊大模型怎么训练、怎么微调、怎么部署,但很少有人聊一个更基础的问题:数据怎么存、怎么读、怎么在几百张卡之间不打架。 我做了两年
    发表于 05-28 18:23

    AI Ceph 分布式存储教程资料大模型学习资料2026

    的 S3 兼容接口设计,使得 AI 框架可以无缝对接底层的硬件设施,实现了上层应用与底层存储的解耦。 四、 赋能推理部署:高并发与低延迟的平衡 分布式存储不仅服务于
    发表于 05-01 17:35

    成都汇阳投资关于AI 算力引爆需求,存储芯片涨价周期来袭

    AI 算力黑洞来袭 ,存储需求呈爆炸式增长 AI算力基础设施的爆发成为存储芯片需求的核心驱动力,单台 AI服务器
    的头像 发表于 03-27 17:12 754次阅读

    转载|射频美容仪:控制射频/电流至关重要,红外测温不可或缺

    射频电流的重要性,以及红外测温传感器在其中不可或缺的作用。图中信息转载凤凰网科技行业乱象丛生,安全隐患重重当前家用射频美容仪市场乱象丛生,暴利现象惊人,不少产品售
    的头像 发表于 03-26 09:34 278次阅读
    转载|射频美容仪:控制射频/电流至关重要,红外测温<b class='flag-5'>不可或缺</b>

    黄仁勋豪言“有多少吃多少”!存储超级周期,价格只涨不跌

    构预测2026年HBM增速将超过140%。 但另一方面,为了优先满足AI服务器对HBM和先进制程DRAM的需求,主要存储厂商将大量产能从传统
    的头像 发表于 03-10 10:58 5896次阅读

    如何突破AI存储墙?深度解析ONFI 6.0高速接口与Chiplet解耦架构

    的带宽(如HBM3/E)来支撑张量处理单元。• 存储瓶颈:传统NAND闪存接口已无法支撑企业级PCIe 5.0 SSD的吞吐要求,亟需更高效的互联协议。 2. 奎芯科技(MSquare)的突破性方案
    发表于 01-29 17:32

    HBM3E反常涨价20%,AI算力竞赛重塑存储芯片市场格局

    明年HBM3E价格,涨幅接近20%。   此次涨价背后,是AI算力需求爆发与供应链瓶颈的共同作用。随着英伟达H200、谷歌TPU、 亚马逊Trainium 等AI芯片需求激增,HBM3
    的头像 发表于 12-28 09:50 8035次阅读

    AI大算力的存储技术, HBM 4E转向定制化

    电子发烧友网报道(文/黄晶晶)如今英伟达GPU迭代速度加快至每年一次,HBM存储速率如何跟上GPU发展节奏。越来越多的超大规模云厂商、GPU厂商开始转向定制化HBM。而HBM
    的头像 发表于 11-30 00:31 9041次阅读
    <b class='flag-5'>AI</b>大算力的<b class='flag-5'>存储</b>技术, <b class='flag-5'>HBM</b> 4E转向定制化

    AI时代,如何用服务器存储如何升级

    相对于HBM、GDDR和DRAM,企业级SSD优势在于弥补了数据供给速度与计算速度之间的巨大鸿沟,特别是全新的CPU、GPU在算力、核心数量、AI吞吐量井喷式的增长,以往的低速存储很容
    的头像 发表于 11-03 14:46 1845次阅读
    <b class='flag-5'>AI</b>时代,如何用服务器<b class='flag-5'>存储</b>如何<b class='flag-5'>升级</b>?

    AI时代,服务器存储如何升级

    和新应用挑战。无论是CXL与内存扩展技术的落地,还是PCIe 5.0和PCIe 6.0与AI数据密集型应用推动的本地高速存储,都将企业级固态硬盘推向了非常重要角色。存储已经从系统的配套设施,变身成新平台性能释放的关键。 相对于
    的头像 发表于 11-03 13:11 1039次阅读

    HBM技术在CowoS封装中的应用

    HBM通过使用3D堆叠技术,将多个DRAM(动态随机存取存储器)芯片堆叠在一起,并通过硅通孔(TSV,Through-Silicon Via)进行连接,从而实现高带宽和低功耗的特点。
    的头像 发表于 09-22 10:47 2907次阅读

    全球首款HBM4量产:2.5TB/s带宽超越JEDEC标准,AI存储迈入新纪元

    海力士 HBM4 内存的 I/O 接口位宽为 2048-bit,每个针脚带宽达 10Gbps,因此单颗带宽可高达 2.5TB/s。这一里程碑不仅标志着 AI 存储器正式迈入 “2TB/s 带宽时代
    发表于 09-17 09:29 6795次阅读

    SK海力士宣布量产HBM4芯片,引领AI存储新变革

    HBM4 的开发,并在全球首次构建了量产体系,这一消息犹如一颗重磅炸弹,在半导体行业乃至整个科技领域激起千层浪。 ​ 高带宽存储器(HBM)作为一种能够实现高速、宽带宽数据传输的下一代 DR
    的头像 发表于 09-16 17:31 2209次阅读

    HBM应用在手机上,可行吗?

      电子发烧友网报道(文/梁浩斌)最近有不少关于HBM技术被应用到手机的消息,此前有消息称苹果会在20周年iPhone,也就是2027年推出使用HBM DRAM的iPhone手机,提高端侧AI
    的头像 发表于 07-13 06:09 7741次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音
    发表于 07-04 11:14