0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型市场,不止带火HBM

半导体产业纵横 来源:半导体产业纵横 2023-07-11 18:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,HBM成为芯片行业的火热话题。据TrendForce预测,2023年高带宽内存(HBM)比特量预计将达到2.9亿GB,同比增长约60%,2024年预计将进一步增长30%。2008年被AMD提出的HBM内存概念,在2013年被SK海力士通过TSV技术得以实现,问世10年后HBM似乎真的来到了大规模商业化的时代。

HBM的概念的起飞与AIGC的火爆有直接关系。AI服务器对带宽提出了更高的要求,与 DDR SDRAM 相比,HBM 具有更高的带宽和更低的能耗。超高的带宽让HBM成为了高性能GPU的核心组件,HBM基本是AI服务器的标配。目前,HBM成本在AI服务器成本中占比排名第三,约占9%,单机平均售价高达18,000美元。

自从去年ChatGPT出现以来,大模型市场就开始了高速增长,国内市场方面,百度、阿里、科大讯飞、商汤、华为等科技巨头接连宣布将训练自己的AI大模型。TrendForce预测,2025年将有5个相当于ChatGPT的大型AIGC、25个Midjourney的中型AIGC产品、80个小型AIGC产品,即使是全球所需的最小计算能力资源也可能需要 145,600 至 233,700 个英伟达A100 GPU。这些都是HBM的潜在增长空间。

2023年开年以来,三星、SK海力士HBM订单就快速增加,HBM的价格也水涨船高,近期HBM3规格DRAM价格上涨了5倍。三星已收到AMD与英伟达的订单,以增加HBM供应。SK海力士已着手扩建HBM产线,目标将HBM产能翻倍。韩媒报道,三星计划投资约7.6亿美元扩产HBM,目标明年底之前将HBM产能提高一倍,公司已下达主要设备订单。

01 HBM在AIGC中的优势

直接地说,HBM将会让服务器的计算能力得到提升。由于短时间内处理大量数据,AI服务器对带宽提出了更高的要求。HBM的作用类似于数据的“中转站”,就是将使用的每一帧、每一幅图像等图像数据保存到帧缓存区中,等待GPU调用。与传统内存技术相比,HBM具有更高带宽、更多I/O数量、更低功耗、更小尺寸,能够让AI服务器在数据处理量和传输速率有大幅提升。

f248ff98-1fd1-11ee-962d-dac502259ad0.png

来源:rambus

可以看到HBM在带宽方面有着“碾压”级的优势。如果 HBM2E 在 1024 位宽接口上以 3.6Gbps 的速度运行,那么就可以得到每秒 3.7Tb 的带宽,这是 LPDDR5 或 DDR4 带宽的 18 倍以上。

除了带宽优势,HBM可以节省面积,进而在系统中安装更多GPU。HBM 内存由与 GPU 位于同一物理封装上的内存堆栈组成。

这样的架构意味着与传统的 GDDR5/6 内存设计相比,可节省大量功耗和面积,从而允许系统中安装更多 GPU。随着 HPC、AI 和数据分析数据集的规模不断增长,计算问题变得越来越复杂,GPU 内存容量和带宽也越来越大是一种必需品。H100 SXM5 GPU 通过支持 80 GB(五个堆栈)快速 HBM3 内存,提供超过 3 TB/秒的内存带宽,是 A100 内存带宽的 2 倍。

过去对于HBM来说,价格是一个限制因素。但现在大模型市场上正处于百家争鸣时期,对于布局大模型的巨头们来说时间就是金钱,因此“贵有贵的道理”的HBM成为了大模型巨头的新宠。随着高端GPU需求的逐步提升,HBM开始成为AI服务器的标配。

目前英伟达的A100及H100,各搭载达80GB的HBM2e及HBM3,在其最新整合CPU及GPU的Grace Hopper芯片中,单颗芯片HBM搭载容量再提升20%,达96GB。

AMD的MI300也搭配HBM3,其中,MI300A容量与前一代相同为128GB,更高端MI300X则达192GB,提升了50%。

预期Google将于2023年下半年积极扩大与Broadcom合作开发AISC AI加速芯片TPU也计划搭载HBM存储器,以扩建AI基础设施。

02 存储厂商加速布局

这样的“钱景”让存储巨头们加速对HBM内存的布局。目前,全球前三大存储芯片制造商正将更多产能转移至生产HBM,但由于调整产能需要时间,很难迅速增加HBM产量,预计未来两年HBM供应仍将紧张。

HBM的市场主要还是被三大DRAM巨头把握。不过不同于DRAM市场被三星领先,SK海力士在HBM市场上发展的更好。如开头所说,SK海力士开发了第一个HBM产品。2023年4月,SK 海力士宣布开发出首个24GB HBM3 DRAM产品,该产品用TSV技术将12个比现有芯片薄40%的单品DRAM芯片垂直堆叠,实现了与16GB产品相同的高度。同时,SK海力士计划在2023年下半年准备具备8Gbps数据传输性能的HBM3E样品,并将于2024年投入量产。

国内半导体公司对HBM的布局大多围绕着封装及接口领域。

国芯科技目前正在研究规划合封多HBM内存的2.5D的芯片封装技术,积极推进Chiplet技术的研发和应用。

通富微电公司2.5D/3D生产线建成后,将实现国内在HBM高性能封装技术领域的突破。

佰维存储已推出高性能内存芯片和内存模组,将保持对HBM技术的持续关注。

澜起科技PCIe 5.0/CXL 2.0 Retimer芯片实现量产,该芯片是澜起科技PCIe 4.0 Retimer产品的关键升级,可为业界提供稳定可靠的高带宽、低延迟PCIe5.0/ CXL 2.0互连解决方案。

HBM虽好但仍需冷静,HBM现在依旧处于相对早期的阶段,其未来还有很长的一段路要走。而可预见的是,随着越来越多的厂商在AI和机器学习等领域不断发力,内存产品设计的复杂性正在快速上升,并对带宽提出了更高的要求,不断上升的宽带需求将持续驱动HBM发展。

HBM火热反映了AIGC的带动能力。那么除了HBM和GPU,是否还有别的产品在这波新风潮中能够顺势发展?

03 谈谈其他被带火的芯片

FPGA的优势开始显现

FPGA(Field Programmable Gate Array,现场可编程门阵列)是一种集成电路,具有可编程的逻辑元件、存储器和互连资源。不同于ASIC(专用集成电路),FPGA具备灵活性、可定制性、并行处理能力、易于升级等优势。

通过编程,用户可以随时改变FPGA的应用场景,FPGA可以模拟CPU、GPU等硬件的各种并行运算。因此,在业内也被称为“万能芯片”。

FPGA对底层模型频繁变化的人工智能推理需求很有意义。FPGA 的可编程性超过了 FPGA 使用的典型经济性。需要明确的是,FPGA 不会成为使用数千个 GPU 的大规模人工智能系统的有力竞争对手,但随着人工智能进一步渗透到电子领域,FPGA 的应用范围将会扩大。

FPGA相比GPU的优势在于更低的功耗和时延。GPU无法很好地利用片上内存,需要频繁读取片外的DRAM,因此功耗非常高。FPGA可以灵活运用片上存储,因此功耗远低于GPU。

6月27日,AMD宣布推出AMD Versal Premium VP1902自适应片上系统(SoC),是基于FPGA的自适应SoC。这是一款仿真级、基于小芯片的设备,能够简化日益复杂的半导体设计的验证。据悉,AMD VP1902将成为全球最大的FPGA,对比上一代产品(Xilinx VU19P),新的VP1902增加了Versal功能,并采用了小芯片设计,使FPGA的关键性能增加了一倍以上。

东兴证券研报认为,FPGA凭借其架构带来的时延和功耗优势,在AI推理中具有非常大的优势。浙商证券此前研报亦指出,除了GPU以外,CPU+FPGA的方案也能够满足AI庞大的算力需求。

不同于HBM被海外公司垄断,国内公司FPGA芯片已经有所积累。

安路科技主营业务为FPGA芯片和专用EDA软件的研发、设计和销售,产品已广泛应用于工业控制网络通信消费电子等领域。紫光国微子公司紫光同创是专业的FPGA公司,设计和销售通用FPGA芯片。紫光国微曾在业绩说明会上表示,公司的FPGA芯片可以用于AI领域。东土科技主要开展FPGA芯片的产业化工作,公司参股公司中科亿海微团队自主开发了支撑其FPGA产品应用开发的EDA软件。

国产替代新思路:存算一体+Chiplet

能否利用我们现在可用的工艺和技术来开发在性能上可以跟英伟达对标的 AI 芯片呢?一些“新思路”出现了,例如存算一体+Chiplet。

存算分离会导致算力瓶颈。AI技术的快速发展,使得算力需求呈爆炸式增长。在后摩尔时代,存储带宽制约了计算系统的有效带宽,系统算力增长步履维艰。例如,8块1080TI 从头训练BERT模型需99天。存算一体架构没有深度多层级存储的概念,所有的计算都放在存储器内实现,从而消除了因为存算异构带来的存储墙及相应的额外开销;存储墙的消除可大量减少数据搬运,不但提升了数据传输和处理速度,而且能效比得以数倍提升。

一方面,存算一体架构与传统架构处理器处理同等算力所需的功耗会降低;另一方面,存算一体的数据状态都是编译器可以感知的,因此编译效率很高,可以绕开传统架构的编译墙。

美国亚利桑那州立大学的学者于 2021 年发布了一种基于 Chiplet 的 IMC 架构基准测试仿真器 SIAM, 用于评估这种新型架构在 AI 大模型训练上的潜力。SIAM 集成了器件、电路、架构、片上网络 (NoC)、封装网络 (NoP) 和 DRAM 访问模型,以实现一种端到端的高性能计算系统。SIAM 在支持深度神经网络 (DNN) 方面具有可扩展性,可针对各种网络结构和配置进行定制。其研究团队通过使用 CIFAR-10、CIFAR-100 和 ImageNet 数据集对不同的先进 DNN 进行基准测试来展示 SIAM 的灵活性、可扩展性和仿真速度。据称,相对于英伟达 V100 和 T4 GPU, 通过 SIAM 获得的chiplet +IMC 架构显示 ResNet-50 在ImageNet 数据集上的能效分别提高了 130 和 72。

这意味着,存算一体 AI 芯片有希望借助Chiplet技术和 2.5D / 3D 堆叠封装技术实现异构集成,从而形成大型计算系统。存算一体 + Chiplet 组合似乎是一种可行的实现方式,据称亿铸科技正在这条路上探索,其第一代存算一体 AI 大算力商用芯片可实现单卡算力 500T 以上,功耗在 75W 以内。也许这将开启 AI 算力第二增长曲线的序幕。

04 结语

世界人工智能大会上,AMD CEO苏姿丰表示,未来十年一定会出现一个大型计算超级周期,因此,目前正是一个成为技术供应商的好时机,同时也是与一些将会利用这些技术开发不同应用的客户合作的好时机。

没有人想要一个只有一个主导者的行业。大模型市场能否让芯片行业拥有新的市场格局,能否让新玩家出现?

“大模型市场对芯片行业带来了新的市场格局和机会。通过推动AI芯片的发展、促进云计算和数据中心市场的增长以及引发竞争格局变化,大模型的兴起为芯片行业带来了新的发展方向。

需要注意的是,芯片行业是一个高度竞争和技术密集的行业。进入该行业需要庞大的资金和技术资源,以满足复杂的制造和研发要求。尽管大模型市场为新玩家提供了机会,但他们需要克服技术、资金和市场等方面的挑战,才能在竞争激烈的芯片行业中获得成功。”Chatgpt如是回应。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储器
    +关注

    关注

    39

    文章

    7769

    浏览量

    172440
  • DDR4
    +关注

    关注

    12

    文章

    351

    浏览量

    43381
  • SDRAM控制器
    +关注

    关注

    0

    文章

    29

    浏览量

    10103
  • HBM
    HBM
    +关注

    关注

    2

    文章

    437

    浏览量

    15910

原文标题:大模型市场,不止带火HBM

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OpenClaw爆 润和软件面向行业的AI智能体专家,不止于“养龙虾”

    OpenClaw的爆,标志着AI正加速从“大语言模型”向“智能体”范式跃迁。作为面向行业的专业数智科技服务商,江苏润和软件股份有限公司(以下简称“润和软件”)深耕企业数字化服务二十余载,已构建起从
    的头像 发表于 03-16 17:52 1539次阅读
    OpenClaw爆<b class='flag-5'>火</b> 润和软件面向行业的AI智能体专家,<b class='flag-5'>不止</b>于“养龙虾”

    存储狂飙与HBM扩产潮下,高端芯片烧录的“速度与精度”终极博弈

    当前存储市场上行,HBM 技术演进推动烧录数据量指数级增长,传统烧录与测试方案遇瓶颈。行业通过高速接口、多芯片协同、智能校准与光学检测融合等创新方案应对,同时向制造链整合的模块化方案转型。禾洛半导体
    的头像 发表于 12-29 16:52 2029次阅读

    HBM3E反常涨价20%,AI算力竞赛重塑存储芯片市场格局

    电子发烧友网报道(文/吴子鹏)在半导体存储行业的常规逻辑中,新一代产品面世前夕,前代产品降价清库存是常规定律,但如今HBM(高带宽内存)将打破这一行业共识。据韩媒最新报道,三星电子和SK海力士已上调
    的头像 发表于 12-28 09:50 8013次阅读

    AI大算力的存储技术, HBM 4E转向定制化

    电子发烧友网报道(文/黄晶晶)如今英伟达GPU迭代速度加快至每年一次,HBM存储速率如何跟上GPU发展节奏。越来越多的超大规模云厂商、GPU厂商开始转向定制化HBM。而HBM存储厂商以及晶圆代工厂也
    的头像 发表于 11-30 00:31 8991次阅读
    AI大算力的存储技术, <b class='flag-5'>HBM</b> 4E转向定制化

    半导体“HBM和3D Stacked Memory”技术的详解

    3D Stacked Memory是“技术方法”,而HBM是“用这种方法解决特定问题的产品”。
    的头像 发表于 11-07 19:39 6958次阅读
    半导体“<b class='flag-5'>HBM</b>和3D Stacked Memory”技术的详解

    工品静电敏感度测试及静电防护

    工品静电敏感度测试主要依据GJB736.11A-2019《工品试验方法第11部分:电工品静电感度试验》。以下是该标准的详细要求:•试验原理:采用电容放电模型模拟人体静电危害,通
    的头像 发表于 10-22 16:31 996次阅读
    电<b class='flag-5'>火</b>工品静电敏感度测试及静电防护

    紫光国芯存储芯片国产替代方案:打破DDR5/HBM芯片供应链瓶颈

    可控。市场需求与供应链现实:DDR5及HBM的技术价值与挑战AI大模型、智能计算等应用场景的爆发,对数据处理的通量和效率提出了极为苛刻的要求,这直接推动了存储技术
    的头像 发表于 10-10 16:41 3030次阅读
    紫光国芯存储芯片国产替代方案:打破DDR5/<b class='flag-5'>HBM</b>芯片供应链瓶颈

    ANSA人体模型姿态调整工具介绍

    ANSA的人体模型姿态调整工具(HBM Articulation Tool)通过网格变形技术实现基于人体不同部位进行调节,定位人体模型最终的姿态。
    的头像 发表于 09-28 15:40 2029次阅读
    ANSA人体<b class='flag-5'>模型</b>姿态调整工具介绍

    HBM技术在CowoS封装中的应用

    HBM通过使用3D堆叠技术,将多个DRAM(动态随机存取存储器)芯片堆叠在一起,并通过硅通孔(TSV,Through-Silicon Via)进行连接,从而实现高带宽和低功耗的特点。HBM的应用中,CowoS(Chip on Wafer on Substrate)封装技术
    的头像 发表于 09-22 10:47 2870次阅读

    传英伟达自研HBM基础裸片

    电子发烧友网综合报道,据台媒消息,传闻英伟达已开始开发自己的HBM基础裸片,预计英伟达的自研HBM基础裸片采用3nm工艺制造,计划在2027年下半年进行小批量试产。并且这一时间点大致对应"Rubin
    的头像 发表于 08-21 08:16 3115次阅读

    奥托立夫联合开发具有损伤预测功能的人体模型Safer HBM

    在追求极致安全的道路上,传统碰撞假人提供了宝贵的数据,但始终无法精准模拟人体复杂组织的真实损伤过程。这一瓶颈,如今由革命性工具人体模型HumanBodyModel,HBM)彻底打破。
    的头像 发表于 08-19 15:24 1303次阅读

    HBM应用在手机上,可行吗?

      电子发烧友网报道(文/梁浩斌)最近有不少关于HBM技术被应用到手机的消息,此前有消息称苹果会在20周年iPhone,也就是2027年推出使用HBM DRAM的iPhone手机,提高端侧AI能力
    的头像 发表于 07-13 06:09 7708次阅读

    有源铜缆:大模型背后的隐形英雄

    现在大家都在关注大模型,像ChatGPT,xAI等,尤其是Deepseek,最近都出圈了!
    的头像 发表于 07-11 14:16 1445次阅读
    有源铜缆:大<b class='flag-5'>模型</b>背后的隐形英雄

    SK海力士HBM技术的发展历史

    SK海力士在巩固其面向AI的存储器领域领导地位方面,HBM1无疑发挥了决定性作用。无论是率先开发出全球首款最高性能的HBM,还是确立并保持其在面向AI的存储器市场的领先地位,这些成就的背后皆源于SK海力士秉持的“一个团队”协作精
    的头像 发表于 06-18 15:31 2474次阅读

    FA模型卡片和Stage模型卡片切换

    卡片切换 卡片切换主要包含如下三部分: 卡片页面布局:FA模型卡片和Stage模型卡片的布局都采用类web范式开发可以直接复用。 卡片配置文件:FA模型的卡片配置在config.json中
    发表于 06-06 08:10