0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全球GPU呈现“一超一强”竞争格局

智能计算芯世界 来源:智能计算芯世界 2023-08-14 11:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI 服务器发展迅速,GPU 环节被英伟达AMD 所占据。AIGC 的发展带动AI 服务器迅速增长,TrendForce 集邦咨询预计 23 年 AI 服务器出货量约 120 万台,同比+38.4%,占整体服务器出货量的比约为9%,2022~2026 年 AI 服务器出货量 CAGR 将达 22%,而 AI 芯片 2023 年出货量将成长 46%。GPU 作为数据并行处理的核心,是 AI 服务器的核心增量。

本文来自“行业专题:GPU龙头产品迭代不断,产业链各环节持续催化”,全球GPU呈现“一超一强”的竞争格局,根据 IDC 数据,2021 英伟达在企业级 GPU 市场中占比 91.4%,AMD 占比 8.5%。

587f6182-3a33-11ee-9e74-dac502259ad0.png

目前英伟达产品 DGX GH200 已发布,互连技术强大,算力进一步升级。5月 29 日,英伟达在其发布会上,正式发布最新的 GH200 Grace Hopper 超级芯片,以及拥有 256 个 GH200 超级芯片的 NVIDIA DGX GH200 超级计算机。

GH200超级芯片内部集成了 Grace CPU 和 H100 GPU,晶体管数量达 2000 亿个。其借助 NVIDIA NVLink-C2C 芯片互连,将英伟达 Grace CPU 与英伟达 H100 TensorCore GPU 整合。与 PCIe Gen5 技术相比,其 GPU 和 CPU 之间的带宽将提高 7倍,并将互连功耗减少至 1/5 以下。同时,DGX GH200 的 AI 性能算力将达到1exaFLOPS。

58ae3d36-3a33-11ee-9e74-dac502259ad0.png

英伟达产品 DGX GH200 共享内存大幅提升,突破内存瓶颈。DGX GH200系统将 256 个 GH200 超级芯片与 144TB 的共享内存进行连接,进一步提高系统协同性。与 DGX H100 相比,DGX GH200 的共享内存提升约 230 倍。凭借强大的共享内存,GH200 能够显著改善受 GPU 内存大小瓶颈影响的 AI 和 HPC 应用程序的性能。而在具有 tb 级嵌入式表的深度学习推荐模型(DLRM)、tb 级图神经网络训练模型或大型数据分析工作负载中,使用 DGX GH200 可将速度提高4到7倍。

而 AMD 在美国时间 2023 年 6 月 13 日,推出其新款 AI 芯片 MI300 系列,两款芯片分别为 MI300A 与 MI300X,分别集成 1460、1530 亿个晶体管。MI300A内含 13 个小芯片,总共集成 1460 亿个晶体管,其内部包含 24 个 Zen 4 CPU 核心、1 个 CDNA 3 图形引擎和 128GB HBM3 内存;而 MI300X 是针对大预言模型的优化版本,其内存达 192GB,内存带宽为 5.2TB/s,Infinity Fabric 带宽为896GB/s,晶体管达 1530 亿个。AMD 表示,与上代 MI 250 相比,MI300 的 AI性能和每瓦性能分别为 MI250 的 8 倍和 5 倍。

58d657bc-3a33-11ee-9e74-dac502259ad0.png

应用先进封装 Chiplet 技术与 HBM3,工艺技术驱动产品升级。在以往 CPU、GPU 设计中,AMD 常利用其先进的封装堆叠技术,集成多个小核心,从而实现整体性能的提升。根据芯智讯,MI300 由 13 个小芯片整合而成,其中其计算部分由 9 个基于台积电 5nm 工艺制程的小芯片组成,这些小芯片包括了 CPU 和 GPU内核。3D 堆叠设计极大提升了 MI 300 的性能与数据吞吐量。同时,MI300 两侧排列着 8 个合计 128GB 的 HBM3 芯片,满足其海量且高速的数据存储需求。

5917d570-3a33-11ee-9e74-dac502259ad0.png

AI 大模型等 AIGC 产业的升级离不开算力的底层支持,使得 GPU 等大算力芯片性能持续提升,带来产业链各环节增量。以英伟达 DGX H100 为例,其在GPU、互连技术、智能网卡、内存条、硬盘等结构上均较普通服务器有较大提升,同时其 PCB 的面积需求量与性能要求亦高于普通服务器。

5980884a-3a33-11ee-9e74-dac502259ad0.png

(1)GPU:量价齐升,产业链最大增量。一般的普通服务器仅会配备单卡或双卡,而 AI 服务器由于需要承担大量的计算,一般配置四块或以上的 GPU。且AI大模型在训练与推理时的计算量巨大,中低端的GPU无法满足其运算需求。如在英伟达 DGX H100 中,其配备 8 个 NVIDIA H100 GPU,总 GPU 显存高达640GB;每个GPU配备18个NVIDIA NVLink,GPU之间的双向带宽高达900GB/s。若以每个 NVIDIA H100 GPU 单价 4 万美元测算,DGX H100 的 GPU 价值量为32 万美元,为 AI 服务器中的最大增量。

59d3954e-3a33-11ee-9e74-dac502259ad0.png

(2)硬盘:AI 服务器 NAND 数据存储需求提升 3 倍。AI 服务器的高吞吐量及训练模型的高参数量级亦推升 NAND 数据存储需求。美光估计,AI 服务器中NAND 需求量是传统服务器的 3 倍。一台 DGX H100 中,SSD 的存储容量达 30TB。

(3)内存:AI 服务器 DRAM 数据存储需求提升 8 倍,HBM 需求快速提升。以 HBM 为主要代表的存算一体芯片能够通过 2.5D/3D 堆叠,将多个存储芯片与处理器芯片封装在一起,克服单一封装内带宽的限制、增加带宽、扩展内存容量、并减少数据存储的延迟。根据公众号全球 SSD,三星 2021 年 2 月与 AMD 合作开发 HBM-PIM,将内存和 AI 处理器合而为一,在 CPU 和 GPU 安装 HBM-PIM,显著提高服务器运算速度。2023 年开年后,三星高带宽存储器(HBM)订单快速增加。SK 海力士亦在 2021 年 10 月成功开发出 HBM3,并于 2022 年 6 月开始量产,在 2022 年第三季度向英伟达进行供货。同时,美光估计,AI 服务器中 DRAM需求量是传统服务器的 8 倍。如在一台 DGX H100 中,内存容量达 2TB。

5a29d9c2-3a33-11ee-9e74-dac502259ad0.png

(4)PCB:AI 服务器 PCB 明确受益 AI 算力提升。目前普通服务器需要 6-16层板和封装基板,而 AI 服务器等高端服务器主板层数则达 16 层以上,背板层数超过 20 层。且除 GPU 外,服务器中主板、电源背板、硬盘背板、网卡、Riser卡等核心部分均需使用 PCB 板进行数据传输。服务器出货量的增加将推动 PCB需求量的提升。

5a6da7c4-3a33-11ee-9e74-dac502259ad0.png

(5)先进封装:高制程芯片设计成本与制造成本均呈现指数型的增长趋势,Chiplet 等先进封装应运而生。随着制程的提升,芯片成本的提升呈现指数型增长。以芯片设计为例,根据 UCIE 白皮书,28nm 制程的芯片设计成本约 0.51 亿美元,但当制程提升至 5nm 时,芯片设计成本则快速升至 5.42 亿美元,成本提升近十倍,先进制程的推进速度愈加缓慢。因此在 HPC 高性能计算领域,Chiplet 的重要性持续提升。

5aa1ba5a-3a33-11ee-9e74-dac502259ad0.png

目前,以 CoWoS 为代表的高性能计算先进封装产能紧缺,制约 GPU 产品出货。英伟达 A100、H100 GPU 均采用台积电 CoWoS 先进封装工艺。而根据科创板日报与台湾电子时报,英伟达将原定今年 Q4 的先进封装 CoWoS 产能,改为 Q2-Q4 平均分配生产,订单生产时间较原计划大大提前。目前,台积电 CoWoS封测产能供不应求,部分订单已外溢日月光、矽品与 Amkor、联电等。以 CoWoS 为代表的先进封装技术产能紧缺,已成为制约 GPU 生产的关键环节。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5648

    浏览量

    139041
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5100

    浏览量

    134477
  • AI芯片
    +关注

    关注

    17

    文章

    2066

    浏览量

    36570

原文标题:全球GPU呈现“一超一强”竞争格局

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    天合光能入选2025全球新能源企业500

    近日,“2025全球新能源企业500”榜单正式发布,天合光能凭借卓越的综合实力和全球竞争力成功上榜,位列第22名。
    的头像 发表于 10-13 14:18 715次阅读

    德赛电池入选2025全球新能源企业500

    ,“2025全球新能源企业500”榜单权威发布,德赛电池凭借在新能源领域的卓越建树及深远影响力,实力跻身全球顶尖阵营,位居第108位,彰显出雄厚的行业竞争力与品牌引领力。
    的头像 发表于 10-11 16:16 641次阅读

    海辰储能入选2025全球新能源企业500榜单

    全球新能源500”榜单中,海辰储能连续第三年荣登该榜单,彰显企业在全球新能源格局中的领先地位与新周期下的强劲发展韧性。
    的头像 发表于 09-29 16:39 760次阅读

    标准更新频率如何影响电能质量在线监测装置的市场竞争格局

    LZ-DY-8三相电压监测仪 标准更新频率通过 技术壁垒重构、供应链洗牌、区域市场分化、国际竞争格局重塑 四大机制,深刻改变了电能质量在线监测装置的市场竞争格局。以下结合行业实践与数据
    的头像 发表于 09-03 16:45 532次阅读
    标准更新频率如何影响电能质量在线监测装置的市场<b class='flag-5'>竞争</b><b class='flag-5'>格局</b>?

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    图睿科技亮相全球闪存峰会,GPU RAID引领端到端存储新格局

    南京 2025年7月7日 /美通社/ -- 2025年7月9日,全球领先以GPU-based的磁盘陣列存储创新企业图睿科技(Graid Technology)将携旗艦產品SupremeRAID
    的头像 发表于 07-07 22:54 382次阅读

    手表芯片多争霸赛开启!小米玄戒T1入局,格局生变?

    电子发烧友网报道(文/莫婷婷)当前,国内可穿戴设备主控芯片市场呈现出“一超、梯度竞争”的竞争态势,就在5月,小米重磅推出智能手表玄戒T1
    的头像 发表于 05-29 01:05 1w次阅读
    手表芯片多<b class='flag-5'>强</b>争霸赛开启!小米玄戒T1入局,<b class='flag-5'>格局</b>生变?

    竞争格局看 M12 航空插头行业走向

    竞争格局审视,M12航空插头行业未来将在技术创新的持续赋能下,不断开拓新的应用领域,朝着更高性能、更小型化、更能适应复杂恶劣环境的方向稳健前行。在此过程中,企业唯有持续提升自身核心竞争力,方能在激烈的市场
    的头像 发表于 05-28 09:02 310次阅读
    从<b class='flag-5'>竞争</b><b class='flag-5'>格局</b>看 M12 航空插头行业走向

    远见卓识二十载,2025凯度BrandZ最具价值全球品牌100正式发布

    载"为主题在上海举行,现场正式发布《2025凯度BrandZ最具价值全球品牌100》榜单(以下简称"品牌百榜单")及分析报告。该报告深入剖析了过去20年间品牌营销的变迁历程,详细阐述了品牌价值在市场
    的头像 发表于 05-15 23:04 380次阅读

    GPU渲染才是大势所趋?CPU渲染与GPU渲染的现状与未来

    在3D建模和渲染领域,随着技术的发展,CPU渲染和GPU渲染这两种方法逐渐呈现出各自独特的优势,并且在不同的应用场景中各有侧重。尽管当前我们处在个CPU渲染和GPU渲染并行发展的时代
    的头像 发表于 02-06 11:04 1240次阅读
    <b class='flag-5'>GPU</b>渲染才是大势所趋?CPU渲染与<b class='flag-5'>GPU</b>渲染的现状与未来

    中兴通讯斩获5G FWA CPE全球竞争力第

    近日,市场研究公司ABI Research发布了《5G FWA CPE供应商竞争力排名》报告,中兴通讯凭借5G FWA CPE领先的技术创新能力和全球市场卓越的市场表现斩获排名第,被评为整体领导者、顶级创新者和顶级实践者,获得
    的头像 发表于 01-18 09:35 977次阅读

    2024年GPU出货量增长显著,超越CPU

    近日,根据知名市场研究机构Jon Peddie Research(JPR)最新发布的报告,2024年全球GPU(包括集成显卡和独立显卡)市场呈现出强劲的增长态势。报告显示,该年度GPU
    的头像 发表于 01-17 14:12 830次阅读

    MR20抗干扰体式IO模块的革新力量

    在快速发展的工业自动化领域,每次技术的飞跃都是对效率与稳定性的极致追求。明达技术自主研发的抗干扰MR20体式IO模块,以其卓越的性能、超高的集成度以及无与伦比的抗干扰能力,正逐步重塑工业控制系统的
    的头像 发表于 01-02 17:31 687次阅读
    MR20<b class='flag-5'>强</b>抗干扰<b class='flag-5'>一</b>体式IO模块的革新力量

    2024全球安防50榜单公布

    2023年全球安防50企业表现积极,前10公司收入同比增长。海康威视和大华股份领跑,新上榜企业为技威时代GWELLTIMES。TKH等四家公司重返50
    的头像 发表于 12-26 16:17 1746次阅读

    新洁能荣获2024年全球半导体企业综合竞争力百

    近日,全球半导体市场峰会在上海成功召开。会上,世界集成电路协会发布了全球半导体企业综合竞争力百报告,新洁能成功进入该榜单,也是唯进入该榜
    的头像 发表于 12-14 15:15 2403次阅读