0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD最强AI芯片,性能强过英伟达H200,但市场仍不买账,生态是最大短板?

Felix分析 来源:电子发烧友网 作者:吴子鹏 2024-10-14 01:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)当地时间本周四,AMD在AMD Advancing AI 2024上发布了一系列新品,包括全新旗舰AI芯片、服务器CPU、AI网卡、DPU和AI PC移动处理器

其中,全新旗舰AI芯片的型号为AMD Instinct MI325X GPU,虽然仍然是采用CDNA 3架构,但是相较于AMD Instinct MI300X GPU还是有一些明显的提升,且官方数据显示,该芯片多项性能优于英伟达H200。

不过,对于AMD一系列的产品发布,市场方面似乎并不买账,AMD股价出现了一波明显跳水。能够看出,无论是市场面还是需求方,似乎还是对英伟达Blackwell GPU有更大的期待,虽然这款芯片此前曝出了良率缺陷问题。

AMD最强AI芯片却不及预期?

如上所述,AMD Instinct MI325X GPU仍然是基于CDNA 3架构,因此算是AMD Instinct MI300X GPU发布之后的中期小升级,并不是全新世代的产品。不过,即便如此,AMD Instinct MI325X GPU还是有非常多的亮点,且能够和英伟达的H200捉对厮杀。

AMD Instinct MI325X GPU是AMD公司首次采用HBM3E高带宽内存。HBM3E作为新一代高带宽内存技术,可以提供高达9.6Gb/s的扩展数据速率,相比前一代HBM3的6.4Gb/s有显著提升。目前,三星、SK海力士和美光都已经将HBM技术迭代到了HBM3E。得益于HBM3E内存的加持,AMD Instinct MI325X GPU内存带宽最高可达6TB/秒,同比提升约13%;内存容量最高可达256GB,相较于AMD Instinct MI300X GPU,内存容量提升了64GB。

由于同样是CDNA 3架构,因此MI325X和MI300X在计算性能方面基本是一致的,采用先进的2.5D封装,芯片内部有1530亿个晶体管,304个计算单元,AI算力(采用半精度浮点数FP16衡量)最高可达到1.3PFLOPS,也与MI300X相同。

虽然和自家芯片对比提升并不是太明显,但根据AMD的官方数据,AMD Instinct MI325X GPU是强于英伟达H200芯片的。官方文件显示,与H200相比,具有参数优势的MI325能够提供1.3倍的峰值理论FP16(16位浮点数)和FP8计算性能。AMD公司CEO苏姿丰表示,“你们能看到的是,MI325在运行Llama 3.1时,能提供比英伟达H200高出多达40%的性能。”根据发布会的信息显示,在模型推理方面,无论是单卡还是多卡,AMD Instinct MI325X GPU相较于英伟达H200基本有20%-40%的性能领先;在模型训练方面,AMD Instinct MI325X GPU也有单卡10%的性能领先。AMD预期,Instinct MI325X GPU芯片将从四季度开始生产,并将在明年一季度通过合作的服务器生产商供货。

目前,AI芯片在AMD业务中占比已经越来越高。根据AMD二季度财报,AMD Instinct MI300X GPU在二季度为AMD贡献了超过10亿美元的营收,预计全年销售额将达到45亿美元,约占公司整体销售额的15%。目前,微软、OpenAI、Meta、Cohere、Stability AI、Lepton AI(贾扬清创办)、World Labs(李飞飞创办)等公司的生成式AI方案都已经采用了AMD Instinct MI300X GPU。

除了发布AMD Instinct MI325X GPU,苏姿丰还剧透了AMD后续的AI芯片战略,下一代旗舰AI芯片的命名为AMD Instinct MI350X GPU,将开启全新的AMD AI芯片世代,采用最新的CDNA 4架构,首次引入FP6、FP4浮点数据类型,搭配内存还是HBM3E,但容量高达288GB,半精度浮点数FP16下的AI算力达到2.3PFLOPS。采用CDNA 4架构的MI350系列明年上市

同时,苏姿丰预测AI芯片后续美好的未来,数据中心人工智能加速器的市场将在2028年增长至5000亿美元,而这个数字在2023年时为450亿美元。在更早之前,苏姿丰曾预测全球数据中心人工智能加速器市场规模将在2027年达到4000亿美元。无论是哪一项数据预测,都足以显示目前全球AI发展高涨的情绪。

不过,即便新产品有着不错的性能,且未来市场空间广阔,但是AMD Instinct MI325X GPU的发布似乎并没有达到市场的预期,和自家上一款芯片Instinct MI300X GPU的性能差距并不明显,也没有能够借助这次发布会进一步缩小和英伟达之间的差距。因此,市场快速反应,AMD股价有了一个明显的下调。

市场还是倾向于选择英伟达

当然,消息面上也有不利于AMD本次新品发布的,那就是摩根士丹利发布了一份关于英伟达最新Blackwell GPU架构的报告,并透露导致造成生产瓶颈的补充信息。

此前,有媒体报道称,Blackwell架构产品生产上出现了一些问题,导致较低的良品率,从而影响了出货。英伟达在一份声明中表示,对Blackwell架构GPU的掩膜进行了改动,以提高产量。英伟达Blackwell GPU是第一批采用台积电CoWoS-L封装的产品,其使用RDL中间层与LSI桥接器连接小芯片,可实现约10Tb/s的数据传输速率。

与以往的CoWoS-S和CoWoS-R技术相比,CoWoS-L在性能和灵活性方面都有显著提升。这种技术利用LSI桥接器实现高密度的互联,能够兼容各种高性能芯片,如先进逻辑、SoIC(系统集成芯片)及HBM(高带宽内存)。挑战在于,由于GPU芯片、RDL中间层、LSI桥接器以及基板之间的热膨胀系数(CTE)不匹配,因此存在一定的生产挑战。

摩根士丹利指出,英伟达Blackwell GPU生产良率下降在后封装阶段发现的,这导致了良率的降低,并使原本供应紧张的CoWoS封装和HBM3e内存的情况雪上加霜。但该机构认为,这些问题在英伟达内部都已经过去了。摩根士丹利在报告中写道,“目前 Blackwell 产量提升‘相当强劲’,不会对原定路线图造成影响,所有迹象表明业务依然稳健,前景非常清晰,这与我们的所有调查一致。”

摩根士丹利预计,英伟达将于今年第4季度将出货最多45万张Blackwell GPU,从而实现50亿美元到100亿美元的营收。同时,该机构认为,当前安排不了的Blackwell GPU订单,可能需要到明年下半年才能够安排,因此前期订单已经签满了1年,而这些无法满足的订单,将促进Hopper GPU的需求。

原本英伟达Blackwell GPU的生产问题被认为是AMD公司的机会,但现在来看这个机会并没有得到兑现。一方面,英伟达很快就解决了这个困扰Blackwell GPU良率的问题;另一方面,AMD Instinct MI325X GPU作为相同架构升级的产品,性能提升只是体现在带宽上,这虽然能够提高集群的效率,但市场方面认为还不够,无法给英伟达造成更大的冲击。

另外,AMD并没有提到能耗的优势,这也是英伟达宣传Blackwell GPU的一个重点。该公司副总裁兼企业平台总经理Bob Pette在“AI Summit DC”人工智能峰会期间表示,Blackwell平台基本上是考虑到能效而构建的,在Blackwell上开发OpenAI的GPT-4软件需要3吉瓦(gigawatts)的电力,而十年前,这一过程需要高达5500吉瓦电力。

另外还有CUDA生态的问题,AMD公司也意识到了这一点,此前该公司将把面向消费者的RDNA和面向数据中心的CDNA架构统一为一种新的微架构UDNA。在2024年国际消费电子展(IFA 2024)上,AMD高级副总裁兼计算与图形事业部总经理Jack Huynh宣布了这一架构,代表了AMD在GPU领域的一次重要革新,但是要挑战英伟达的CUDA生态,还有很长的路要走。因此,AMD UDNA是一项长远的布局,也需要更多的时间兑现其潜力。

因此,在生态和制程并不占优的情况下,市场希望AMD能够在产品性能提升方面更加激进一些,但很显然AMD Instinct MI325X GPU没有达到人们的预期。因此,AMD Instinct MI325X GPU现在还很难成为Blackwell GPU的对手,但是能够在Blackwell GPU产能不足时,抢夺Hopper GPU的订单。

结语

实际上,在AMD Instinct MI325X GPU发布之前,市场面上已经开始为其造势了,AMD作为目前英伟达GPU头号挑战者,因此人们自然而然要去关注这款旗舰GPU。不过,作为同是CDNA 3架构下的产品,AMD Instinct MI325X GPU并没有达到市场设定的性能基准线。不过正如苏姿丰所言,数据中心加速器市场是非常庞大的,英伟达一家吃不下,那么外溢的订单就会流落到AMD等公司的手里,这个时间段AMD可以更沉下心来打磨应用和生态。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139021
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97669
  • AI芯片
    +关注

    关注

    17

    文章

    2063

    浏览量

    36567
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中国AI芯片市场:华为将占半壁江山,英伟跌落,这家第二

    2026年华为将占据中国AI芯片市场50%的份额,成为该领域的绝对领导者。   目前,英伟(NVIDIA)以39%的
    的头像 发表于 12-07 11:04 4829次阅读
    中国<b class='flag-5'>AI</b><b class='flag-5'>芯片</b><b class='flag-5'>市场</b>:华为将占半壁江山,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>跌落,这家第二

    性能狂飙!AMD新品叫板英伟GB200,角逐5000亿AI加速器赛道

    AMD线上会议截图 本次大会上,苏姿丰重点宣布了MI350 系列和 MI400 系列 AI 芯片的强大性能,她表示这些芯片将与
    的头像 发表于 06-14 00:44 6224次阅读
    <b class='flag-5'>性能</b>狂飙!<b class='flag-5'>AMD</b>新品叫板<b class='flag-5'>英伟</b><b class='flag-5'>达</b>GB<b class='flag-5'>200</b>,角逐5000亿<b class='flag-5'>AI</b>加速器赛道

    今日看点:马斯克:特斯拉已部署超百万颗 AI 芯片;长鑫存储发布全新 DDR5 内存新品

    美国考虑允许英伟对华出售H200芯片   据外媒报道,特朗普政府正考虑批准向中国出口美国芯片制造商英伟
    发表于 11-24 11:10 729次阅读

    英伟 Q3 狂揽 308 亿

    厂商季度合计 500 亿美元资本支出中,约 30% 流向了英伟。 新一代 Blackwell 芯片已全面投产,Q3 交付 1.3 万个 GPU 样品,H200 GPU 理论
    的头像 发表于 11-20 18:11 1056次阅读

    英伟被传暂停生产H20芯片 外交部回应

    韩国三星电子、美国安靠科技、富士康等关键零部件供应商。 据悉,美国安靠科技(Amkor)负责H20芯片的封装,而三星电子负责提供高带宽的内存芯片。 业界人士分析称,一方面英伟
    的头像 发表于 08-22 15:58 2574次阅读

    今日看点丨传英伟暂停为中国市场定制H20;估值10亿美元的Character.AI公司或将出售

    英伟 暂停为中国市场定制 H20 据《The Information》周四援引两位直接了解情况的人士的话报道称,英伟
    发表于 08-22 10:08 2577次阅读

    英伟黄仁勋:将向中国市场销售H20芯片 中国市场至关重要

    英伟CEO黄仁勋在北京访问期间发表声明称,将恢复在中国销售其H20 GPU芯片,并根据美国出口限制为中国市场推出一款新的GPU。
    的头像 发表于 07-15 14:32 1081次阅读

    今日看点丨英伟将为中国市场推出新AI芯片 售价大幅低于H20;中科曙光与海光信息宣布战略重组

    1. 英伟将为中国市场推出新AI 芯片 售价大幅低于H20   近日,外媒报道称,美国
    发表于 05-26 11:06 1576次阅读

    特朗普要叫停英伟对华特供版 英伟H20出口限制 或损失55亿美元

    是“中国特供版”人工智能芯片;是英伟公司为符合美国出口规定专门为中国市场开发的定制芯片H20
    的头像 发表于 04-16 16:59 1889次阅读

    新思科技携手英伟加速芯片设计,提升芯片电子设计自动化效率

    宣布在英伟 Grace Blackwell 平台上实现高达 30 倍的预期性能提升,加速下一代半导体的电路仿真   摘要: 在今年GTC主题演讲中,新思科技作为生态系统的一部分,展示
    发表于 03-19 17:59 437次阅读

    N1X 英伟Arm AI PC 芯片技术细节,性能表现

    以下是关于英伟与联发科合作开发的Arm架构AI PC芯片N1X的综合性分析,结合了技术细节、市场定位及行业影响等多维度信息:一、
    的头像 发表于 03-10 10:42 1880次阅读

    英伟杀疯了!Blackwell横扫市场AMD、英特尔加入降本浪潮

    。与此同时,随着AI大模型的普及,高计算量需求和成本压力也成为行业关注的焦点。如何在性能与成本之间找到平衡,成为整个AI芯片行业共同面临的挑战。AI
    的头像 发表于 03-02 00:02 2412次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>杀疯了!Blackwell横扫<b class='flag-5'>市场</b>,<b class='flag-5'>AMD</b>、英特尔加入降本浪潮

    GMI Cloud推出基于英伟H200的DeepSeek系列模型

    近日,GMI Cloud宣布成功上架了基于英伟H200 GPU的DeepSeek系列模型。这一举措标志着DeepSeek在AI应用领域迈出了重要一步。 自DeepSeek在GitHu
    的头像 发表于 02-08 09:41 756次阅读

    英伟推出GB200 NVL4芯片!液冷UQD快接头崛起

    中,英伟推出了全新的硬件产品——GB200 NVL4超级芯片。该芯片展现出了较为出色的性能表现
    的头像 发表于 01-10 16:58 1802次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>推出GB<b class='flag-5'>200</b> NVL4<b class='flag-5'>芯片</b>!液冷UQD快接头崛起

    一颗芯片面积顶4颗H200,博通推出3.5D XDSiP封装平台

    平方毫米的3D堆叠硅晶片和12个HBM模块集成到一个系统级封装中。这是什么概念?   目前手机移动端的旗舰处理器骁龙8Elite核心面积是124.1平方毫米;英伟H200核心面积1526平方毫米;今年
    的头像 发表于 12-10 09:15 3442次阅读
    一颗<b class='flag-5'>芯片</b>面积顶4颗<b class='flag-5'>H200</b>,博通推出3.5D XDSiP封装平台