0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

击碎摩尔定律!英伟达和AMD将一年一款新品,均提及HBM和先进封装

Felix分析 来源:电子发烧友 作者:吴子鹏 2024-06-04 00:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)摩尔定律是由英特尔创始人之一戈登·摩尔提出的经验规律,描述了集成电路上的晶体管数量和性能随时间的增长趋势。根据摩尔定律,集成电路上可容纳的晶体管数目约每隔18个月便会增加一倍,性能也将提升一倍。过去很长一段时间,摩尔定律被认为是全球半导体产业进步的基石。如今,这一定律已经逐渐失效,延续摩尔和超越摩尔路线纷纷出现。

6月2日晚间,英伟达创始人兼首席执行官黄仁勋在台北国际电脑展(COMPUTEX)开幕前发表主题演讲。他直言,英伟达承诺将以“一年一代”的节奏推出新的AI芯片。这一速度将明显超越摩尔定律,因为英伟达每一代AI芯片的发布,相较于上一代,都能够带来数倍的性能提升。

wKgZomZdle6AW_nFAAczeJRSA2A115.png

随后在6月3日,AMD首席执行官苏姿丰在主题演讲中同样表示,AMD将于2025年推出MI350系列,再过一年会推出MI400。大约一年发布一款的速度与英伟达的计划看齐。

一年一平台,一年一产品

在演讲中,黄仁勋透露了英伟达后续两年的平台路线,2025年英伟达AI芯片将基于Blackwell Ultra平台,2026年是Rubin平台,2027年则是Rubin Ultra平台。

今年GTC大会上,英伟达发布了新一代的GPU架构平台Blackwell和B200芯片产品。从架构来看,Blackwell架构用于数据中心,针对当前火爆的AI大模型优化,训练、推理性能和能效均大幅提升。基于Blackwell架构,英伟达B200芯片由两个超大型Die封装而成,内含超过2080亿个晶体管,是前一代800亿个晶体管的两倍以上,推理速度提升30倍以上,成本和能耗降低高达25倍。

黄仁勋表示,“Blackwell计算能力的增长是惊人的。但更重要的是,每当我们的计算能力提高时,成本却在不断下降。基于Blackwell平台的芯片,用于训练GPT-4模型(2万亿参数和8万亿Token)的能量下降了350倍。”

同时,黄仁勋称,Blackwell芯片现已开始生产。不过,根据产业界的消息,量产上市的Blackwell芯片并不便宜,汇丰银行分析师透露的数据显示,GB200 NVL36/NVL72计算平台的定价分别为180万美元和300万美元,GB200的定价为6万至7万美元,B100的定价为3万至3.5万美元。

不过,黄仁勋依旧是相同的观点:英伟达的芯片,买得越多就会越便宜!

wKgaomZdlf-AEKHuAAcpP8TuQ4Q906.png

按照英伟达的规划,2025年该公司将推出Blackwell Ultra AI芯片,将继续引领全球AI 芯片的发展。和Blackwell Ultra平台一起发布的还有下一代频谱交换机

然后到2026年,英伟达将推出Rubin架构,2027年推出Rubin Ultra AI芯片。虽然Ultra可能只是扩展,不过就像这个词所代表的意思,预计英伟达将会在Ultra代上显著增加芯片的规模和能力。

和英伟达一样,AMD虽然加快了创新速度,但是创新质量却很有保障。AMD将于今年推出采用第四代高带宽内存(HBM)HBM3E的MI 325X芯片,内存带宽提高一倍,效能提升1.3倍。明年推出的MI 350X将会采用3nm工艺基于CDNA 4架构,预计同系列性能增幅将创造AMD历史之最。

HBM芯片和先进封装成为革新要点

既然英伟达和AMD的AI芯片迭代已经在速度上超越了摩尔定律,也就代表着先进制程对于英伟达AI芯片有用,但又不是那么有用。能够实现如此巨大的性能飞跃,有两点是非常重要的:HBM显存和先进封装,前者突破了传输的限制,后者让芯片规模超越了制程。无论是黄仁勋和苏姿丰的演讲,还是两家公司近来的动作都体现了这一点。

上文提到,AMD将会在MI 325X芯片中使用HBM3E。根据黄仁勋的描述,英伟达将会在Rubin架构产品上首次支持8层HBM4高带宽存储,随后在Rubin Ultra AI芯片上升级为12层HBM4。SK海力士总裁兼AI基础设施负责人Justin Kim表示,该公司计划和台积电合作,采用台积电的先进封装技术,以打造出业界性能最佳的HBM4。

此前,作为AI芯片里HBM内存的主要供应商,SK海力士基本是采用专有的技术。据悉,SK海力士已使用专有技术制造高达HBM3E的基础芯片。从技术细节来看,以硅通孔技术(TSV:Through Silicon Via)、批量回流模制底部填充(MR-MUF:Mass Reflow-Molded Underfill)先进封装工艺作为核心技术,通过MR-MUF技术,SK海力士能打造出性能稳定且层数领先的HBM内存。

如果SK海力士也采用台积电的先进封装,那么将有助于英伟达和AMD的AI芯片更好地融合HBM4内存。根据台湾媒体此前的报道,英伟达、AMD 两家公司包下台积电今明两年CoWoS与SoIC先进封装产能。英伟达目前的主力产品H100芯片主要采用台积电4纳米制程和CoWoS先进封装,与SK海力士的高带宽内存(HBM)以2.5D封装形式提供给客户。目前,英伟达芯片主要采用的CoWoS技术具备提供更高的存储容量和带宽的优势,是目前高端先进封装的主流方案。

将InfiniBand的性能带到以太网架构中

除了平台和芯片的剧透以外,此次英伟达黄仁勋演讲还有一则值得关注的消息,那就是InfiniBand和以太网的融合。从生态来说,CUDA、NVLink和InfiniBand等多项私有方案的存在,也是英伟达和AMD等其他公司最明显的不同,如今看来InfiniBand将率先拥抱开放。

英伟达的InfiniBand是一种高速网络和输入/输出(I/O)技术,旨在连接数据中心和高性能计算(HPC)环境中的服务器、存储系统和其他计算设备,具有低延迟、高带宽、可扩展和高可靠等优势。以太网则是一种广泛用于局域网(LAN)的技术,基于IEEE 802.3以太网网络标准,具有简单性、灵活性和可扩展性。

可以说InfiniBand是英伟达专门为机器间信息传输打造的私有协议,属于三类RDMA网络其中之一,另外两个是RoCE、iWARP。目前,英伟达已经在先进的芯片、超级计算架构和复杂的交换机方面形成产品体系,因此InfiniBand具有很高的价值。英伟达的InfiniBand技术来自迈络思(Mellanox ),后者于2020年4月被英伟达收购。目前,英伟达提供全面的InfiniBand系统,包括InfiniBand交换机、InfiniBand网卡、InfiniBand以太网网关、InfiniBand线缆和光模块、InfiniBand遥测和软件管理以及InfiniBand加速软件。目前,QUANTUM QM8700交换机单通道速度可达200Gb/s,整机的传输速度可达16Tb/s。

虽然InfiniBand技术性能强大,但是其兼容性并不好,以英伟达AI设备为主体的计算平台很难融入其他的设备,这让高性能计算的用户很困扰,他们希望英伟达能够支持更通用的协议——以太网。

目前,以太网技术已经支持RDMA,但是只限于RoCE和iWARP。就像黄仁勋所言,InfiniBand想要和以太网融合并不容易。在协议栈方面,InfiniBand 拥有自己定义的1-4层格式(物理层、链路层、传输层和网络层),是一个完整的网络协议,这些核心底层和以太网存在很大的差异,两者的融合确实不易。

不过,受迫于客户方的压力,英伟达也在努力推进支持InfiniBand的以太网技术的发展,比如 Spectrum X。英伟达Spectrum以太网是一个端到端平台,包括交换机、DPU、SmartNIC、线缆、收发器和网络软件。目前,英伟达以太网交换机系列包括涵盖1GbE至800GbE的全面交换机和软件产品组合。英伟达首席财务官Collette Kress此前表示,“Spectrum-X的销量正在不断增长,客户包括多个客户,其中包括一个拥有100,000个GPU的大型集群,Spectrum-X为英伟达网络开辟了一个全新的市场,并使以太网数据中心能够容纳大规模 AI。我们预计Spectrum-X将在一年内跃升至数十亿美元的产品线。”

对于InfiniBand和以太网的融合,黄仁勋介绍称,英伟达的策略是将InfiniBand的性能带到以太网架构中,“我们关注的焦点并非平均吞吐量,而是确保最后一个数据包能够准时、无误地抵达。然而,传统的以太网并未针对这种高度同步化、低延迟的需求进行优化。为了满足这一需求,我们创造性地设计了一个端到端的架构,使NIC(网络接口卡)和交换机能够通信。”

结语

过去很多年,摩尔定律都是芯片性能提升的主要手段,最新的工艺也会和顶级的芯片产品挂钩。然而,随着摩尔定律逐渐放缓和失效,目前英伟达和AMD等头部厂商已经摸索出一条自己的更新路径,这条路径里工艺制程只是助力之一,更多源于HBM技术和异构集成的系统级创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5707

    浏览量

    140395
  • 摩尔定律
    +关注

    关注

    4

    文章

    640

    浏览量

    81146
  • 英伟达
    +关注

    关注

    23

    文章

    4115

    浏览量

    99603
  • HBM
    HBM
    +关注

    关注

    2

    文章

    432

    浏览量

    15880
  • 先进封装
    +关注

    关注

    2

    文章

    561

    浏览量

    1058
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产GPU再下城,群起突围英伟+AMD

    上市。   根据Jon Peddie Research的数据,独立GPU市场英伟家独大,近年来持续维持超80%的市场份额,而AMD公司则占据剩余近20%的市场份额。自人工智能市场爆
    的头像 发表于 07-07 08:59 7518次阅读
    国产GPU再下<b class='flag-5'>一</b>城,群起突围<b class='flag-5'>英伟</b><b class='flag-5'>达</b>+<b class='flag-5'>AMD</b>

    封测巨头全球“圈地”,先进封装正成为AI时代的战略制高点

    2026全球半导体封测巨头密集扩产,日月光六厂同步动工、三星越南投建封测厂,先进封装突破摩尔定律瓶颈,成AI算力竞赛关键,解析行业扩产趋势与技术难题。
    的头像 发表于 04-15 14:03 675次阅读

    消息称英伟HBM4订单两家七三分,独缺这

    据韩媒报道,三星电子决定最早于本月第三周开始量产HBM4,这批产品将用于英伟代人工智能计算平台“Vera Rubin”。英伟
    的头像 发表于 02-11 10:27 1670次阅读

    携手伏半导体:RedPKG解决方案助力封装自主,加速产品创新

    伴随摩尔定律逐步放缓,后摩尔时代正式来临,半导体产业的技术创新重心向封装领域持续倾斜。因此,在追求高效与自主的半导体产业浪潮中,封装已成为连接芯片设计与终端市场的关键桥梁。掌握
    的头像 发表于 01-28 18:04 236次阅读
    携手伏<b class='flag-5'>达</b>半导体:RedPKG解决方案助力<b class='flag-5'>封装</b>自主,加速产品创新

    美光确认HBM4将在2026Q2量产

    20亿美元,化营收80亿美元,计划2026HBM相关资本开支提升至总投入的35%,用于先进
    的头像 发表于 09-26 16:42 2373次阅读

    英伟代Rubin芯片已流片

    为进入市场做准备,Rubin架构将会有6个芯片,这些芯片都已经流片。这消息在半导体和人工智能领域引起了广泛关注,预示着英伟在芯片技术上的又次重大飞跃。 ​ Rubin芯片采用
    的头像 发表于 09-12 17:15 2019次阅读

    传三星 HBM4 通过英伟认证,量产在即

    开始实现大规模生产。这进展将使得三星参与到下阶段HBM订单的有力竞争。   三星还在HBM3E上提供了非常具有吸引力的报价,传闻向英伟
    的头像 发表于 08-23 00:28 7829次阅读

    借助AMD无顶盖封装技术应对散热挑战

    随着电子行业向更小节点迈进,现代应用要求更高的时钟速率和性能。2014 ,斯坦福大学教授 Mark Horowitz 发表了篇开创性的论文,描述半导体行业面临相关登纳德缩放及摩尔定律失效的挑战
    的头像 发表于 08-21 09:07 1055次阅读

    英伟自研HBM基础裸片

    电子发烧友网综合报道,据台媒消息,传闻英伟已开始开发自己的HBM基础裸片,预计英伟的自研HBM
    的头像 发表于 08-21 08:16 3012次阅读

    AI狂飙, FPGA会掉队吗? (上)

    摩尔定律说,集成电路上的晶体管数量大约每两番。随着晶体管尺寸接近物理极限,摩尔定律的原始含义已不再适用,但计算能力的提升并没有停止。英伟
    的头像 发表于 08-07 09:03 1514次阅读
    AI狂飙, FPGA会掉队吗? (上)

    先进封装转接板的典型结构和分类

    摩尔定律精准预言了近几十集成电路的发展。然而,逐渐逼近的物理极限、更高的性能需求和不再经济的工艺制程,已引发整个半导体行业重新考虑集成工艺方法和系统缩放策略,意味着集成电路产业已经步入后摩尔时代。
    的头像 发表于 08-05 14:59 3141次阅读
    <b class='flag-5'>先进</b><b class='flag-5'>封装</b>转接板的典型结构和分类

    晶心科技:摩尔定律放缓,RISC-V在高性能计算的重要性突显

    运算还是快速高频处理计算数据,或是超级电脑,只要设计或计算系统符合三项之即可称之为HPC。 摩尔定律走过数十,从1970代开始,世界领导厂商建立晶圆厂、提供制程工艺,在28nm之
    的头像 发表于 07-18 11:13 4489次阅读
    晶心科技:<b class='flag-5'>摩尔定律</b>放缓,RISC-V在高性能计算的重要性突显

    突破!华为先进封装技术揭开神秘面纱

    在半导体行业,芯片制造工艺的发展逐渐逼近物理极限,摩尔定律的推进愈发艰难。在此背景下,先进封装技术成为提升芯片性能、实现系统集成的关键路径,成为全球科技企业角逐的新战场。近期,华为的先进
    的头像 发表于 06-19 11:28 1944次阅读

    电力电子中的“摩尔定律”(1)

    本文是第二届电力电子科普征文大赛的获奖作品,来自上海科技大学刘赜源的投稿。著名的摩尔定律中指出,集成电路每过定时间就会性能翻倍,成本减半。那么电力电子当中是否也存在着摩尔定律呢?1965
    的头像 发表于 05-10 08:32 989次阅读
    电力电子中的“<b class='flag-5'>摩尔定律</b>”(1)

    玻璃基板在芯片封装中的应用

    上升,摩尔定律的延续面临巨大挑战。例如,从22纳米工艺制程开始,每代技术的设计成本增加超过50%,3纳米工艺的总设计成本更是高达15亿美元。此外,晶体管成本缩放规律在28纳米制程后已经停滞。
    的头像 发表于 04-23 11:53 3655次阅读
    玻璃基板在芯片<b class='flag-5'>封装</b>中的应用