0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD与Nvidia的人工智能芯片之战

SSDFans 来源:hpcwire 2024-01-16 11:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AMD和Nvidia陷入了一场人工智能性能之战——就像两家公司几十年来在游戏GPU性能上的竞争一样。

AMD声称其新的Instinct MI300X GPU是世界上最快的人工智能芯片,击败了Nvidia炙手可热的H100和即将推出的H200 GPU。AMDCEO Lisa Su最近在一个人工智能活动上发表演讲时表示:“这是世界上性能最高的生成式人工智能加速器。”

这标志着MI300X的正式推出,它是MI300A的一个更强大的版本,将用于Lawrence Livermore国家实验室建造的代号为El Capitan的200亿次超级计算机。

MI300X基于CDNA3架构,可为FP16和BFLoat16等关键AI数据类型提供三倍以上的性能。该芯片有1530亿个晶体管,采用3D封装;内部使用了5纳米和6纳米工艺制造的芯片模块。该芯片拥有304个GPU计算单元,192GB HBM3内存,5.3 TB/s内存带宽。

MI300X的峰值FP32性能为163.4 teraflops,峰值FP64性能为81.7 teraflops。上一代MI250X的峰值单精度(FP32)矢量和双精度(FP64)矢量性能为47.9 teraflops。AMD还将其芯片与H100的SXM版本进行了比较,Nvidia H100 SXM可提供68 teraflops的峰值FP32性能和34 teraflops的FP64性能。H100 NVL模型在性能上缩小了差距,可提供134teraflops的FP32性能和68teraflops的FP64性能。

Nvidia即将推出的H200是H100的内存升级版本,但内存和带宽仍然比MI300X少。H200的GPU内存为141GB,带宽为4.8TB/s。

“对于MI300X,我们增加了更大的灵活性、更大的内存容量和更大的带宽。这意味着它的内存容量是竞争对手的2.4倍,内存带宽是1.6倍。”Su将MI300X与Nvidia的H100 SXM型号进行了比较,后者具有80GB的HBM内存和3.35TB/s的内存带宽。two-pieceH100 NVL型号的HBM3内存为188GB,但内存带宽为7.8TB/s,超过了MI300X。

AMD能保持这个头衔多久还有待观察。Nvidia正计划对其芯片进行年度升级,新的B100 GPU将于2024年推出,X100 GPU将于2025年推出。

AMD在短短一年的时间里取得了长足的进步。一年前,当ChatGPT出现时,AMD措手不及。聊天机器人推动Nvidia成长为一家价值数万亿美元的公司,A100和H100 GPU成为最热门的科技资产。

GPT-4背后的Nvidia硬件凭借一己之力推动了人工智能的采用,并且仍然是无可争议的人工智能冠军。但Nvidia的硬件短缺促使客户寻找替代品,并为AMD提供了一个展示其最新GPU和系统的机会,成为一个可行的替代品。除了Nvidia,AMD在市场上也有很多机会。

Su表示:“我们现在预计,数据中心加速器TAM在未来四年中将以每年超过70%的速度增长,到2027年将超过4000亿美元。”

MI300X芯片有1530亿个晶体管,有12个5纳米和6纳米芯片。“它使用了世界上最先进的封装。”MI300X在基础层有四个IO芯片。每个IO芯片都有256兆字节的 Infinity Cache 和下一代IO,如128通道HBM3接口,支持PCIe Gen5,以及连接多个MI300X的第四代Infinity Fabric。该芯片在IO芯片上堆叠了8个CDNA3加速器小芯片。304个计算单元通过密集的TSV连接。支持高达每秒17TB的带宽。该芯片连接了8层HBM3,总共有192GB的内存和5.3 TB/s的带宽。

云供应商微软、甲骨文和Meta已经在他们的云基础设施中部署了MI300X GPU,尽管这些公司的人工智能能力主要还是来自Nvidia的芯片。提供人工智能替代方案的云供应商是很普遍的,如亚马逊提供了各种选择,包括其新发布的Trainium2芯片和英特尔的Gaudi处理器。其意图也很明确:让客户有更多的选择,不必屈服于NvidiaH100芯片的天价。

微软CEO Kevin Scott在AMD活动台上表示:“现在看到GPT-4在MI300X上的应用,看到Llama的表现,并让它投入生产,令人非常兴奋。”甲骨文云也将MI300X放入其云服务中。它还与Naveen Rao等早期采用者合作,后者的人工智能服务公司MosaicML最近被Databricks以13亿美元收购。

据HPCwire报道,一家新的云服务公司TensorWave将在2024年推出一种新的可扩展和适应性强的GPU架构。基于GigaIO FabreX可组合PCIe技术,TensorNODE系统将支持多达5,760个Instinct MI300X GPU,并为所有GPU提供单个FabreX内存结构域。

AMD紧随Nvidia的脚步,也宣布了自己的服务器架构,展示了一个兼容开放计算项目的服务器设计,其中包含8个MI300X GPU,这些GPU通过Infinity Fabric相互连接。该板可以放入任何兼容OCP的开放蓝图中,客户可以在其上构建服务器。

“我们这么做是经过深思熟虑的。我们想让客户尽可能容易地采用它,这样你就可以把主板拿出来,放入MI300X Instinct平台。”这样的系统建造起来会更便宜,让客户可以灵活地以最优惠的价格购买硬件。与Nvidia相比,这是一种截然不同的方法,Nvidia的HGX系统基于专有架构,成本很高。

AMD让MI300X兼容OCP的计划已经取得了成效,Meta快速部署了带有该GPU的服务器。Meta高级工程总监Ajit Mathews表示:“MI300X利用了OCP模块、标准和平台,这有助于我们极短的时间内采用它。事实上,MI300X是Meta历史上最快的部署解决方案之一。”

AMD对硬件的关注破坏了该公司的人工智能软件战略,该战略落后于提供CUDA开发框架的Nvidia。CUDA的支持帮助推动了NvidiaGPU的广泛采用。

该公司即将发布下一代ROCm 6,并声称具有新的功能和性能优势。开发者George Hotz曾批评AMD缺乏软件支持、文档以及对GPU开发者的支持回应。AMD总裁彭于平表示,与上一代版本相比,ROCm 6的MI300X性能提高了8倍。

对于具有700亿个参数的大型语言模型,ROCm6比MI300X快8倍,比MI250快8倍。ROCm 6框架将支持新的数据类型,包括FP16,这将提高性能并开放内存资源和带宽。该框架还将进行许多低层次优化,以获得更好的AI性能。

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5652

    浏览量

    139077
  • NVIDIA
    +关注

    关注

    14

    文章

    5509

    浏览量

    109145
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5110

    浏览量

    134510
  • 人工智能
    +关注

    关注

    1813

    文章

    49781

    浏览量

    261862
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10095

原文标题:AMD MI300X GPU能否击败Nvidia H200?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能+消费:技术赋能与芯片驱动未来

    电子发烧友网站提供《人工智能+消费:技术赋能与芯片驱动未来.pptx》资料免费下载
    发表于 11-26 14:50 4次下载

    AMD携全栈式AI解决方案亮相进博会,赋能人工智能+

    2025年11月5日,上海: 第八届中国国际进口博览会在上海正式启幕。作为全球高性能与自适应计算领导者,AMD连续五年亮相进博会。今年,以“AMD赋能人工智能+”为主题,AMD全面展示
    的头像 发表于 11-06 12:53 134次阅读
    <b class='flag-5'>AMD</b>携全栈式AI解决方案亮相进博会,赋能<b class='flag-5'>人工智能</b>+

    Lambda采用Supermicro NVIDIA Blackwell GPU服务器集群构建人工智能工厂

    大批量 Supermicro GPU 优化服务器(包括基于 NVIDIA Blackwell 的系统),以扩展其人工智能基础设施并向客户交付高性能计算系统。此次合作于今年 6 月率先在俄亥俄州哥伦布市的 Cologix COL4 ScalelogixSM 数据中心启动,为
    的头像 发表于 08-30 16:55 637次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:23

    关于人工智能处理器的11个误解

    应用,以及哪些是真实情况而哪些只是炒作,仍存在诸多误解。GPU是最佳的人工智能处理器尽管GPU在人工智能的实现过程中发挥了关键作用,而且如今它们的应用也极为广泛,但将其推
    的头像 发表于 08-07 13:21 898次阅读
    关于<b class='flag-5'>人工智能</b>处理器的11个误解

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍
    发表于 07-31 11:38

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    Cognizant将与NVIDIA合作部署神经人工智能平台,加速企业人工智能应用

    -Cognizant将与NVIDIA合作部署神经人工智能平台,加速企业人工智能应用 Cognizant将在关键增长领域提供解决方案,包括企业级AI智能体、定制化行业大型语言模型及搭载
    的头像 发表于 03-26 14:42 589次阅读
    Cognizant将与<b class='flag-5'>NVIDIA</b>合作部署神经<b class='flag-5'>人工智能</b>平台,加速企业<b class='flag-5'>人工智能</b>应用

    人工智能大模型年度发展趋势报告

    2024年12月的中央经济工作会议明确把开展“人工智能+”行动作为2025年要抓好的重点任务。当前,以大模型为代表的人工智能正快速演进,激发全球科技之变、产业之变、时代之变,人工智能发展迎来新高潮。随着大模型推理、多模
    的头像 发表于 02-13 10:57 1542次阅读
    <b class='flag-5'>人工智能</b>大模型年度发展趋势报告

    NVIDIA CES 2025汽车行业回顾

    NVIDIA 中国推出的人工智能类音频节目再次开讲啦,在这里,你将与 NVIDIA 共同见证人工智能的磅礴力量与无限可能!
    的头像 发表于 01-21 09:59 845次阅读

    Embarcadero:人工智能驱动发展我们的期望是什么

    发展的方向。 这是一张在simplified.com上,通过提示“屏幕上有人工智能的笔记本电脑”而生成的人工智能图像。这一实现令人印象深刻,但同样任重道远。图像和电影比文本更难处理。难度超过代码了吗? 当今的人工智能 在远程服务
    的头像 发表于 01-15 10:46 654次阅读

    荷兰与英伟达、AMD商讨共建人工智能设施

    荷兰政府正在积极寻求与全球领先的科技公司英伟达和AMD的合作,共同推动荷兰人工智能设施的建设与发展。 据荷兰政府官方网站的消息,荷兰经济事务大臣迪尔克·贝尔亚尔茨于近日对美国硅谷进行了访问,期间
    的头像 发表于 01-10 13:36 1027次阅读

    人工智能推理及神经处理的未来

    、个性化和效率的社会需求,又进一步推动了人工智能技术的集成。此外,不断发展的监管体系,则强调了合乎伦理道德的人工智能、数据隐私和算法透明度的重要性,进而指导人工
    的头像 发表于 12-23 11:18 880次阅读
    <b class='flag-5'>人工智能</b>推理及神经处理的未来