0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD两大高性能 AI 芯片正式出货,剑指英伟达 H100

E4Life 来源:电子发烧友网 作者:周凯扬 2023-12-08 00:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)近日 AMD 举办了Advancing AI大会,除了发布全新的锐龙 8040系列 AI PC 芯片以外,也终于宣布了 MI300X GPU以及 MI300A APU这两大 AI 计算重磅新品的出货。

顶级 AI 计算 GPU MI300X

作为全新 CDNA3架构打造的 AI 加速器,MI300X 的配置可谓豪华,8 组 XCD 共 304 个 CDNA 单元,加上带宽高达 5.3TB/s 的 192GB显存。相对上一代 MI250X 而言,计算单元多了接近 40%,内存容量增至 1.5 倍,理论带宽更是提升至 1.7 倍,同时引入了对 FP8和稀疏计算的支持。

AMD 也在实际用例上与英伟达的 H100 进行了对比,在运行 1760亿参数的 BLOOM 大语言模型推理时,其吞吐量可达后者的 1.6 倍。且单块 MI300X就能运行像 Llama2 这样 700 亿参数的大模型,简化了企业级 LLM 部署的同时,提供了极致的 TCO 性价比。

首个数据中心 APU 出炉

随着英伟达开始针对数据中心推出 Grace Hopper Superchip 这样的 CPU+GPU 打包方案,AMD 这个早在消费级产品上这么干的公司自然也察觉到了个中机遇。于是在本次大会上,AMD 终于宣布首个数据中心 APU,MI300A开始出货。

在 3D 封装技术和 AMD Infinity 架构的支持下,MI300A将 CDNA 3架构的 GPU 核心、Zen 4 架构的 CPU 核心以及 128GB 的 HBM3 内存集成在一起。同样是与 MI250X相比,其在HPC和 AI 负载的 FP32计算上,能耗比近乎翻倍。

得益于统一的内存和缓存,CPU、GPU 与 HBM 之间的数据传输延迟大大降低,且均可享受超大的带宽,无论是在极限性能还是在功耗分配上,都能提供好于独立方案的表现。

软件同样迎来大幅升级

而此次 Advancing AI大会上,AMD不仅对硬件进行了更新,也对其软件进行了更新,RoCm 这一并行计算框架迎来了第六版,这一版本主要对 AMD 的 Instinct 系列 GPU在生成式 AI 的大语言模型上进行了优化。

作为 AMD 对英伟达的 CUDA 做出的对策方案,ROCm这几年来已经逐步完善,甚至可以说在开发支持程度上毫不逊色于 CUDA。此次更新不仅增加对新数据类型的支持,还引入了高级图形和内核优化、库优化以及最先进的注意力机制算法。以文本生成这一任务为例,与在 MI250 上运行的 ROCm 5 相比,性能提升显著,总体延迟改善了 8 倍左右。

更重要的是,这次 OpenAI 也来掺了一脚,OpenAI 宣布他们会在 Triton 3.0 上加入对 AMD Instinct 的支持。Triton是一个类Python 的开源编程语言,允许开发者在没有 CUDA 开发经验的情况下也能写出高效的 GPU 代码,可以视为 CUDA 的精简版。而在最新的Triton 3.0,可以说 AMD 的Instinct硬件平台获得了开箱即用的支持。

其实这次合作早有预示,几个月前Triton就开始合并 ROCm 的代码,此前也宣布过增加AMD Instinct以及英特尔XPU 的支持。不过目前 Instinct平台的ROCm 还是以 Linux 开发为重点,Radeon 平台的ROCm 则主要集中在对 Windows 的支持上。

写在最后

这次Advancing AI大会象征了 AMD 对 明年 AI 市场的野心,也难怪 AMD 会将今年数据中心 AI 芯片的市场规模从 6 月份的 300 亿美元提高至 450 亿美元。未来的MI300X很有可能成为英伟达 H100 最强劲的对手,也有可能成为云服务厂商竞相追逐的新计算卡。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    138998
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296328
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    性能狂飙!AMD新品叫板英伟GB200,角逐5000亿AI加速器赛道

    AMD线上会议截图 本次大会上,苏姿丰重点宣布了MI350 系列和 MI400 系列 AI 芯片的强大性能,她表示这些芯片将与
    的头像 发表于 06-14 00:44 6219次阅读
    <b class='flag-5'>性能</b>狂飙!<b class='flag-5'>AMD</b>新品叫板<b class='flag-5'>英伟</b><b class='flag-5'>达</b>GB200,角逐5000亿<b class='flag-5'>AI</b>加速器赛道

    英伟 Q3 狂揽 308 亿

    厂商季度合计 500 亿美元资本支出中,约 30% 流向了英伟。 新一代 Blackwell 芯片已全面投产,Q3 交付 1.3 万个 GPU 样品,H200 GPU 理论
    的头像 发表于 11-20 18:11 1055次阅读

    英伟 H100 GPU 掉卡?做好这五点,让算力稳如泰山!

    H100服务器停工一天损失的算力成本可能比维修费还高。今天,我们给大家总结一套“防掉卡秘籍”,从日常管理到环境把控,手把手教你把掉卡风险压到最低。一、供电是“生命线”,这3点必须盯紧H100满载功耗
    的头像 发表于 09-05 11:03 709次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b> <b class='flag-5'>H100</b> GPU 掉卡?做好这五点,让算力稳如泰山!

    英伟被传暂停生产H20芯片 外交部回应

    韩国三星电子、美国安靠科技、富士康等关键零部件供应商。 据悉,美国安靠科技(Amkor)负责H20芯片的封装,而三星电子负责提供高带宽的内存芯片。 业界人士分析称,一方面英伟
    的头像 发表于 08-22 15:58 2562次阅读

    外媒:英伟正开发新款中国特供芯片B30A 或为旗舰AI芯品B300的阉割版

    我们看到英伟的旗舰新品 B300备受关注;但是受限于美国实施出口限制措施,英伟不会出货,就像此前英伟
    的头像 发表于 08-20 15:19 3099次阅读
    外媒:<b class='flag-5'>英伟</b><b class='flag-5'>达</b>正开发新款中国特供<b class='flag-5'>芯片</b>B30A 或为旗舰<b class='flag-5'>AI</b>芯品B300的阉割版

    H20中国区卖爆!英伟紧急向台积电加订30万块

    性能上相当于英伟另一款主流GPU芯片H100的20%左右。   尽管如此,在美国解禁对H20
    的头像 发表于 07-30 08:08 2998次阅读

    中方回应英伟将对华销售H20芯片 反对将科技和经贸问题政治化

    对于英伟将对华销售H20芯片我们怎么回应的?来看看外交部发言人的表述。 在15日的例行记者会上,有记者就英伟
    的头像 发表于 07-15 16:22 2039次阅读

    刚刚,英伟任命位新首席研究科学家!95 后,本科均来自清华

    ABSTRACT摘要英伟黄仁勋亲自招揽位95后华人AI大牛加入英伟,为加速
    的头像 发表于 07-01 18:06 1478次阅读
    刚刚,<b class='flag-5'>英伟</b><b class='flag-5'>达</b>任命<b class='flag-5'>两</b>位新首席研究科学家!95 后,本科均来自清华

    今日看点丨英伟将为中国市场推出新AI芯片 售价大幅低于H20;中科曙光与海光信息宣布战略重组

    1. 英伟将为中国市场推出新AI 芯片 售价大幅低于H20   近日,外媒报道称,美国芯片巨头
    发表于 05-26 11:06 1574次阅读

    GPU 维修干货 | 英伟 GPU H100 常见故障有哪些?

    上涨,英伟H100GPU凭借其强大的算力,成为AI训练、高性能计算领域的核心硬件。然而,随着使用场景的复杂化,
    的头像 发表于 05-05 09:03 2445次阅读
    GPU 维修干货 | <b class='flag-5'>英伟</b><b class='flag-5'>达</b> GPU <b class='flag-5'>H100</b> 常见故障有哪些?

    特朗普要叫停英伟对华特供版 英伟H20出口限制 或损失55亿美元

    是“中国特供版”人工智能芯片;是英伟公司为符合美国出口规定专门为中国市场开发的定制芯片H20芯片
    的头像 发表于 04-16 16:59 1884次阅读

    英伟杀疯了!Blackwell横扫市场,AMD、英特尔加入降本浪潮

    。与此同时,随着AI大模型的普及,高计算量需求和成本压力也成为行业关注的焦点。如何在性能与成本之间找到平衡,成为整个AI芯片行业共同面临的挑战。AI
    的头像 发表于 03-02 00:02 2407次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>杀疯了!Blackwell横扫市场,<b class='flag-5'>AMD</b>、英特尔加入降本浪潮

    英伟A100H100比较

    英伟A100H100都是针对高性能计算和人工智能任务设计的GPU,但在性能和特性上存在显著差
    的头像 发表于 02-10 17:05 1.1w次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b>A<b class='flag-5'>100</b>和<b class='flag-5'>H100</b>比较

    荷兰与英伟AMD商讨AI设施建设

    近日,荷兰政府在其官方网站上发布消息称,荷兰经济事务大臣迪尔克·贝尔亚尔茨在访问硅谷期间,与英伟AMD两大科技公司进行了深入的战略讨论。此次访问时间为1月8日至1月9日,旨在探讨如
    的头像 发表于 01-13 10:06 695次阅读

    英伟收购AI初创公司Run:ai

    :ai作为一家专注于AI云计算软件平台开发的初创公司,其产品以高效利用高性能GPU资源为核心,致力于为用户提供更快速、更便捷的机器学习加速方案。通过此次收购,英伟
    的头像 发表于 12-31 10:46 858次阅读