0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD正式发布了新一代Instinct MI100计算卡

lhl545545 来源:快科技 作者:上方文Q 2020-11-18 10:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

昨日晚间,AMD正式发布了新一代Instinct MI100计算卡,首次采用针对HPC高性能计算、AI人工智能全新设计的CDNA架构,和游戏向的RDNA架构截然不同。

Instinct MI100计算卡采用台积电7nm工艺制造,集成120个计算单元、7680个流处理器,核心频率最高1502MHz,并专门加入了Matrix Core(矩阵核心),用于加速HPC、AI运算。

它整合封装了32GB HBM2显存,位宽4096-bit,频率1.2GHz,带宽1228.8GB/s,支持ECC。

该卡支持PCIe 4.0 x16,具备三条Infinity Fabric互连总线,峰值带宽92GB/s,整卡热设计功耗300W,双8针辅助供电。

这块卡的特殊之处还在于顶部设置了桥接金手指,通过桥接器可以将四块卡绑定在一起,而搭配双路的AMD霄龙处理器,可以实现八卡并行。

类似之前的计算卡,甚至是R9 Fury X、Vega 64/56这样的游戏卡,Instinct MI110也是将GPU芯片、HBM芯片整合封装在了一起,不过如今的HBM2单颗容量已达8GB。

对比CDNA(上)、RDNA(下)架构图,可以发现二者整体框架有些相似之处,但各种单元模块和布局已经截然不同。

Infinity Fabric互连总线、显存控制器、PCIe 4.0控制器、多媒体引擎、着色器引擎、ACE异步计算引擎等等都还在(当然也不完全一样了),而和图形渲染输出相关的都没了,比如图形指令处理器、几何处理器、光栅器、显示引擎、原语单元等等,同时增加了XGMI连接控制器用于多卡互连,一二级缓存也完全不同。

作为AMD GPU的最基本模块,计算单元(CU)也完全不同了,现在叫做增强型计算单元(XCU),组成模块包括调度器、分支与信息单元、12.8KB ECC标量单元、512KB ECC标量寄存器、矢量寄存器、矢量ALU操作单元、矩阵数据操作单元、四个矢量/矩阵SIMD单元、64KB ECC本地数据共享单元、载入/存储单元、16KB ECC一级缓存等等。

显然,这一些都是为计算服务的,而用于图形的着色器、纹理相关单元自然都不见了,即便有些单元名字一样,规格和作用也不同了。

计算性能方面,FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次),FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次),FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次),FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次),Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。

这样的一块卡,已经相当于20年前的世界顶级超级计算机,而体积、功耗都不可同日而语。

对比NVIDIA安培架构的最新计算卡A100,AMD也给出了一些对比数据,FP32单精度性能领先18.5%,FP64双精度性能领先18.6%,AI与机器学习性能更是领先两倍多,而且功耗低了足足100W。

而对比上代产品MI50,新卡的FP64双精度、FP32单精度性能均提升74%,FP32矩阵性能提升接近2.5倍,AI负载性能更是几乎7倍的飞跃。

当然,除了纸面计算性能优秀,软件开发也必须跟上,尤其是这种计算性的产品。NVIDIA在这方面要强得多,生态更加稳固和丰富,AMD ROCm平台正在奋起直追中。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5649

    浏览量

    139043
  • AI
    AI
    +关注

    关注

    89

    文章

    38170

    浏览量

    296869
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261624
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    福田汽车发布新一代产品Wonder Plus

    在11月9日举行的福田汽车2026全球合作伙伴大会上,福田汽车正式面向全球市场发布新一代产品——Wonder Plus。面对全球不同末端配送市场的升级需求,以“超配”的产品理念
    的头像 发表于 11-18 09:39 327次阅读

    中科驭数亮相2025新一代计算产业大会

    经济时代计算产业的标准化建设与技术创新,不仅发布核心标准体系,更明确各关键领域的牵头单位,为我国新一代计算产业高质量发展奠定坚实基础。
    的头像 发表于 09-26 11:14 532次阅读

    腾讯发布新一代智能驾驶地图9.0

    9月16-17日,2025腾讯全球数字生态大会在深圳举行。会议期间,腾讯正式发布新一代智能驾驶地图9.0。
    的头像 发表于 09-18 10:23 1287次阅读

    新一代嵌入式开发平台 AMD嵌入式软件和工具2025.1版现已推出

    AMD 2025.1 版嵌入式软件和工具是面向新一代嵌入式系统开发而打造的综合平台,全面加速概念构想到部署落地。 2025.1 版嵌入式软件和工具的新 增功能 AMD 嵌入式开发框架( EDF
    的头像 发表于 08-20 09:15 3638次阅读

    重磅!AMD将恢复向中国出口MI308芯片!

    出货。” 此前美国政府针对Instinct MI308产品出货至中国进行出口管制,该产品与英伟达H20样禁止向中国销售。   如今,MI308也将恢复供货,以满足国内AI基础设施建设
    的头像 发表于 07-15 20:52 3129次阅读

    德州仪器与库发布新一代工业机器人控制器

    在今年慕尼黑上海电子展期间,德州仪器 (TI) 与美的集团旗下库(后简称“库”)合作发布新一代工业机器人控制器 KR C5 micro
    的头像 发表于 04-18 14:34 1166次阅读

    曦智科技全球首发新一代光电混合计算

    2025年3月25日,曦智科技正式发布全新光电混合计算“曦智天枢”。曦智科技创始人兼首席执行官沈亦晨博士在发布现场表示:“曦智天枢首次实现
    发表于 03-25 15:43 477次阅读
    曦智科技全球首发<b class='flag-5'>新一代</b>光电混合<b class='flag-5'>计算</b><b class='flag-5'>卡</b>

    宝马发布新一代智能电子电气架构

    高速数据传输,为车辆带来数字化神经系统 慕尼黑2025年3月13日 /美通社/ -- 宝马发布新一代智能电子电气架构,该架构是全球首个覆盖全动力系统和全细分车型的架构,该架构更智能、更强大、更高效。全新电子电气架构支持AI用户体验和场景,
    的头像 发表于 03-13 15:42 554次阅读

    新思科技推出基于AMD芯片的新一代原型验证系统

    近日,新思科技宣布推出全新基于AMD Versal™ Premium VP1902自适应系统级芯片(SoC)的HAPS®原型验证系统,以此进步升级其硬件辅助验证(HAV)产品组合。 此次推出的全新一代
    的头像 发表于 02-19 17:12 1155次阅读

    武汉昊衡科技发布新一代OFDR高性能分布式光纤传感仪:突破100米测量距离与100Hz高频采样

    近日,中国武汉——国内光学测量与传感技术领军企业武汉昊衡科技有限公司(以下简称“昊衡科技”)正式发布新一代OFDR(光频域反射)高性能分布式光纤传感仪。该产品在保持超高精度与分辨率的基础上,实现
    的头像 发表于 02-13 18:04 1099次阅读
    武汉昊衡科技<b class='flag-5'>发布</b><b class='flag-5'>新一代</b>OFDR高性能分布式光纤传感仪:突破<b class='flag-5'>100</b>米测量距离与<b class='flag-5'>100</b>Hz高频采样

    AMD将DeepSeek-V3模型集成至Instinct MI300X GPU

    AMD近日宣布项重要进展,成功将全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。这
    的头像 发表于 02-06 09:41 814次阅读

    消息称AMD Instinct MI400 AI加速器将配备8个计算芯片

    对比,目前的 MI300 系列加速器中每个 AID 仅包含 2 个加速计算芯片 ,MI400 在芯片数量上实现翻倍。如此来,
    的头像 发表于 02-05 15:07 1385次阅读

    AMD集成DeepSeek-V3模型至Instinct MI300X GPU

    AMD近日宣布项重要的技术进展,即将全新的DeepSeek-V3模型成功集成到其旗舰级GPU产品——Instinct MI300X上。这
    的头像 发表于 02-05 13:58 784次阅读

    AMD MI300X AI芯片面临挑战

    力不从心。 Semianalysis的报告详细阐述AMD所面临的问题。报告指出,由于AMD的软件存在显著缺陷,若未经过大量的调试和优化,使用MI300X进行AI模型的训练几乎是不可能
    的头像 发表于 12-25 10:57 1128次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的GPU不能在单个主机系统中组合使用。 - AMD GPU:目前只有时域求解器(FIT)支持AMD GPU,如Instinct MI 210、Radeon VII等,并给出了相关规格
    发表于 12-16 14:25