0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD正式发布了新一代Instinct MI100计算卡

lhl545545 来源:快科技 作者:上方文Q 2020-11-18 10:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

昨日晚间,AMD正式发布了新一代Instinct MI100计算卡,首次采用针对HPC高性能计算、AI人工智能全新设计的CDNA架构,和游戏向的RDNA架构截然不同。

Instinct MI100计算卡采用台积电7nm工艺制造,集成120个计算单元、7680个流处理器,核心频率最高1502MHz,并专门加入了Matrix Core(矩阵核心),用于加速HPC、AI运算。

它整合封装了32GB HBM2显存,位宽4096-bit,频率1.2GHz,带宽1228.8GB/s,支持ECC。

该卡支持PCIe 4.0 x16,具备三条Infinity Fabric互连总线,峰值带宽92GB/s,整卡热设计功耗300W,双8针辅助供电。

这块卡的特殊之处还在于顶部设置了桥接金手指,通过桥接器可以将四块卡绑定在一起,而搭配双路的AMD霄龙处理器,可以实现八卡并行。

类似之前的计算卡,甚至是R9 Fury X、Vega 64/56这样的游戏卡,Instinct MI110也是将GPU芯片、HBM芯片整合封装在了一起,不过如今的HBM2单颗容量已达8GB。

对比CDNA(上)、RDNA(下)架构图,可以发现二者整体框架有些相似之处,但各种单元模块和布局已经截然不同。

Infinity Fabric互连总线、显存控制器、PCIe 4.0控制器、多媒体引擎、着色器引擎、ACE异步计算引擎等等都还在(当然也不完全一样了),而和图形渲染输出相关的都没了,比如图形指令处理器、几何处理器、光栅器、显示引擎、原语单元等等,同时增加了XGMI连接控制器用于多卡互连,一二级缓存也完全不同。

作为AMD GPU的最基本模块,计算单元(CU)也完全不同了,现在叫做增强型计算单元(XCU),组成模块包括调度器、分支与信息单元、12.8KB ECC标量单元、512KB ECC标量寄存器、矢量寄存器、矢量ALU操作单元、矩阵数据操作单元、四个矢量/矩阵SIMD单元、64KB ECC本地数据共享单元、载入/存储单元、16KB ECC一级缓存等等。

显然,这一些都是为计算服务的,而用于图形的着色器、纹理相关单元自然都不见了,即便有些单元名字一样,规格和作用也不同了。

计算性能方面,FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次),FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次),FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次),FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次),Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。

这样的一块卡,已经相当于20年前的世界顶级超级计算机,而体积、功耗都不可同日而语。

对比NVIDIA安培架构的最新计算卡A100,AMD也给出了一些对比数据,FP32单精度性能领先18.5%,FP64双精度性能领先18.6%,AI与机器学习性能更是领先两倍多,而且功耗低了足足100W。

而对比上代产品MI50,新卡的FP64双精度、FP32单精度性能均提升74%,FP32矩阵性能提升接近2.5倍,AI负载性能更是几乎7倍的飞跃。

当然,除了纸面计算性能优秀,软件开发也必须跟上,尤其是这种计算性的产品。NVIDIA在这方面要强得多,生态更加稳固和丰富,AMD ROCm平台正在奋起直追中。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5707

    浏览量

    140402
  • AI
    AI
    +关注

    关注

    91

    文章

    41099

    浏览量

    302576
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266898
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    海奇半导体重磅发布新一代投影芯片

    3月26日,国家级专精特新重点“小巨人”企业珠海海奇半导体有限公司新品发布会圆满举办,重磅推出新一代投影芯片及全系创新产品。
    的头像 发表于 03-26 16:47 911次阅读

    DSP Concepts与AMD助力打造下一代汽车音频

    DSP Concepts 与 AMD 正在将 Audio Weaver 嵌入式音频框架引入 AMD 锐龙 AI 嵌入式 P100 系列处理器——从而实现下一代沉浸式车载音频与数字座舱体
    的头像 发表于 03-19 09:40 3468次阅读

    伟创力与AMD步深化战略合作

    AMD Instinct MI355X 平台已在伟创力奥斯汀工厂正式投产,并计划于下季度实现规模化生产。未来,双方还将把合作拓展至下一代 AMD
    的头像 发表于 03-11 15:11 387次阅读

    福田欧曼银河全新一代混动重正式发布

    2025年12月18日,在福田汽车新产品发布会上,欧曼银河全新一代混动重正式发布。此次发布的混动产品,涵盖欧曼银河9/5M/3三款车型,其
    的头像 发表于 12-25 16:24 927次阅读

    福田汽车发布新一代产品Wonder Plus

    在11月9日举行的福田汽车2026全球合作伙伴大会上,福田汽车正式面向全球市场发布新一代产品——Wonder Plus。面对全球不同末端配送市场的升级需求,以“超配”的产品理念
    的头像 发表于 11-18 09:39 701次阅读

    中科驭数亮相2025新一代计算产业大会

    经济时代计算产业的标准化建设与技术创新,不仅发布核心标准体系,更明确各关键领域的牵头单位,为我国新一代计算产业高质量发展奠定坚实基础。
    的头像 发表于 09-26 11:14 914次阅读

    智算融合 标准筑基2025新一代计算产业大会顺利召开

    日,新一代计算产业大会在北京顺利召开。本次大会由中国电子工业标准化技术协会指导,新一代计算标准工作委员会主办,中科驭数、Intel、经开区国家信创园共同承办,
    的头像 发表于 09-18 10:47 663次阅读
    智算融合 标准筑基2025<b class='flag-5'>新一代</b><b class='flag-5'>计算</b>产业大会顺利召开

    腾讯发布新一代智能驾驶地图9.0

    9月16-17日,2025腾讯全球数字生态大会在深圳举行。会议期间,腾讯正式发布新一代智能驾驶地图9.0。
    的头像 发表于 09-18 10:23 1712次阅读

    【正点原子】新一代经济型工业级核心板RK3506J开发板及资料发布

    正点原子新一代经济型工业级核心板&amp;正点原子RK3506J开发板资料发布! 正点原子RK3506J工业级核心板基于国产瑞芯微RK3506J处理器,搭载四核强芯,3
    发表于 08-27 11:54

    新一代嵌入式开发平台 AMD嵌入式软件和工具2025.1版现已推出

    AMD 2025.1 版嵌入式软件和工具是面向新一代嵌入式系统开发而打造的综合平台,全面加速概念构想到部署落地。 2025.1 版嵌入式软件和工具的新 增功能 AMD 嵌入式开发框架( EDF
    的头像 发表于 08-20 09:15 4204次阅读

    新一代神经拟态类脑计算机“悟空”发布,神经元数量超20亿

    电子发烧友网综合报道 8月2日,浙江大学脑机智能全国重点实验室发布新一代神经拟态类脑计算机——Darwin Monkey(中文名“悟空”)。   “悟空”堪称国际首台神经元规模超20亿、基于专用神经
    的头像 发表于 08-06 07:57 7853次阅读
    <b class='flag-5'>新一代</b>神经拟态类脑<b class='flag-5'>计算</b>机“悟空”<b class='flag-5'>发布</b>,神经元数量超20亿

    新一代高效电机技术—PCB电机

    纯分享帖,点击下方附件免费获取完整资料~~~ *附件:新一代高效电机技术—PCB电机.pdf 内容有帮助可以关注、点赞、评论支持下,谢谢! 【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第
    发表于 07-17 14:35

    重磅!AMD将恢复向中国出口MI308芯片!

    出货。” 此前美国政府针对Instinct MI308产品出货至中国进行出口管制,该产品与英伟达H20样禁止向中国销售。   如今,MI308也将恢复供货,以满足国内AI基础设施建设
    的头像 发表于 07-15 20:52 3791次阅读

    广和通发布新一代AI语音智能体FiboVista

    近日,2025火山引擎Force原动力大会正式开幕。广和通发布新一代AI语音智能体FiboVista,并已率先应用于车联网,成为智能驾驶的“用车伙伴”和“出行伴侣”。通过创新AI大模型和场景服务洞察,FiboVista将在智慧家居、工业互联等更多万亿级市场应用,打造全场景
    的头像 发表于 06-17 09:22 1415次阅读

    AMD实现首个基于台积电N2制程的硅片里程碑

    代号为“Venice”的新一代AMD EPYC CPU是首款基于台积电新一代N2制程的高性能计算产品。   AMD表示,其代号为“Venic
    的头像 发表于 05-06 14:46 912次阅读
    <b class='flag-5'>AMD</b>实现首个基于台积电N2制程的硅片里程碑