0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新一代计算卡Instinct MI100终于登台

lhl545545 来源:快科技 作者:上方文Q 2020-11-17 10:19 次阅读

在游戏领域,基于RDNA 2架构的Radeon RX 6000系列显卡已经开始闪亮登场。在高性能计算领域,基于CDNA全新架构的新一代计算卡Instinct MI100也终于登台了!

AMD Radeon Instinct系列计算卡已经发展了多款型号,但是在此之前,AMD GPU一直都是一套架构打天下,游戏、计算不分家,自然不利于不同方向的深度优化。

今年3月份,AMD宣布了首个专门针对数据中心高性能计算而设计的CDNA架构,从此与RDNA游戏架构分道扬镳。二者虽然还有一些共通点,但在设计、优化上已经泾渭分明,在各自领域的性能、能效也更高。

而在产品命名方面,AMD计算卡也放弃了Radeon字样,不再称呼Radeon Instinct,而是简单地叫做Instinct。

AMD Instinct可以说是专为HPC高性能计算而生的,志在推动超级计算机进入百亿亿次计算时代(ExaScale)。

回顾历史,21世纪的前10个年头属于万亿次计算时代(TeraScale),完全依赖CPU运算;最近10个年头属于千万亿次计算时代(PetaScale),GPU加速运算展露锋芒。

不过近两年,传统的GPU加速计算也已经初显疲态,性能增强曲线也缓了下来,必须实现全新的突破。

CDNA架构和MI100加速卡就是这样的突破性产品,也是AMD开拓新未来的新旗舰。

AMD Instinct MI100是其迄今为止性能最高的HPC GPU,FP64双精度浮点性能首次突破10TFlops(也就是每秒1亿亿次),并在架构设计上专门加入了Matrix Core(矩阵核心),用于加速HPC、AI运算,号称在混合精度和FP16半精度的AI负载上,性能提升接近7倍。

另外,新卡的外观设计也令人眼前一亮,更有质感的拉丝外壳,深灰色调,非常沉稳大气。

它集成多达120个计算单元、7680个流处理器,搭配32GB HBM2,带宽高达1.23TB/s,同时支持PCIe 4.0,集成Infinity Fabric x16高速互联通道,峰值带宽达276GB/s(相当于PCIe 4.0 x16的大约4倍),而整卡功耗控制在300W。

计算性能方面,FMA64/FP64双精度为11.5TFlops(每秒1.15亿亿次),FMA32/FP32单精度为23.1TFlops(每秒2.31亿亿次),FP32 Matrix单精度矩阵计算为46.1TFlops(每秒4.61亿亿次),FP16 Matrix半精度矩阵计算为184.6TFlops(每秒18.46亿亿次),Bfloat16浮点为92.3TFlops(每秒9.23亿亿次)。

这些数字是什么概念呢?

就拿11.5TFlops的双精度性能来说,2000年排名世界第一的超级计算机ASCI White,这个指标也不过12.3TFlops,但却是付出了600万瓦的功耗、106吨的身材才获得的,Instinct MI100却只要300瓦、1.16千克。

换言之,如今的一块卡,就相当于20年前的一个大规模计算集群!

AMD上代计算卡Instinct MI50采用的还是Vega 20核心,60个计算单元,3840个流处理器,32GB HBM2显存带宽1TB/s,Infinity Fabric总线带宽92GB/s,功耗300W。

Instinct MI100的核心规模翻了一番,显存带宽提升了超过20%,Infinity Fabric带宽提升了整整2倍,但是功耗却完全没变(工艺应当也还是7nm),新架构的能效可见一斑。

新卡的性能更是不可同日而语,FP64双精度、FP32单精度性能均提升74%,FP32矩阵性能提升接近2.5倍,AI负载性能更是几乎7倍的飞跃。

在美国能源部旗下的橡树岭国家实验室,AMD MI100计算卡已经在支撑多项百亿亿次科研项目,涉及NAMD分子动力学模拟、CHOLLA星系形成研究、PIConGPU激光放射癌症疗法、GESTS流体动力学等等诸多前沿科技

AMD Instinct MI100计算卡还有一个绝佳搭档,那就是AMD自家的霄龙数据中心处理器,慧与、戴尔、超威、技嘉等多家行业巨头都有提供这种双A方案。

当然了,只有硬件,是做不成高性能计算的,AMD同时一直在推进一站式软件解决方案ROCm。

从2016年初入江湖的1.x版本,2018年奠定基础的2.0版本,到2019年专注于机器学习的3.0版本,再到如今最新的4.0版本,AMD ROCm已经打造成了一整套针对机器学习、高性能计算的百亿亿次级开发方案,规划中的各项功能特性也基本都已经实现。

软件优化的力量无疑是巨大的,可以充分释放硬件潜力,比如说上代MI50,搭配ROCm 3.0的话性能相比于搭配ROCm 2.0可以提升3-4倍,而最新的MI100、ROCm 4.0联合,更是可以轻松带来5-8倍的性能提升。

AMD ROCm生态的进步速度非常快,已经有众多领域的头部厂商采纳和支持,而且它沿袭了AMD一贯的原则,那就是完全开源开放,非常方便代码迁移,比如说HACC(宇宙学)只用了一个下午,SPECFEM3D(地震学)半天就搞定,CHOLLA(天体物理学)花了几天,QUDA(量子物理学)也不过21天。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5203

    浏览量

    132648
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4426

    浏览量

    126755
  • 数据中心
    +关注

    关注

    15

    文章

    4190

    浏览量

    70155
收藏 人收藏

    评论

    相关推荐

    AMD硬刚英伟达,推出Instinct MI300,单芯片可运行800亿参数

    电子发烧友网报道(文/黄山明)美国时间本周二,AMD举行了重磅发布会,推出了一款全新的人工智能GPU Instinct MI300,并表示这款处理器将于今年晚些时候开始向部分客户发货。自英伟达发布
    的头像 发表于 06-15 01:45 1595次阅读
    AMD硬刚英伟达,推出<b class='flag-5'>Instinct</b> <b class='flag-5'>MI</b>300,单芯片可运行800亿参数

    人工智能市场风向转变,AMD Instinct MI300X GPU更受欢迎

    近一半的受访者表示对AMD的Instinct MI300X GPU持乐观态度。与英伟达的H100系列相比,MI300X不仅价格与性能比值更为优越,而且供应稳定,避免了货源紧张的问题。
    的头像 发表于 03-11 15:28 543次阅读

    AMD首批Instinct MI300X已开始交付

    模型。与Instinct MI300A不同,Instinct MI300X不包含x86 CPU内核,但通过增加CDNA 3小芯片的数量和搭载192 GB HBM3内存,实现了更高的
    的头像 发表于 01-24 16:57 360次阅读

    AMD Instinct MI300X已向LaminiAI批量供货

    LaminaAI作为AMD的长期合作伙伴,能够抢先体验到全新MI300X加速器的强大优势,实属正常。该公司首席执行官Sharon Zhou在社交媒体进行了公告,同时透露,已经接收到配置8个Instinct MI300X加速器的设
    的头像 发表于 01-23 09:53 225次阅读

    AMD Instinct MI300A获得德国订单

    先进微设备公司(AMD)于本月6日成功举办了"推进人工智能"(Advancing AI)主题活动,期间正式发布了专为数据中心设计的Instinct MI300系列计算卡,首批推出
    的头像 发表于 12-25 11:30 233次阅读
    AMD <b class='flag-5'>Instinct</b> <b class='flag-5'>MI</b>300A获得德国订单

    TI 新一代明星CPU

    功耗,走红了全球。 今天给大家分享的是 TI 新一代明星CPU——AM62x,它相比上一代AM335x在工艺、外设、性能等多方面都有很大提升。 这里结合米尔电子的“MYC-YM62X核心板及开发板”给
    发表于 12-15 18:59

    Meta、微软承诺购买AMD新型人工智能芯片Instinct MI300X

    amd的最新高端芯片instinctmi300x明年年初上市开始,人工智能公司和有关云服务提供商的能满足,这是人工智能模型开发费用,降低英伟达在人工智能芯片的工作竞争压力将持续上升可以给予的。
    的头像 发表于 12-07 17:31 714次阅读

    AMD Instinct加速器、AMD EPYC处理器为Microsoft带来全新AI和计算能力

    — AMD Instinct加速器将为针对AI进行优化的全新Microsoft Azure虚拟机系列提供动力 — — 第四代AMD EPYC处理器现在还被用于运行新一代通用、内存密集型和计算优化
    的头像 发表于 12-04 13:54 378次阅读

    戴尔禁止经销商在中国销售RX 7900 XTX、7900 XT、PRO W7900 和MI300 GPU

    被禁止销售的产品有isg的instinct加速器和csg的客户端解决方案组的radeon gpu。戴尔禁止销售的“amd isg”产品包括instinct mi210、mi250、
    的头像 发表于 12-04 09:37 328次阅读

    AMD对抗英伟达的王牌,MI Instinct

    大语言模型市场,专门推出了纯CDNA 3 GPU架构打造的MI300X,集成192GB的HBM3。   下一代数据中心与超算的选择 , Instinct MI300   随着英伟达的A100
    的头像 发表于 09-19 01:11 1497次阅读
    AMD对抗英伟达的王牌,<b class='flag-5'>MI</b> <b class='flag-5'>Instinct</b>

    新一代人造太阳”“中国环流三号”托马克装置

    ,被称为“新一代人造太阳”的“中国环流三号”托马克装置,于8月25日首次实现100万安培等离子体电流下的高约束模式运行。这重大进展再次刷新我国磁约束聚变装置运行纪录,标志着我国磁约
    发表于 09-07 10:39

    mi300芯片和h100性能参数对比

    mi300芯片和h100性能参数对比 MI300芯片和H100芯片都是目前市场上比较常见的芯片,其性能参数直接关系到设备的使用体验和性能表现。本文将详细对比
    的头像 发表于 08-22 16:46 1629次阅读

    【AI简报20230616】英伟达推出Instinct MI300、OpenAI凌晨再给ChatGPT、GPT-4加码!

    AI 简报 20230616 期 1. AMD硬刚英伟达,推出Instinct MI300,单芯片可运行800亿参数 原文: https://mp.weixin.qq.com
    的头像 发表于 06-17 18:15 656次阅读
    【AI简报20230616】英伟达推出<b class='flag-5'>Instinct</b> <b class='flag-5'>MI</b>300、OpenAI凌晨再给ChatGPT、GPT-4加码!

    AMD全力追赶英伟达推出新一代AI芯片

    AMD在旧金山发布会上推出了新一代AI芯片、数据中心CPU和DPU。在生成式AI浪潮下,最受关注的新品是AI芯片Instinct MI 300X,直接与英伟达的H100竞争。
    的头像 发表于 06-15 16:16 1349次阅读

    AMD硬刚英伟达,推出Instinct MI300,单芯片可运行800亿参数

    在这次AMD的新品发布会中,核心产品无疑是用于训练大模型的GPU Instinct MI300。早在今年初,AMD便已经宣布了新一代Instinct
    的头像 发表于 06-14 16:46 2075次阅读
    AMD硬刚英伟达,推出<b class='flag-5'>Instinct</b> <b class='flag-5'>MI</b>300,单芯片可运行800亿参数