去年11月份,AMD发布了顶级加速计算卡Instinct MI100,首次采用针对HPC高性能计算、AI人工智能全新设计的CDNA架构,和游戏向的RDNA架构截然不同。现在,第二代的MI200也首次浮出了水面。
MI100采用台积电7nm工艺制造,集成120个计算单元、7680个流处理器,并专门加入Matrix Core(矩阵核心)用于加速HPC、AI运算,还整合了4096-bit 32GB HBM2显存,支持PCIe 4.0 x16和八卡并行,整卡功耗300W。
它的FP64双精度浮点性能首次突破10TFlops(也就是每秒1亿亿次),混合精度和FP16半精度的AI性能提升接近7倍。
根据最新消息,MI200将会采用下一代CNDA架构,并首次引入MCM多芯片封装,看这样子翻番到1.5万个流处理器问题不大。
本次曝光的MI200将用于HPE Cray EX超级计算机,执行加速计算,产品名被描述为“MCM Special FIO Accelerator”,其中FIO代表“Factory Installation Option”(厂商安装选项),此外还有OAM形态,代表开源加速卡。
不过,MI200的具体规格目前一无所知,除了猜测流处理器可能因为MCM封装而翻一番,还有望加入FullRate640ps指令集、支持全速率FP64浮点计算。

MI200预计今年晚些时候发布,未来将搭配代号“Trento”(特伦托)的霄龙处理器,共同用于AMD为美国国防部打造的百亿亿次超级计算机“Frontier”。
Trento并未出现在AMD霄龙演进路线图上,其实是即将发布的第三代“Milan”(米兰)的定制版,专为超算优化,可能会提前支持PCIe 5.0。

责任编辑:PSY
-
芯片
+关注
关注
463文章
54632浏览量
470922 -
amd
+关注
关注
25文章
5721浏览量
140627 -
计算卡
+关注
关注
0文章
16浏览量
4511
发布评论请先 登录
性能狂飙!AMD新品叫板英伟达GB200,角逐5000亿AI加速器赛道
原生FP64突破200 TFLOPs!AMD MI430X性能曝光,领先NVIDIA Rubin达6倍?
AMD正式推出Instinct MI350P PCIe GPU加速卡
多芯光纤:未来通信的“超级通道”
多芯光缆:未来通信的基石
伟创力与AMD进一步深化战略合作
芯粒设计与异质集成封装方法介绍
国芯科技新一代云安全PCI-E密码卡产品在多领域实现应用导入
昆仑芯R200 AI加速卡技术规格解析
迈向云端算力巅峰:昆仑芯K200 AI加速卡全面解读
技术资讯 I 一文速通 MCM 封装
Chiplet与先进封装全生态首秀即将登场!汇聚产业链核心力量共探生态协同新路径!
国芯科技推出可信AI推理卡CCAT200T
AMD Instinct MI200计算卡首曝:用上MCM多芯封装
评论