0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD推出Instinct MI100和Radeon ROCm4.0

璟琰乀 来源:cnBeta.COM 作者:cnBeta.COM 2020-11-17 15:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AMD在本周的SC20虚拟会议上,推出了基于他们CDNA架构的AMD Instinct MI100加速器。另外值得注意的是,与MI100发布同时进行的还有Radeon Open eCosystem 4.0(ROCm 4.0)Linux版本。AMD认为MI100是世界上最快的HPC GPU加速器,提供超过10TFLOPS的FP64计算能力。MI100额定峰值FP64性能为11.5 TFLOPS,FP32矩阵性能高达46.1 TFLOPS。与上一代AMD加速器相比,搭配AMD矩阵核心技术的MI100在人工智能训练方面的FP16峰值性能提升近7倍。

AMD Instinct MI100内建32GB HBM2内存,工作频率1.2GHz,内存带宽为1.23TB/s。MI100支持PCI Express 4.0连接,内建120个计算单元和7680个流处理器。CDNA是Vega架构演化版本,而不是针对游戏优化的RDNA/Navi架构,考虑到HPC的重点和我们看到Arcturus Linux补丁成熟的时间,AMD Instinct MI100支持的Linux支持应该是很好的推出状态,尽管我们还没能测试加速器以确认其Linux支持状态。

AMD Instinct MI100使用32GB HBM2内存,时钟速率为1.2GHz,内存带宽为1.23TB/s。MI100支持PCI Express 4.0连接,可打包120个计算单元和7680个流处理器。CDNA是织女星结构的进化,而不是游戏优化而不是计算的RDNA/Navi。考虑到AMD对HPC的关注以及Arcturus Linux补丁准备在即,AMD Instinct MI100应该很好的支持到Linux。

这次推出的ROCm 4.0让它比以往更容易更高效地将NVIDIA CUDA代码库移植到它上面。ROCm 4.0被宣传为 “Exascale时代 ”的开源平台,同时支持OpenMP 5.0行业标准及其HIP接口,以及PyTorch和Tensorflow框架等。ROCm进化目的是让开发者更容易部署和移植他们的软件,使其运行在这个开源计算栈上,而不是NVIDIA专有的 CUDA平台。

AMD还在SC20虚拟会议上表示,EPYC “Zen 3 ”处理器本季度将批量提供给部分HPC和云计算客户。AMD EPYC Zen 3 CPU将在2021年第一季度正式发布和上市。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5707

    浏览量

    140397
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40235
  • 内存
    +关注

    关注

    9

    文章

    3233

    浏览量

    76503
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    性能狂飙!AMD新品叫板英伟达GB200,角逐5000亿AI加速器赛道

    电子发烧友原创 章鹰 当地时间6月12日,在美国旧金山圣何塞举办的“AMD Advancing AI 2025”大会上,AMD董事长兼首席执行官苏姿丰正式发布了开放式的AI平台,并且推出横跨芯片
    的头像 发表于 06-14 00:44 6599次阅读
    性能狂飙!<b class='flag-5'>AMD</b>新品叫板英伟达GB200,角逐5000亿AI加速器赛道

    润和软件亮相2026开放计算ROCm生态大会

    4月18日,2026开放计算ROCm生态大会在中国(南京)软件谷成功举办。本次大会以“开源共生 智能共赢——构建开放AI新生态”为主题,由AMD ROCm Lab主办,南京市工业和信息化局、中国
    的头像 发表于 04-22 17:20 365次阅读
    润和软件亮相2026开放计算<b class='flag-5'>ROCm</b>生态大会

    云知声与AMD ROCm Lab签署战略合作协议

    3月25日,江苏云知声科技有限公司(以下简称“云知声”)与南京超威开源科技有限公司(以下简称“AMD ROCm Lab”)正式签署战略合作协议。江苏云知声副总经理陈大林、AMD ROCm
    的头像 发表于 04-01 11:21 815次阅读

    伟创力与AMD进一步深化战略合作

    AMD Instinct MI355X 平台已在伟创力奥斯汀工厂正式投产,并计划于下季度实现规模化生产。未来,双方还将把合作拓展至下一代 AMD
    的头像 发表于 03-11 15:11 381次阅读

    Robotec.ai与AMD Silo AI的合作实践

    AMD Silo AI 正与领先的机器人应用仿真平台开发商 Robotec.ai 合作,优化和扩展基于 AMD GPU 和 ROCm 软件堆栈的下一代汽车和机器人系统的数字孪生和场景重建工作负载
    的头像 发表于 01-28 16:23 877次阅读

    AMD获部分MI 308对华出口许可,拟缴15%费用破局地缘困局

    电子发烧友网综合报道 2025年12月5日,AMD首席执行官苏姿丰(Lisa Su)当日确认,公司已获得向中国出口部分MI 308人工智能芯片的许可,并准备为此向美国政府缴纳相当于销售额15%的费用
    的头像 发表于 12-06 01:50 7161次阅读

    ROCm部署PP-StructureV3到AMD GPU上

    作者:AVNET 李鑫杰 我们在上一篇文章中介绍了ROCm+PP-OCRv5,为实现在AMD计算平台上完成复杂文档的端到端智能解析,本文基于ROCm软件栈,提供一套完整的PP-StructureV3
    的头像 发表于 11-13 16:56 5692次阅读
    用<b class='flag-5'>ROCm</b>部署PP-StructureV3到<b class='flag-5'>AMD</b> GPU上

    0.9-4.0 GHz、100 W 高功率硅 PIN 二极管 SPDT 开关 skyworksinc

    电子发烧友网为你提供()0.9-4.0 GHz、100 W 高功率硅 PIN 二极管 SPDT 开关相关产品参数、数据手册,更有0.9-4.0 GHz、100 W 高功率硅 PIN 二
    发表于 10-22 18:32
    0.9-<b class='flag-5'>4.0</b> GHz、<b class='flag-5'>100</b> W 高功率硅 PIN 二极管 SPDT 开关 skyworksinc

    SCE-MI协议简介

    SCE-MI(Standard Co-Emulation API: Modeling Interface)是一种标准化的协同仿真建模接口协议,旨在为SoC设计验证提供高效的硬件仿真与软件模型协同工作环境。
    的头像 发表于 08-06 14:42 2037次阅读
    SCE-<b class='flag-5'>MI</b>协议简介

    重磅!AMD将恢复向中国出口MI308芯片!

    电子发烧友网获悉,AMD向中国出口的MI308芯片将恢复出货。AMD方面表示,“我们最近收到特朗普政府的通知,向中国出口MI308产品的许可证申请将被推进至审核流程。我们计划在许可证获
    的头像 发表于 07-15 20:52 3788次阅读

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMD7900xtxonSOPHGOSG2044PCLT团队倾注心血,精心完成了将ROCm软件栈适配到SG2044独特架构的复杂工作。这包括:内核级适配:确保ROCm驱动程序和底层组件能够与SG
    的头像 发表于 07-14 17:04 1358次阅读
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMD Power Design Manager 2025.1现已推出

    AMD Power Design Manager 2025.1 版(PDM)现已推出——增加了对第二代 AMD Versal AI Edge 和 第二代 Versal Prime 系列的支持,并支持已量产的
    的头像 发表于 07-09 14:33 1386次阅读

    AP8N10MI 永源微8A100V SOT23-3n沟道增强模式MOSFET

    描述AP8N10MI采用先进的沟槽技术提供优良的rds (ON),低栅极电荷和工作电压低至4.5V。这该装置适合作为电池保护装置使用或其它开关应用。一般特征vds = 100v I d = 8aR
    发表于 06-30 09:50 0次下载

    AP3P10MI 永源微100V p沟道增强模式MOSFET

    描述AP3P10MI采用先进的沟槽技术提供优良的rds (ON),低栅极电荷和在低至5V的栅极电压下工作。这装置适合作为电池保护或其他开关应用。一般特征vds = -100v I d = -3aR DS(ON) < 350mΩ @ V GS =-10V应用程序电池保护负荷
    发表于 06-30 09:46 0次下载

    AMD Vivado Design Suite 2025.1现已推出

    AMD Vivado Design Suite 2025.1 现已推出,支持 AMD Spartan UltraScale+ 和新一代 Versal 器件。这一最新版本还新增了多项功能,可显著提升 Versal SSIT 器件的
    的头像 发表于 06-16 15:16 1662次阅读