0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD同时推出Instinct MI100和Radeon ROCm 4.0

工程师邓生 来源:cnBeta.COM 作者:cnBeta.COM 2020-11-17 14:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AMD在本周的SC20虚拟会议上,推出了基于他们CDNA架构的AMD Instinct MI100加速器。另外值得注意的是,与MI100发布同时进行的还有Radeon Open eCosystem 4.0(ROCm 4.0)Linux版本。A MD认为MI100是世界上最快的HPC GPU加速器,提供超过10TFLOPS的FP64计算能力。MI100额定峰值FP64性能为11.5 TFLOPS,FP32矩阵性能高达46.1 TFLOPS。与上一代AMD加速器相比,搭配AMD矩阵核心技术的MI100在人工智能训练方面的FP16峰值性能提升近7倍。

AMD Instinct MI100内建32GB HBM2内存,工作频率1.2GHz,内存带宽为1.23TB/s。MI100支持PCI Express 4.0连接,内建120个计算单元和7680个流处理器。CDNA是Vega架构演化版本,而不是针对游戏优化的RDNA/Navi架构,考虑到HPC的重点和我们看到Arcturus Linux补丁成熟的时间,AMD Instinct MI100支持的Linux支持应该是很好的推出状态,尽管我们还没能测试加速器以确认其Linux支持状态。

AMD Instinct MI100使用32GB HBM2内存,时钟速率为1.2GHz,内存带宽为1.23TB/s。MI100支持PCI Express 4.0连接,可打包120个计算单元和7680个流处理器。CDNA是织女星结构的进化,而不是游戏优化而不是计算的RDNA/Navi。考虑到AMD对HPC的关注以及Arcturus Linux补丁准备在即,AMD Instinct MI100应该很好的支持到Linux。

这次推出的ROCm 4.0让它比以往更容易更高效地将NVIDIA CUDA代码库移植到它上面。ROCm 4.0被宣传为 “Exascale时代 ”的开源平台,同时支持OpenMP 5.0行业标准及其HIP接口,以及PyTorch和Tensorflow框架等。ROCm进化目的是让开发者更容易部署和移植他们的软件,使其运行在这个开源计算栈上,而不是NVIDIA专有的 CUDA平台。

AMD还在SC20虚拟会议上表示,EPYC “Zen 3 ”处理器本季度将批量提供给部分HPC和云计算客户。AMD EPYC Zen 3 CPU将在2021年第一季度正式发布和上市。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139027
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39712
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134464
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    性能狂飙!AMD新品叫板英伟达GB200,角逐5000亿AI加速器赛道

    电子发烧友原创 章鹰 当地时间6月12日,在美国旧金山圣何塞举办的“AMD Advancing AI 2025”大会上,AMD董事长兼首席执行官苏姿丰正式发布了开放式的AI平台,并且推出横跨芯片
    的头像 发表于 06-14 00:44 6224次阅读
    性能狂飙!<b class='flag-5'>AMD</b>新品叫板英伟达GB200,角逐5000亿AI加速器赛道

    AMD获部分MI 308对华出口许可,拟缴15%费用破局地缘困局

    电子发烧友网综合报道 2025年12月5日,AMD首席执行官苏姿丰(Lisa Su)当日确认,公司已获得向中国出口部分MI 308人工智能芯片的许可,并准备为此向美国政府缴纳相当于销售额15%的费用
    的头像 发表于 12-06 01:50 4235次阅读

    ROCm部署PP-StructureV3到AMD GPU上

    作者:AVNET 李鑫杰 我们在上一篇文章中介绍了ROCm+PP-OCRv5,为实现在AMD计算平台上完成复杂文档的端到端智能解析,本文基于ROCm软件栈,提供一套完整的PP-StructureV3
    的头像 发表于 11-13 16:56 5219次阅读
    用<b class='flag-5'>ROCm</b>部署PP-StructureV3到<b class='flag-5'>AMD</b> GPU上

    0.9-4.0 GHz、100 W 高功率硅 PIN 二极管 SPDT 开关 skyworksinc

    电子发烧友网为你提供()0.9-4.0 GHz、100 W 高功率硅 PIN 二极管 SPDT 开关相关产品参数、数据手册,更有0.9-4.0 GHz、100 W 高功率硅 PIN 二
    发表于 10-22 18:32
    0.9-<b class='flag-5'>4.0</b> GHz、<b class='flag-5'>100</b> W 高功率硅 PIN 二极管 SPDT 开关 skyworksinc

    重磅!AMD将恢复向中国出口MI308芯片!

    电子发烧友网获悉,AMD向中国出口的MI308芯片将恢复出货。AMD方面表示,“我们最近收到特朗普政府的通知,向中国出口MI308产品的许可证申请将被推进至审核流程。我们计划在许可证获
    的头像 发表于 07-15 20:52 3100次阅读

    ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMD7900xtxonSOPHGOSG2044PCLT团队倾注心血,精心完成了将ROCm软件栈适配到SG2044独特架构的复杂工作。这包括:内核级适配:确保ROCm驱动程序和底层组件能够与SG
    的头像 发表于 07-14 17:04 1015次阅读
    <b class='flag-5'>ROCm</b> 6.2.4 成功移植至 SG2044: 大模型部署速率飙升,RISC-V + AI 新纪元!代码已经开源,一起来试试!

    AMD Power Design Manager 2025.1现已推出

    AMD Power Design Manager 2025.1 版(PDM)现已推出——增加了对第二代 AMD Versal AI Edge 和 第二代 Versal Prime 系列的支持,并支持已量产的
    的头像 发表于 07-09 14:33 873次阅读

    神秘的PCB工程部,看 MI 与 CAM 如何擎天架海

    方式:考虑如何在基板材料上进行排版,以提高材料利用率,降低生产成本,同时方便后续生产作业,提高生产效率。 工程资料制作 MI 文件编制:MI 工程师根据产品设计要求和生产方案,详细编写制造指示(
    发表于 06-23 15:53

    AMD Vivado Design Suite 2025.1现已推出

    AMD Vivado Design Suite 2025.1 现已推出,支持 AMD Spartan UltraScale+ 和新一代 Versal 器件。这一最新版本还新增了多项功能,可显著提升 Versal SSIT 器件的
    的头像 发表于 06-16 15:16 1211次阅读

    AMD将DeepSeek-V3模型集成至Instinct MI300X GPU

    AMD近日宣布了一项重要进展,成功将全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。这一举措标志着AMD在AI推理优化方面迈出了重要一步。 据了解
    的头像 发表于 02-06 09:41 813次阅读

    消息称AMD Instinct MI400 AI加速器将配备8个计算芯片

    近日,据外媒 videocardz 报道,参考 AMD 最新推出AMD - GFX 补丁程序,其中暗示 AMD 旗下的 Instinct
    的头像 发表于 02-05 15:07 1377次阅读

    AMD集成DeepSeek-V3模型至Instinct MI300X GPU

    。 据悉,DeepSeek-V3模型是AMD针对AI推理应用进行深度优化的成果。通过集成到Instinct MI300X GPU,AMD旨在为用户提供更高效、更强大的AI推理能力。
    的头像 发表于 02-05 13:58 781次阅读

    Microchip推出全新PCI100x系列Switchtec PCIe 4.0交换机

    (HPC)系统的高要求工作负载必不可少。Microchip Technology Inc.(微芯科技公司)今日宣布推出全新的PCI100x系列Switchtec PCIe 4.0交换机样品,提供多种型号以支持数据包交换和多主机应
    的头像 发表于 01-20 16:00 1275次阅读

    AMD MI300X AI芯片面临挑战

    力不从心。 Semianalysis的报告详细阐述了AMD所面临的问题。报告指出,由于AMD的软件存在显著缺陷,若未经过大量的调试和优化,使用MI300X进行AI模型的训练几乎是不可能的。这使得
    的头像 发表于 12-25 10:57 1123次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的GPU不能在单个主机系统中组合使用。 - AMD GPU:目前只有时域求解器(FIT)支持AMD GPU,如Instinct MI 210、Ra
    发表于 12-16 14:25