0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD将发布第一代CDNA计算卡,性能碾压7nm安培

如意 来源:快科技 作者:宪瑞 2020-11-03 10:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AMD前几天推出了Radeon RX 6000系列显卡,旗舰RTX 6900 XT性能超过了RTX 3090,同时7999元的价格还便宜了4000块,高端游戏卡市场已经反攻了。

再往下,AMD也要在计算卡市场上发力了,去年AMD宣布游戏卡与计算卡架构分家,前者使用RDNA架构,后者使用CDNA架构,今年下半年就会正式推出第一代CDNA计算卡。

根据AMD此前的介绍,CDNA架构专门针对GPU计算进行优化,专注于计算/张量操作性能,从而加速机器学习、高性能计算,而且可以通过Infinity Fabric互连总线灵活设计性能,并支持增强的企业级RAS特性、安全、虚拟化技术,还将提供更高的能效比,从而降低企业TCO成本。

AMD的宣传材料下载网站上已经泄漏一些计算卡的信息,会有三款型号,分别是Instinct MI100,Instinct V640和Instinct V620。

值得注意的是,计算卡中AMD不再像之前那样冠以Radeon的名字,这也意味着AMD也会在品牌上区分两种不同的显卡,游戏卡用Radeon,计算卡直接用Instinct了,省的混淆。

三款CDNA加速卡中,Instinct V系列是第一次见,不过Instinct MI100之前的传闻不少了,泄漏的差不多了。

今年早些时候有爆料,称4路MI100加速卡提供了136TFLOPS的性能,128GB HBM内存及4.9TB/s的带宽,后者比较好算,意味着MI100单卡使用的是32GB HBM2显存,带宽1.2TB/s,算下来就是单颗8GB、等效2.4Gbps频率的HBM2显存了。

至于性能,4路136T、8路272T算下来相当于单卡34TFLOPS性能,这个性能要比NVIDIA最新的7nm安培A100的19.5T性能要高得多,增加了70%以上。

要想达到这样的性能,MI100计算卡应该会有128组CU单元,8192个流处理器单元,频率大约2.1GHz,在搭配32GB HBM2显存,带宽1.2TB/s,估计显卡的核心是非常庞大的了,跟A100有得一比。

具体是不是这样,大家可以在等两周看看了,新卡将在11月16日发布。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5721

    浏览量

    140625
  • 显卡
    +关注

    关注

    17

    文章

    2525

    浏览量

    71779
  • 7nm
    7nm
    +关注

    关注

    0

    文章

    267

    浏览量

    36420
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    选择AMD Alveo V80加速的五大理由

    V80 是款用途高度多样化的加速,业已应用于高性能计算、金融科技、数据分析、传感器处理、网络、存储等众多市场,能利用 AMD Vers
    的头像 发表于 04-10 14:59 458次阅读

    DSP Concepts与AMD助力打造下一代汽车音频

    DSP Concepts 与 AMD 正在 Audio Weaver 嵌入式音频框架引入 AMD 锐龙 AI 嵌入式 P100 系列处理器——从而实现下一代沉浸式车载音频与数字座舱体
    的头像 发表于 03-19 09:40 4730次阅读

    AMD Alveo MA35D媒体加速的AMA SDK 1.4.0版本发布

    我们非常高兴地宣布,面向 AMD Alveo MA35D 媒体加速的最新 AMA SDK 1.4.0 版本现已发布。该版本旨在为要求严苛的媒体工作负载提供坚如磐石的稳定性和性能提升。
    的头像 发表于 03-19 09:36 749次阅读

    AMD VEK385评估套件助力快速启动第二Versal AI Edge系列设计

    AMD VEK385 评估套件为评估第二 AMD Versal AI Edge 系列 XC2VE3858 器件提供了条快速、功能丰富且可扩展的途径。借助异构
    的头像 发表于 03-06 09:09 774次阅读

    AMD 推出第二 Kintex UltraScale+ 中端FPGA,助力智能高性能系统

    · 新款FPGA 可为下一代医疗、工业、测试与测量以及广播系统提供高带宽、实时性能与广泛连接。 · 借助成熟的工具、先进的安全特性以及至少到2045 年的供货保障,增强长期可靠性。 AMD 今日推出
    的头像 发表于 02-04 16:11 6.3w次阅读
    <b class='flag-5'>AMD</b> 推出第二<b class='flag-5'>代</b> Kintex UltraScale+ 中端FPGA,助力智能高<b class='flag-5'>性能</b>系统

    三星2nm良率提升至50%,2027年前实现晶圆代工业务盈利可期

    据报道,三星电子第一代2nm GAA制程(SF2)良率已稳定在50%,该数据也通过其量产的Exynos 2600处理器得到印证。
    的头像 发表于 01-19 18:16 3703次阅读

    AMD Power Design Manager 2025.2版本现已发布

    AMD Power Design Manager 2025.2 版本现已发布,并正式支持第二 AMD Versal AI Edge 系列器件和第二
    的头像 发表于 12-24 11:08 917次阅读

    一代2.4G无线收发芯片 XL2400T,空旷场景实测近300m通讯距离

    XL2400T是芯岭技术推出的第三2.4g射频单RF芯片,在第一代XL2400,第2XL2400P的基础上做了全新性能升级,性能大幅度提
    的头像 发表于 11-10 15:13 742次阅读
    新<b class='flag-5'>一代</b>2.4G无线收发芯片 XL2400T,空旷场景实测近300m通讯距离

    “汽车智能化” 和 “家电高端化”

    “带轮子的超级计算机” 了!而这切都离不开 7nm 级别的高算力芯片:​ 智能座舱的 “大脑” 需求:现在新车流行的 7 屏联动、4K 高清显示、语音控制、人脸识别,都需要芯片有超
    发表于 10-28 20:46

    国产AI芯片真能扛住“算力内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    发表于 10-27 13:12

    AMD 7nm Versal系列器件NoC的使用及注意事项

    AMD 7nm Versal系列器件引入了可编程片上网络(NoC, Network on Chip),这是个硬化的、高带宽、低延迟互连结构,旨在实现可编程逻辑(PL)、处理系统(PS)、AI引擎(AIE)、DDR控制器(DDR
    的头像 发表于 09-19 15:15 3232次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>7nm</b> Versal系列器件NoC的使用及注意事项

    【VisionFive 2单板计算机试用体验】烧录系统+开箱启动

    以太网 双千兆以太网 无线 Wi-Fi 5 + 蓝牙 5.2 无 VisionFive 2 相比第一代全面升级,只是烧录WiFi模块,但是双千兆网口,USB3.0可以外接无线网卡。 启动 外接
    发表于 06-26 18:20

    一代高速芯片晶体管解制造问题解决了!

    提高了器件的性能。据IMEC的研究,叉片晶体管相比纳米片晶体管可以实现约10%的性能提升。 叉片晶体管被认为是未来1nm及以下技术节点的有力候选架构。它能够纳米片晶体管的可微缩性进
    发表于 06-20 10:40

    基于AMD Versal器件实现PCIe5 DMA功能

    Versal是AMD 7nm的SoC高端器件,不仅拥有比16nm性能更强的逻辑性能,并且其PS系统中的CPM PCIe也较上
    的头像 发表于 06-19 09:44 2109次阅读
    基于<b class='flag-5'>AMD</b> Versal器件实现PCIe5 DMA功能

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    工作者身份的转变期),便对这项技术深深痴迷,但当时主流的RTX20系列,需要2080级别以上的才支持,鉴于个人实力,便目光放在了9系上,这也就是「算力芯片 | 书中讲的pascal架构的第一代
    发表于 06-18 19:31