0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TOP500第二台E级超算出现,AMD要在HPC上逆袭英特尔?

E4Life 来源:电子发烧友 作者:周凯扬 2024-05-15 09:11 次阅读

电子发烧友网报道(文/周凯扬)在今年的ISC2024上,新一期的TOP500全球超算榜单发布。除了瑞典超级计算机Alps空降第六之外,此次TOP500的前十名在排名上并没有太大变化,但我们还是从新的成绩中找到了一些别的亮点。

AMD实现TOP500近三成覆盖率

首先是卫冕成功的Frontier,这个由HPE打造的大规模超算系统部署在美国橡树岭国家实验室,此次拿下了1.206 Exaflop/s的HPL算力成绩,在开发人员的优化下,相较上次提交的1.194 Exflop/s成绩还有所提升。Frontier集成了9472块AMD Epyc 7713 64核2GHz CPU和37888块AMD Instinct MI250X GPU

wKgZomZEC7iAOy0uAAGnuC4ER7c223.png
Frontier超算 / 美国橡树岭国家实验室


凭借AMD顶级Epyc CPU和Instinct GPU的搭配,Frontier可以说是当下已公开系统中,兼顾HPC和AI的最强超算。不仅如此,其能效表现同样不俗,52.93Gflops/W的成绩居于GREEN500能效榜单的第13位。

如果我们观察余下的TOP500超算,就会看到搭载了MI300A系列GPU的超算系统开始逐渐显现,比如美国劳伦斯利弗莫尔国家实验室的三台新系统,分别拿下了46、47和48的排名。而这三台均为El Capitan超算的子系统,今年部署完成后预计HPL算力可突破2 Exaflop/s。

根据AMD的说法,在新发布的TOP500超算系统中,由AMD硬件驱动的超算系统增加了29%,达到了156台。在能效榜单GREEN500上,由AMD硬件驱动的超算系统也达到了157台。虽然这与英特尔60%以上的份额还有不小差距,但其增长速度要远超英特尔。

英特尔首台E级超算出炉,性能还没到顶

去年拿下第二的Aurora超算在今年的TOP500上再进一步,获得了1.012 Exaflop/s的HPL算力成绩,成为TOP500历史上第二台E级超算,也是基于英特尔硬件的首台E级超算。由于去年Aurora尚未完成全面部署,所以只是勉强超过第三名的Eagle超算,HPL算力为585.34 PFlop/s。

wKgaomZEC8OAMd5hAADI6VrV6Zk779.jpg
Aurora超算 / 美国阿贡国家实验室


如今的Aurora离硬件全面到位还差一点,所以此次提交成绩只用到了80%到90%左右的节点,要在下一次TOP500榜单公布才能完成全面部署。但即便如此,Aurora的成绩依然成功突破了E级大关。如果按照这一规模来估算,加上阿贡实验室开发人员的优化,Aurora未来也有可能完成逆袭,超过Frontier,不过届时第一名很有可能会是同样完成部署的El Capitan。

另外值得一提的是,无论是Aurora还是Frontier,在测试混合精度算力的HPL-MxP上,两者都获得了超过10 Exaflop/s的成绩。其中Aurora凭借89%的系统拿下了10.6Exaflop/s的成绩,位列第一。但这一测试并不能代表绝对的AI性能,尤其是用于新一代的AI负载,因此在这一届ISC2024上,行业也在呼吁推出新的AI测试榜单。

由于Aurora部署进度经历了一再推迟,其能效相比其他超算系统略有逊色,只有26.15GFlops/w,这也是为何其系统功耗从去年的24.687MW提升至今年的38.698MW。相较之下算力还要高于Aurora的Frontier系统功耗只有22.786MW。

从目前前十名的榜单来看,基于英特尔Xeon处理器的系统依旧占据了一半席位,这足以说明英特尔在HPC上的持续统治地位。这还是在其HPC产品发布推迟的前提下,未来随着工艺的推进和发布计划重回正轨,英特尔依然有机会找回被夺去的份额。

英伟达开始发力,Arm CPU+GPU性能与能效双管齐下

此次TOP500最令人意想不到的应该是英伟达的全面发力,此前英伟达出现在TOP500榜单上主要是因为其GPU,在TOP500榜单中,半数带有加速器的系统都用到了英伟达的GPU。而此次TOP500上,则一共有8台系统基于英伟达的Grace Hopper处理器。

wKgZomZEC82AFnPmAAFN_40N808658.jpg
Alps超算 / 瑞士超算中心


这次空降的第六名是来自瑞士超算中心的Alps超算系统,该系统集成了英伟达的GH200超级芯片,算力成绩达到了270 PFlop/s。该系统从2021年开始计划部署,用于气候、物理和生命科学研究等HPC应用的同时,提供强大的AI算力。

我们如果观察同期发布的GREEN500能效榜单就会发现,基于英伟达Grace Hopper打造的超算系统包揽了前三的位置。这三台系统分别是德国超算JEDI、英国超算Isambard-AI和波兰超算Helios GPU,能效分别为72.733Gflops/W、68.835Gflops/W和66.948Gflops/W。即便是TOP500排名第六的Alps,其能效比也有51.98Gflops/W,在GREEN500上排名第14.

结合TOP500上也有不少x86超算使用英伟达的GPU,侧面反映了Arm架构在HPC系统上的能效优势。结合未来对于超算能效更加严格的要求,英伟达的CPU+GPU超级芯片方案的吸引力会越来越大。

超算的市场格局迎来新一轮剧变

可以看出,超算行业已经不再是过去英特尔一家独大的场面了,无论是AMD、英伟达等都在迎头赶上,甚至是以更快的速度夺取市场份额。在x86系统上,AMD的CPU与GPU组合已经成为不少超算中心和商业公司的首选,而且由于供货较为稳定,其部署速度也要快于其他超算系统。

在Arm系统上,英伟达已经开始发力,依仗Grace Hopper提供的性能和能效双重优势,与HPC方案商合作贡献了多台TOP500系统。未来随着GB200投入市场,凭借Blackwell架构在FP64精度上比Hopper架构高出30%的性能表现,相信会有更多的超算系统选择英伟达的硬件方案。

至于IBM的Power架构,目前前十名中只有老牌榜首Summit采用IBM的Power9 CPU,除此之外就只剩采用自研Arm核心和处理器的富岳超算系统这一特例了。鉴于目前具备自研HPC处理器的厂商并不多,未来各种众核处理器的HPC系统数量预计还是维持在个位数,但其性能往往都不容小觑。

与此同时,中国超算系统今年出现了销声匿迹的局面,今年的TOP500超算榜单上,没有一个来自中国的新超算系统,位列TOP500的中国超算系统,也从104台减少至80台。但实际上国内也有三台值得关注的新超算,分别是620 Pflop/s的天河星逸,以及神威海洋之光和天河三号,后两者的预估性能分别为2.05 Exaflop/s和1.5 Exaflop/s。但很有可能出于地缘政治的原因,国内超算纷纷选择了停止提交HPL成绩。

来自美国的超算系统从171台减少至160台,从这几年的趋势来看,美国更加致力于打造顶级超算。反倒是来自欧洲的超算系统从143台提升至160台,正式超过亚洲成为第二名,仅次于北美地区,足见欧盟对于HPC系统的投入。

在系统制造商上,HPE和联想依然是最大的两家制造商,尤其是联想,占据了32.4%的份额。但在总系统算力上,HPE打造的系统占据了36.1%的份额。这也说明了得益于HPE提供的HPE Cray OS操作系统以及Singshot-11互联方案,其在高端系统上更受欢迎。

随着摩尔定律的放缓或者说终止,在速度的提升上,我们已经看到了减缓的迹象,曾经在2030年实现10 Exascale的目标已经不太可能实现了,如今的能效指标也不允许我们一味地扩大超算规模。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5297

    浏览量

    133052
  • 英特尔
    +关注

    关注

    60

    文章

    9635

    浏览量

    170173
  • 摩尔定律
    +关注

    关注

    4

    文章

    627

    浏览量

    78649
  • HPC
    HPC
    +关注

    关注

    0

    文章

    296

    浏览量

    23467
  • 超算
    +关注

    关注

    1

    文章

    114

    浏览量

    8993
收藏 人收藏

    评论

    相关推荐

    AMD预计提前推出X860(E)芯片组,挑战英特尔

    但据最新消息,AMD决定提前发布X860(E),以匹配英特尔的最新Z890旗舰板卡,同样归属800系列。然而,业内人士坦言该决策可能导致产品识别困难,给消费者带来困扰。
    的头像 发表于 05-28 17:04 622次阅读

    最新Top500算榜单公布:Frontier再夺魁首,Aurora破百亿大关

    此次Top500排行榜中只有一个显著变动:瑞士国家超级计算机中心的Alps算凭借270 PFlop/s的Rmax LINPACK FP64算力排名上升至第六,超过了IBM POWER9处理器和Nvidia Volta GV100计算卡基础设施Sierra
    的头像 发表于 05-14 09:36 479次阅读

    已有超过500款AI模型在英特尔酷睿Ultra处理器上得以优化运行

    近日,英特尔宣布在全新英特尔 酷睿 Ultra处理器,有超过500款AI模型得以优化运行。
    的头像 发表于 05-11 09:31 486次阅读

    英特尔季度对酷睿Ultra处理器供应受限

    英特尔首席执行官帕特·基辛格在最新的财报电话会议透露,受晶圆封装产能限制,季度酷睿Ultra处理器的供应将面临挑战。随着AI PC需求的激增和Windows更新周期的推动,客户对
    的头像 发表于 05-06 11:04 440次阅读

    微软正在与英伟达、AMD英特尔合作以改进PC游戏画质技术

    微软公布了一项新的Windows API,旨在为游戏开发者提供一种无缝的方式,让他们能够集成英伟达、AMD英特尔分辨率AI Up scaling功能。
    的头像 发表于 03-11 16:48 609次阅读

    英特尔:2025年全球AIPC将1亿占比20%

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月29日 09:15:26

    英特尔1nm投产时间曝光!领先于积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔首推面向AI时代的系统代工

    英特尔宣布全新制程技术路线图、客户及生态伙伴合作,以实现2030年成为全球第二大代工厂的目标。 新闻亮点: •英特尔首推面向AI时代的系统代工——
    的头像 发表于 02-26 15:41 249次阅读
    <b class='flag-5'>英特尔</b>首推面向AI时代的系统<b class='flag-5'>级</b>代工

    英特尔首推面向AI时代的系统代工—英特尔代工

    英特尔首推面向AI时代的系统代工——英特尔代工(Intel Foundry),在技术、韧性和可持续性方面均处于领先地位。
    的头像 发表于 02-25 10:38 355次阅读
    <b class='flag-5'>英特尔</b>首推面向AI时代的系统<b class='flag-5'>级</b>代工—<b class='flag-5'>英特尔</b>代工

    英特尔或可以拿到百亿美元补贴

    英特尔或可以拿到百亿美元补贴 据彭博社的爆料,美国为引导半导体制造业的回归,目前正在就向英特尔公司提供超过100亿美元(换算下来约人民币711.94亿元)的补贴进行谈判。 而这笔1
    的头像 发表于 02-18 11:19 529次阅读

    英特尔AMD处理器的区别和特点

    英特尔AMD处理器的区别和特点 英特尔(Intel)和AMD是全球最著名的两个处理器制造商。他们都提供高性能、可靠的芯片,为消费者和企业用户提供强大的计算能力。然而,他们之间存在很多
    的头像 发表于 01-30 14:28 1565次阅读

    TOP500新榜出炉,Frontier依旧牢坐榜首

    电子发烧友网报道(文/周凯扬)在一年一度的国际算大会上,新一轮的TOP500算榜单终于出炉。此次,在芯片制造工艺发展以及计算负载出现剧变的当下,前十的榜单
    的头像 发表于 11-15 00:14 1469次阅读
    <b class='flag-5'>TOP500</b>新榜出炉,Frontier依旧牢坐榜首

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    安装OpenVINO工具套件英特尔Distribution时出现错误的原因?

    安装OpenVINO™工具套件英特尔 Distribution时,出现错误: Python 3.10.0.ECHO is off. Unsupported Python version.
    发表于 08-15 08:14

    被砍,推迟,命运多舛的英特尔GPU产品线

    电子发烧友网报道(文/周凯扬)英特尔虽然作为x86的CPU巨头,在消费、企业、数据中心乃至HPC级别的CPU领域都长年占据着主导地位。
    的头像 发表于 08-10 00:10 1232次阅读