0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Cygnus超算成为第一台进入超算top500榜单的GPU、FPGA混合加速超级计算机

DPVg_AI_era 来源:lp 2019-04-21 09:39 次阅读

异构超级计算机时代已经到来。近日,日本筑波大学上线的Cygnus超算成为第一台进入超算top500榜单的GPUFPGA混合加速超级计算机。在如何让CPU、GPU、FPGA多硬件协调、高效、同步提供算力上迈出了重要一步。

如果说“异构超级计算机”的时代已经到来,那么本月早些时候在日本筑波大学上线的 CPU、GPU、FPGA混合硬件超算系统就是这个时代的首批探索者之一。

这台超算名为Cygnus,由NEC制造,目前在日本筑波大计算科学中心(CCS)运行,由Intel Xeon CPU,Nvidia Tesla GPU和Intel Stratix 10 FPGA共同提供硬件支持。

Cygnus系统架构:所有80个Cygnus节点都配备了两个Xeon“Skylake”黄金 CPU和四个Tesla V100 GPU,同时在32个节点中,还和GPU搭载了两个Stratix 10 FPGA。48个CPU-GPU专用节点称为“Deneb节点”(以最亮的Cygnus A星命名),而32个CPU-GPU-FPGA节点称为Albireo节点(以Cygnus A双星命名)。

FPGA型号为Bittware 520N PCIe卡,供应商为Nallatech,这些“重型”FPGA卡可以提供10 teraflops的单精度性能,以及四组DDR4内存。尤其是,该卡配备了四个100G光纤网络端口,共提供400Gbps带宽,可以通过自身结构直接与其他520N FPGA进行通信。在Cygnus中,可将8×8的2D环形网络中的64个FPGA相互连接。Bittware包括一个板级支持包(BSP),可供OpenCL开发人员使用。

每个Cygnus节点的双精度浮点性能为30 teraflops,其中28个节点算力由四个V100 GPU提供。由两个Stratix 10器件在配备FPGA的节点上提供20个单精度teraflops。整机可提供算力为2.4 petaflop(64位浮点)或5.12 petaflop(32位浮点)算力。

目前,Cygnus正在取代该机构之前使用的COMA,COMA是一款由Intel Xeon CPU和Xeon Phi协处理器驱动的Cray CS300计算机集群。它于2014年组建,今年3月底退役,为Cygnus让位。

Mellanox HDR InfiniBand负责Cygnus上的系统互连,与独立的FPGA网络一样,系统设计人员确保了足够的带宽来进行节点间通信。每个节点使用四个100Gbps HDR通道,连接为全二分fat树网络。InfiniBand网络还用于访问托管在DataDirect Networks ES14KX设备上的2.5 PB Lustre文件系统。

尽管“双加速硬件”的设定很新潮,但其实Cygnus并不是试验机。其组建的主要用途是为宇宙学、粒子物理学、生命科学和人工智能等领域科学研究提供生产力。通过CPUGPUFPGA的组合,力求在实际科学研究中最有效地发挥这些硬件各自的计算优势。

具体来说,GPU负责提供粗粒度并行计算,主要擅长SIMD友好型计算,而FPGA提供细粒度并行计算,更适合应用于非SIMD算法。而对于气候模拟,生物信息学、分子动力学、地球物理学和线性代数中使用的一些特定算法,FPGA已经证明能够实现比CPU、GPU更快、更高效的运算。不过,在科学上可以通过代码同时高效利用这两种架构。

Cygnus系统架构图

Cygnus的目标应用之一是模拟早期宇宙,模拟光源的辐射传输。模拟过程是在一个套为ARGOT的代码中实现的,其中名为“ART”(真实辐射传输)的光线追踪算法是该模拟中的重要部分,ART部分更适合FPGA硬件平台上的大规模运行。

不过,ARGOT的其他部分在GPU上运行更合适,因此利用“双硬件加速”成为最佳解决方案。该应用程序在GPU和FPGA之间使用基于PCIe的直接存储器访问来实现协调,避免了使CPU受到影响而出现延迟。

ART实现是使用相对较高级别的OpenCL实现的,这表明其他开发人员也可以这样做。Bittware方面表示,使用OpenCL实现的用户与严格使用硬件描述语言(HDL)实现的用户进行对比发现,在许多情况下,OpenCL实现在性能方面与后者“足够接近”。

过去几年来,FPGA软件开发的进展促使微软、亚马逊和百度等巨头越来越广泛地采用FPGA硬件,尤其是在机器学习和推理等应用上。

但是,在高性能计算平台中,使用FPGA的设备更少。筑波大学的这台Cygnus将是唯一一个进入超算TOP500榜单的采用FPGA加速的超级计算机。德国帕德博恩大学去年安装了一台使用FPGA的超算,Cray CS500超级计算机,配备了32块Bittware 520N卡,不过该机没有配备GPU。

还有一些其他FPGA式的HPC集群遍布世界各地,包括美国佛罗里达州的CHREC(现改称SHREC)的Nova-G#系统,英国Hartree中心的Maxeler HPC-X以及Catapult 1和TACC的HARP v2计算机集群。

未来是否会有更多更强大的异构超级计算机诞生?这不仅取决于使用者的需求,更多还要取决于硬件厂商开发者是否继续从上到下推动生态系统建设。

从Bittware的角度来看,关键的推动力一定是来自中间层面的,同时有赖于对高级语言和更成熟的开发工具更充分的支持。目前的好消息是,业界最大的两家FPGA制造商——英特尔和赛林思都在为开发人员提供更好的工具,并将这些工具与下一代FPGA产品整合在一起。

从这一点上看,我们似乎可以对异构超算的未来保持一份谨慎的乐观。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1602

    文章

    21320

    浏览量

    593180
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126689
  • 超级计算机
    +关注

    关注

    2

    文章

    434

    浏览量

    41609

原文标题:迎接“异构超算”新时代:日本Cygnus超算GPU和FPGA双硬件加持,TOP500榜单只此一台

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英伟达帮助日本建造混合量子超级计算机

    英伟达正在帮助日本建造混合量子超级计算机,这是日本国家量子计算计划的一部分。
    的头像 发表于 04-23 14:54 206次阅读

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    欣喜收到《量子计算机——重构未来》书,感谢电子发烧友论坛提供了个让我了解量子计算机的机会! 自己对电子计算机有点了解,但对量子
    发表于 03-05 17:37

    Tesla 计划斥资 5 亿美元建造一台由 NVIDIA 的 AI GPU 提供支持的 Dojo 超级计算机

    ABSTRACT摘要Tesla计划斥资5亿美元建造一台由NVIDIA的AIGPU提供支持的Dojo超级计算机,因此该公司正在加大基于AI的开发力度。JAEALOT2024年1月27日Tesla计划
    的头像 发表于 02-19 12:45 309次阅读
    Tesla 计划斥资 5 亿美元建造<b class='flag-5'>一台</b>由 NVIDIA 的 AI <b class='flag-5'>GPU</b> 提供支持的 Dojo <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    埃尼集团宣布启动HPC6超级计算机项目,预计最高算力达600 PFlop/s 

    据了解,Eni 是全球知名石油巨头之一,同时也是意大利规模最大的三家企业之一,其股权结构中有约三分之一来自意大利政府。其目前已有两台超级计算机荣登 Top500 榜单——过去使用的 H
    的头像 发表于 01-30 13:43 255次阅读

    特斯拉将斥资5亿美元建造Dojo超级计算机

    据外媒报道,特斯拉将在其位于纽约布法罗的超级工厂投资超过5亿美元,建造一台名为Dojo的超级计算机。这一举措旨在推进特斯拉的自动驾驶汽车计划。
    的头像 发表于 01-29 11:26 349次阅读

    欧盟首台百亿亿次级超级计算机JUPITER建设成果显著,进入新阶段

    欧洲超级计算机联盟 EuroHPC JU 曾于 2023 年 10 月宣布,将投资 2.73 亿欧元打造欧洲第一台超大规模超级计算机——JU
    的头像 发表于 01-25 14:40 272次阅读

    大模型非GPU专属 AMD EPYC秀出CPU AI实力

    根据世界超级计算机排名第62届top500,全体500超级电脑套装的amd平台为140个,比前年增加了39%。此外,amd根据green
    的头像 发表于 12-07 15:51 349次阅读

    新一代国产超算“天河星逸”亮相,多方面较“天河二号”实现倍增

    但天河星逸的具体性能尚不清楚。《天河二号》2013年研制成功,连续6届top500世界超级电脑6连冠。这是中国超级计算机系统研制进入世界前列
    的头像 发表于 12-07 14:43 642次阅读

    超算连续霸榜,富士通推动计算技术革新

    主要高性能计算机排名中, 连续第八次蝉联全球榜首 。与此同时,在TOP500和HPL-MxP榜单中,超级计算机“富岳”目前分别排名全球第四及
    的头像 发表于 11-29 17:10 262次阅读
    超算连续霸榜,富士通推动<b class='flag-5'>计算</b>技术革新

    TOP500新榜出炉,Frontier依旧牢坐榜首

    电子发烧友网报道(文/周凯扬)在一年一度的国际超算大会上,新一轮的TOP500超算榜单终于出炉。此次,在芯片制造工艺发展以及计算负载出现剧变的当下,前十的榜单出现了一些新的变动,却也让
    的头像 发表于 11-15 00:14 1313次阅读
    <b class='flag-5'>TOP500</b>新榜出炉,Frontier依旧牢坐榜首

    FPGA和CPU、GPU有什么区别?为什么越来越重要?

    ,在数据中心高性能计算及 AI 训练中,CPU 这“主角”的重要性下降,而以往的“配角们”,即 GPUFPGA、TPU、DPU 等的加速
    发表于 11-09 14:09

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛 随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去几
    的头像 发表于 08-17 10:51 321次阅读

    分析 丨 AI数据中心堪比超算,NVIDIA与AMD同场竞技

    )的Frontier系统位列榜首,自2022年6月以来,Frontier一直是全球超级计算机Top500名单上的强大设备。 图注:全球超级计算机
    的头像 发表于 07-17 10:12 232次阅读
    分析 丨 AI数据中心堪比超算,NVIDIA与AMD同场竞技

    FPGA实现MPU6050姿态解

    . 简介 在之前的文章中(很久之前了,已经通过FPGA获取到了MPU6050的六轴数据: 三轴加速 和 三轴角速度,但是没有对它进行然后处理。那么在本篇文章中,将利用Cordic算法来进行姿态解
    发表于 06-08 13:49

    超算、智算及数据中心报告(2023)

    超算算力以每秒浮点运算次数衡量,一般以Petaflops(PFlops)为度量单位。在全球Top500榜单中,中国供应商制造超级计算机数量连续9次市场份额位居全球
    的头像 发表于 05-26 16:49 2528次阅读
    超算、智算及数据中心报告(2023)