0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超级计算机的异构分歧

E4Life 来源:电子发烧友网 作者:周凯扬 2022-05-10 00:27 次阅读

电子发烧友网报道(文/周凯扬)转眼接近六月,离新一期TOP500超算排名公布的日子又不远了。这半年多时间里,业界在超算上的动作可不小,新的处理器、新的加速器都在积极加入各大超算中心、国家实验室的大规模部署。国内的百亿亿级超算系统目前还没有提交成绩,不过这已经不重要了,这场谁先做到百亿亿级的竞赛中国已经取胜了,更不用说去年就通过新一代神威超算打破了量子霸权。

不过近期有一种观点开始冒头,那就是超算的规模已经越来越大,结构也越来越复杂,未来除了CPUGPU之外,FPGAAI加速器、量子加速器、神经形态芯片和硅光芯片等设备是否会在超算上占据更大的份额呢?在这样的异构体系下,超算是否会像其他大型仪器,比如大型粒子对撞机、平方公里阵列射电望远镜一样,逐一替换部件呢?

开始异构化的超算

尽管FPGA已经经历了多年的应用,但在HPC上亮相的次数可谓少之又少,这并非是缺乏尝试,而是传统FPGA硬件上存在限制,开发工具也相对特化,对于尝试数据科学的开发者来说上手难度较高。

VersalHBM /Xilinx


然而近年来,在各大FPGA厂商的努力下,FPGA已经有了长足的发展,其性能足以支撑起HPC应用的运行,FPGA编程也终于有了软件开发而不是硬件设计的样子。英国的ExCALIBUR项目就开始利用FPGA作为HPC应用的测试平台,所用硬件有Xilinx的Alveo、Versal,也有英特尔的Stratix-10。

神经形态芯片也想要取代GPU的位置,美国桑迪亚国家实验室就利用了5000万片英特尔的Loihi神经形态芯片进行了研究,证明了这类芯片不仅仅适用于解决AI上的挑战,在分子模拟、生物学建模这些超算应用也能做到极高的能效比。

即便如此,我们在TOP500上看到利用新硬件的情况还是很少,英特尔、AMD英伟达还是占据了绝对的主导。

实际应用与软件移植的痛点

但说到头来,TOP500所奉行的HPL测试标准并不是衡量超算性能的唯一标准,还有专注于带宽的HPCG,以及更看重时延的Graph500。异构超算可以借助不同硬件的特性,将这些痛点各个击破。

富岳超级计算机 / 日本理化学研究所


日本富岳超算的主要贡献者之一,前不久刚获得了日本政府所颁发紫绶褒章的松冈聪却对超算上的异构趋势表示了一定的怀疑。他认为未来的HPC系统不会由各种类型的设备组成,反倒是会更加慎重地选择所用的处理器,从而兼顾计算、带宽和时延的需求。

原因很简单,那就是软件生态。如今的HPC代码运行着世界上最复杂的应用,比如气象预测、大规模数字孪生等等。但这类应用由于复杂程度之高,承担不起因为当前的硬件架构几年内过时而面临着重新编程或淘汰的代价,这也就是为何CPU+GPU的配置在超算领域依旧是龙头老大,因为这种架构下的超算软件生态已经成熟,可以沿用下去。

就拿常见的超算编程语言Fortran为例,虽说这一语言在数学运算上有着很大的优势,但由于维护和移植困难,不少开发者都转向了C/C++,而GPU又多用C++,所以即便现在各种加速器频出,率先使用他们的也只是数据中心或AI等场景,并非超算。

但松冈聪也表示,他并不是指这些设备无法运行这些代码,或者移植困难不代表没有尝试的价值,而是即便代码可以运行在这些设备上,也很难通过负载均衡来践行古斯塔夫森定律,即处理器数量增加可以让程序运行时间减少,最好的解决思路还是CPU或CPU+GPU这种同构的方案。

虽然其他硬件加入的异构确实对不同的工作流各个攻破,但超算很多时候是建好就完事的计算系统,后续也许只能增加同样的计算资源来提高硬件性能,设计者无法预先判断未来要运行的任务,因此追求这样的灵活性还不如使用同构这一通解。

在使用超算的研究者和科学家看来,他们在一台超算上力求取得最大性能就已经付出了巨大的心力,要是超算内真的囊括一堆不同架构的设备,单是庞大的编程和移植工作量就足以让他们丧失兴趣。他们或许更愿意去优化算法或理论,都不愿意因为架构的变化而去花费大量时间编程。

云化超算成为可行方案?

还有一种观点也获得了不少支持,那就是云化超算。云服务厂商在HPC上的努力也都有目共睹,去年超算大会上,国内外大学之间的比赛也是在云服务上构筑超算系统,TOP500上来自云服务厂商的超算也有几台,微软的Azure就有5台,最强的一台Voyager-EUS2甚至排到了第十的高位。

虽然云端部署超算的成本同样巨大,但对于一些实验室来说,云端的模块化特性让他们不用担心自己用不到什么组件,花更少的时间来购置超级计算机,花更多的时间去使用它。比如英国政府就选择在微软的Azure上部署慧与的CrayEX超算,用其完成气象预测工作。更方便的是,由于超算消耗电力巨大,基础设施可以托管在北欧等清洁能源更多的地方。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18275

    浏览量

    222147
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10442

    浏览量

    206547
  • 超级计算机
    +关注

    关注

    2

    文章

    434

    浏览量

    41609
收藏 人收藏

    评论

    相关推荐

    英伟达帮助日本建造混合量子超级计算机

    英伟达正在帮助日本建造混合量子超级计算机,这是日本国家量子计算计划的一部分。
    的头像 发表于 04-23 14:54 206次阅读

    从原子到超级计算机:NVIDIA与合作伙伴扩展量子计算应用

    量子计算领域的最新进展包括分子研究、部署巨型超级计算机,以及通过一项新的学术计划培养量子从业人员。
    的头像 发表于 03-22 10:05 142次阅读

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    诺和诺德基金会携手英伟达,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与创新,为丹麦乃至全球的诺和诺德基金会携手英伟
    的头像 发表于 03-21 13:43 160次阅读

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    欣喜收到《量子计算机——重构未来》一书,感谢电子发烧友论坛提供了一个让我了解量子计算机的机会! 自己对电子计算机有点了解,但对量子计算机真是一无所知,只是听说过量子纠缠、超快的运算速
    发表于 03-05 17:37

    特斯拉将在纽约州打造Dojo超级计算机

    特斯拉近日宣布,将在美国纽约州布法罗市投资5亿美元,建造一台名为“Dojo”的超级计算机。这一决策源于纽约州稳定的电力供应、杰出的人才储备以及满足项目需求的充足空间。
    的头像 发表于 02-01 10:32 336次阅读

    特斯拉将斥资5亿美元建造Dojo超级计算机

    据外媒报道,特斯拉将在其位于纽约布法罗的超级工厂投资超过5亿美元,建造一台名为Dojo的超级计算机。这一举措旨在推进特斯拉的自动驾驶汽车计划。
    的头像 发表于 01-29 11:26 349次阅读

    工业计算机的应用

    工业计算机在半导体设备上的应用,具体在哪一方面。比如说图像处理使用什么样的计算机,工业控制使用哪一方面的计算机
    发表于 09-12 14:19

    计算机组成与设计

    计算机组成与设计 计算机组成与设计是计算机科学中最基础的课程之一,它主要阐述了计算机的组成原理和设计方法。随着计算机技术的快速发展,
    的头像 发表于 08-17 12:37 930次阅读

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛 随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去几十年中,人们对
    的头像 发表于 08-17 10:51 321次阅读

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛  随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去几十年中,人们对
    的头像 发表于 08-16 17:34 330次阅读

    新书推荐《算力经济·从超级计算到云计算

    超级计算机是什么?超级计算机到底有什么用? 答案就藏在这本 澎峰科技首席科学家、顾问张云泉 参与编著的《算力经济》 里。 这本书深入浅出地叙述了超级
    的头像 发表于 07-13 18:15 384次阅读
    新书推荐《算力经济·从<b class='flag-5'>超级</b><b class='flag-5'>计算</b>到云<b class='flag-5'>计算</b>》

    NVIDIA推出DGX GH200 AI超级计算机

    新型AI超级计算机将256个Grace Hopper超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式AI、推荐系统和数据处理的巨型模型     COMPUTEX
    发表于 05-30 14:15 448次阅读
    NVIDIA推出DGX GH200 AI<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超级计算机

    新型 AI 超级计算机将 256 个 Grace Hopper 超级芯片连接为巨大的、1-Exaflop、144TB GPU,用于支持生成式 AI、推荐系统和数据处理的巨型模型 COMPUTEX
    的头像 发表于 05-30 01:40 1516次阅读
    COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    NVIDIA Grace 掀起新型节能 Arm 超级计算机的新浪潮

    英国科研联盟 GW4 打造能效提升 6 倍的超级计算机,用于气候科学、医学研究等领域 德国汉堡 - 国际超算大会(ISC)- 2023 年 5 月 21 日 - NVIDIA 今天
    的头像 发表于 05-23 07:10 380次阅读

    三星计划开发基于内存的超级计算机

    "三星电子的目标是在2028年前开发出一台基于内存的超级计算机,"三星电子设备解决方案业务的首席执行官Kyung Kye-hyun周四在大田的KAIST发表演讲时说。
    发表于 05-12 11:26 184次阅读