0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Fugaku超级计算机程序已实现100倍的速度提升

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-12-28 09:26 次阅读

在不到18个月的时间里,密歇根大学的一个团队采用GPU,为一个基于复杂数学的程序实现了20倍的提速。该程序为量子科学奠定了基础。

Vikram Gavini 的实验室以创纪录的速度,跨越了微观世界的一座重要里程碑。

这支由三人组成的密歇根大学团队创建了一个使用复杂的数学来深入观察原子世界的程序。该程序将推动许多科学领域的发展,以及多重领域的设计工作——从更轻的汽车到更高效的药物。

凭借 GPU ,该团队开放源码库中的代码在短短18个月内实现了20倍速度提升。

通往Summit的旅程

2018年年中,当该团队正准备发布一个在 CPU 上运行的代码版本时,他们收到了橡树岭国家实验室 GPU 黑客马拉松的邀请。全球最快的超级计算机之一—— Summit 就位于该实验室。

机械工程和材料科学教授 Gavini 表示:“我们当时的想法是看看我们能实现什么。”

该实验室的博士后 Sambit Das 参加了这场为期五天的活动。他认为:“我们很快意识到我们的代码可以充分发挥GPU大规模并行处理的能力。”

在活动结束前, Das 和另一位实验室成员 Phani Motamarri 将代码转移到 CUDA 及其库中,实现了5倍速度提升。这也让他们意识到,未来能实现的还有更多。

6个月内实现从5倍到20倍的速度提升

在接下来的几个月里,该实验室继续对该程序进行调优,使其能够对1万个镁原子中的10万个电子进行分析。到2019年初,该程序已经可以在 Summit 上运行。

随着 Summit 的节点数量不断增加,该实验室采用迭代法,在节点上运行越来越多的代码。截止4月,该实验室使用了该系统27,000个 GPU 中的大部分,实现了近 46 petaflops 的性能,达到了之前的20倍。

对于一个基于密度泛函理论(DFT)的程序来说,这是一个前所未有的结果。密度函数理论是一项解释亚原子粒子之间量子相互作用的复杂数学理论。

适用于高难度算法的分布式计算

DFT 算法的复杂性和基础性使其目前占用了所有公共研究计算机四分之一的时间。在被引用次数最多的100篇科学论文中,有12篇是 DFT 为主题的。该计算还被用来分析从天体物理学到 DNA 链的一切。

最初,根据该实验室的报告,该程序使用了 Summit 的顶尖理论性能的近30%,这是一个异常高的效率。相比之下,大多数其他 DFT 代码除了能够使用数个处理器之外,很难实现进一步的扩展,因此就连效率报告都没有。

Gavini 表示:“能实现这一前所未有的效率令我们感到非常高兴。”

声名鹊起

2019年底,该团队被提名为戈登贝尔奖的入围者。这是该实验室首次参加这一“高性能计算领域诺贝尔奖”的评选。

Gavini 表示:“这为我们的实验室和大学带来了很高的知名度,我认为这次努力还只是一个开始。”

事实上,自评选以来,实验室在 Summit 上,将代码的性能提升到了 64 petaflops ,效率亦达到38%。并且该实验室已经在探索在其他系统和应用上的使用。

寻求更多的应用和更高的性能

最初,这项工作被用于分析镁。这种比当今汽车和飞机使用的钢和铝轻得多的金属有望大幅节省燃料。去年,该实验室与另一团队合作,研究电子在 DNA 中的移动方式,这项工作可以帮助其他研究者研发出更有效的药物。

接下来重要的一步是在 Perlmutter 上运行代码。这是一台使用最新 NVIDIA A100 Tensor Core GPU 的超级计算机。根据Das的报告,基于A100 GPU对TensorFloat-32的支持,与 Summit GPU 相比,这台计算机目前已经实现了4倍速度提升。TensorFloat-32 是一种既能提供快速结果,又能实现高精度的混合精度格式。

与其他 DFT 代码相比,该实验室程序已实现100倍的速度提升,但 Gavini 并没有就此止步。他已经在考虑在 Fugaku 上测试它。Fugaku 是基于 Arm 系统的全球最快的超级计算机。

他表示:“眼下的收获总会令人欣喜,但‘路漫漫其修远兮,吾将上下而求索’。这次的成果也是我们新征程的开始。”

原文标题:借助数学的力量:密歇根团队破解亚原子世界的密码

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4403

    浏览量

    126569
  • 计算机
    +关注

    关注

    19

    文章

    6631

    浏览量

    84373
  • 代码
    +关注

    关注

    30

    文章

    4553

    浏览量

    66665

原文标题:借助数学的力量:密歇根团队破解亚原子世界的密码

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    从原子到超级计算机:NVIDIA与合作伙伴扩展量子计算应用

    量子计算领域的最新进展包括分子研究、部署巨型超级计算机,以及通过一项新的学术计划培养量子从业人员。
    的头像 发表于 03-22 10:05 123次阅读

    诺和诺德基金会将联手英伟达打造丹麦AI超级计算机

    诺和诺德基金会携手英伟达,共同宣布在丹麦打造一台领先的AI超级计算机。这台超级计算机将致力于推动医疗保健、生命科学以及绿色转型等领域的科研与创新,为丹麦乃至全球的诺和诺德基金会携手英伟
    的头像 发表于 03-21 13:43 146次阅读

    【量子计算机重构未来 | 阅读体验】+量子计算机的原理究竟是什么以及有哪些应用

    计算方法的区别传统方法是,按照不走枚举所有情况,而量子计算是一次处理所有情况,是一步到位。但是这里又有疑惑了,量子计算如何实现的一步到位呢, 这里引入了量子比特和传统
    发表于 03-11 12:50

    【量子计算机重构未来 | 阅读体验】第二章关键知识点

    量子计算机所能做的,刚好是减少计算和操作的繁琐程度。也就是说,量子计算机是因为计算过程简化而速度快的
    发表于 03-06 23:17

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    欣喜收到《量子计算机——重构未来》一书,感谢电子发烧友论坛提供了一个让我了解量子计算机的机会! 自己对电子计算机有点了解,但对量子计算机真是一无所知,只是听说过量子纠缠、超快的运算
    发表于 03-05 17:37

    计算机为什么利用反码来实现减法?

    计算机为什么利用反码来实现减法? 计算机实现减法运算时利用反码的原因可以从历史背景、计算机设计优势和运算规则等方面来分析。 1. 历史背景
    的头像 发表于 02-19 15:10 214次阅读

    特斯拉将斥资5亿美元建造Dojo超级计算机

    据外媒报道,特斯拉将在其位于纽约布法罗的超级工厂投资超过5亿美元,建造一台名为Dojo的超级计算机。这一举措旨在推进特斯拉的自动驾驶汽车计划。
    的头像 发表于 01-29 11:26 334次阅读

    Blackwell GB100能否在超级计算机和AI市场保持领先优势?

    NVIDIA 下一代 Blackwell GB100 传将采用芯片堆栈设计提升效能和效率,但也面临工艺和封装的挑战,能否在超级计算机和 AI 市场保持领先优势?
    的头像 发表于 10-24 17:43 575次阅读

    工业计算机的应用

    工业计算机在半导体设备上的应用,具体在哪一方面。比如说图像处理使用什么样的计算机,工业控制使用哪一方面的计算机
    发表于 09-12 14:19

    计算机组成与设计

    计算机组成与设计 计算机组成与设计是计算机科学中最基础的课程之一,它主要阐述了计算机的组成原理和设计方法。随着计算机技术的快速发展,
    的头像 发表于 08-17 12:37 921次阅读

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛 随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去几十年中,人们对
    的头像 发表于 08-17 10:51 316次阅读

    gh200和超级计算机哪个牛

    gh200和超级计算机哪个牛  随着科技的不断发展,计算机已经成为人类生活不可或缺的一部分。计算机的崛起极大地改变了世界和每个人的生活。过去几十年中,人们对
    的头像 发表于 08-16 17:34 323次阅读

    黄仁勋有望公布DGX-GH200 AI超级计算机更多消息

    英伟达于2023年5月发布的dgx-gh200 ai超级计算机使用nvlink技术,拥有256个gh200超级芯片,运算速度为1 exaplop(1
    的头像 发表于 08-08 11:37 445次阅读

    NVIDIA Cambridge-1 AI 超级计算机通过云让更多研究人员能够访问

    继成功打造 Cambridge-1 之后,NVIDIA 将该超级计算机连入 NVIDIA DGX Cloud,实现更多领域、更广泛的访问。 科学研究人员需要海量计算资源来支持各个领域的
    的头像 发表于 06-19 19:05 294次阅读

    NVIDIA Grace 掀起新型节能 Arm 超级计算机的新浪潮

    英国科研联盟 GW4 打造能效提升 6 倍的超级计算机,用于气候科学、医学研究等领域 德国汉堡 - 国际超算大会(ISC)- 2023 年 5 月 21 日 - NVIDIA 今天
    的头像 发表于 05-23 07:10 375次阅读