0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Fugaku超级计算机程序已实现100倍的速度提升

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-12-28 09:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在不到18个月的时间里,密歇根大学的一个团队采用GPU,为一个基于复杂数学的程序实现了20倍的提速。该程序为量子科学奠定了基础。

Vikram Gavini 的实验室以创纪录的速度,跨越了微观世界的一座重要里程碑。

这支由三人组成的密歇根大学团队创建了一个使用复杂的数学来深入观察原子世界的程序。该程序将推动许多科学领域的发展,以及多重领域的设计工作——从更轻的汽车到更高效的药物。

凭借 GPU ,该团队开放源码库中的代码在短短18个月内实现了20倍速度提升。

通往Summit的旅程

2018年年中,当该团队正准备发布一个在 CPU 上运行的代码版本时,他们收到了橡树岭国家实验室 GPU 黑客马拉松的邀请。全球最快的超级计算机之一—— Summit 就位于该实验室。

机械工程和材料科学教授 Gavini 表示:“我们当时的想法是看看我们能实现什么。”

该实验室的博士后 Sambit Das 参加了这场为期五天的活动。他认为:“我们很快意识到我们的代码可以充分发挥GPU大规模并行处理的能力。”

在活动结束前, Das 和另一位实验室成员 Phani Motamarri 将代码转移到 CUDA 及其库中,实现了5倍速度提升。这也让他们意识到,未来能实现的还有更多。

6个月内实现从5倍到20倍的速度提升

在接下来的几个月里,该实验室继续对该程序进行调优,使其能够对1万个镁原子中的10万个电子进行分析。到2019年初,该程序已经可以在 Summit 上运行。

随着 Summit 的节点数量不断增加,该实验室采用迭代法,在节点上运行越来越多的代码。截止4月,该实验室使用了该系统27,000个 GPU 中的大部分,实现了近 46 petaflops 的性能,达到了之前的20倍。

对于一个基于密度泛函理论(DFT)的程序来说,这是一个前所未有的结果。密度函数理论是一项解释亚原子粒子之间量子相互作用的复杂数学理论。

适用于高难度算法的分布式计算

DFT 算法的复杂性和基础性使其目前占用了所有公共研究计算机四分之一的时间。在被引用次数最多的100篇科学论文中,有12篇是 DFT 为主题的。该计算还被用来分析从天体物理学到 DNA 链的一切。

最初,根据该实验室的报告,该程序使用了 Summit 的顶尖理论性能的近30%,这是一个异常高的效率。相比之下,大多数其他 DFT 代码除了能够使用数个处理器之外,很难实现进一步的扩展,因此就连效率报告都没有。

Gavini 表示:“能实现这一前所未有的效率令我们感到非常高兴。”

声名鹊起

2019年底,该团队被提名为戈登贝尔奖的入围者。这是该实验室首次参加这一“高性能计算领域诺贝尔奖”的评选。

Gavini 表示:“这为我们的实验室和大学带来了很高的知名度,我认为这次努力还只是一个开始。”

事实上,自评选以来,实验室在 Summit 上,将代码的性能提升到了 64 petaflops ,效率亦达到38%。并且该实验室已经在探索在其他系统和应用上的使用。

寻求更多的应用和更高的性能

最初,这项工作被用于分析镁。这种比当今汽车和飞机使用的钢和铝轻得多的金属有望大幅节省燃料。去年,该实验室与另一团队合作,研究电子在 DNA 中的移动方式,这项工作可以帮助其他研究者研发出更有效的药物。

接下来重要的一步是在 Perlmutter 上运行代码。这是一台使用最新 NVIDIA A100 Tensor Core GPU 的超级计算机。根据Das的报告,基于A100 GPU对TensorFloat-32的支持,与 Summit GPU 相比,这台计算机目前已经实现了4倍速度提升。TensorFloat-32 是一种既能提供快速结果,又能实现高精度的混合精度格式。

与其他 DFT 代码相比,该实验室程序已实现100倍的速度提升,但 Gavini 并没有就此止步。他已经在考虑在 Fugaku 上测试它。Fugaku 是基于 Arm 系统的全球最快的超级计算机。

他表示:“眼下的收获总会令人欣喜,但‘路漫漫其修远兮,吾将上下而求索’。这次的成果也是我们新征程的开始。”

原文标题:借助数学的力量:密歇根团队破解亚原子世界的密码

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136060
  • 计算机
    +关注

    关注

    19

    文章

    7839

    浏览量

    93457
  • 代码
    +关注

    关注

    30

    文章

    4976

    浏览量

    74373

原文标题:借助数学的力量:密歇根团队破解亚原子世界的密码

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用NVIDIA技术驱动的超级计算机助力开放科学研究

    五个备受瞩目的 HPC 奖决赛入围项目凭借 Alps、JUPITER 和 Perlmutter 超级计算机的支持在气候建模、流体模拟等领域取得了重大突破。
    的头像 发表于 11-25 11:17 982次阅读

    快450000000!超导量子计算机“天衍-287”建成

    平台诞生,处理特定问题的速度较当前最快超级计算机快4.5亿,成为全球量子计算实用化进程中的关键里程碑。     “天衍-287”的核心竞争
    的头像 发表于 11-18 08:40 8908次阅读
    快450000000<b class='flag-5'>倍</b>!超导量子<b class='flag-5'>计算机</b>“天衍-287”建成

    谷歌芯片实现量子计算新突破,比超算快13000

    在特定任务上的运行速度比传统超级计算机快13000,并且这种算法可以在类似平台上得到重现。   量子比特极易受到环境干扰,导致计算错误,这
    的头像 发表于 10-27 06:51 9952次阅读

    今日看点:谷歌芯片实现量子计算比经典超算快13000;NFC 技术突破:读取距离从 5 毫米提升至 20 毫米

    性能甚至超越了最快的经典超级计算机速度快 13000 。   Willow是谷歌于去年12月宣布推出的量子芯片。当时,Willow量子芯片在5分钟内完成了一项传统
    发表于 10-23 10:20 1718次阅读

    奥士康召开DGX Spark AI超级计算机项目表彰大会

    2025年9月22日,奥士康科技股份有限公司隆重召开DGXSparkAI超级计算机项目表彰大会,以表彰在客户开发、产品研发、工程设计和批量生产等方面作出突出贡献的核心团队。
    的头像 发表于 09-24 10:51 1048次阅读

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 ExaFLOPS,不仅是英国最快的系统,同时也是全球能效最高的系统之一。
    的头像 发表于 07-28 15:07 1424次阅读

    自动化计算机经过加固后有什么好处?

    让我们讨论一下部署坚固的自动化计算机的一些好处。1.温度范围宽自动化计算机经过工程设计,配备了支持宽温度范围的组件,使自动化计算解决方案能够在各种不同的极端环境中运行。自动化计算机能够
    的头像 发表于 07-21 16:44 748次阅读
    自动化<b class='flag-5'>计算机</b>经过加固后有什么好处?

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为明显,其中许多
    的头像 发表于 07-15 16:32 891次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠性和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 908次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每一次都源于对技术的创造性再利用。例如,早期的超级
    的头像 发表于 06-26 19:39 1420次阅读
    NVIDIA驱动的现代<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>如何突破<b class='flag-5'>速度</b>极限并推动科学发展

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30
    的头像 发表于 06-12 15:39 1347次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI 工作负载的
    的头像 发表于 06-12 15:33 1642次阅读

    NVIDIA助力全球最大量子研究超级计算机

    NVIDIA 宣布将开设量子-AI 技术商业应用全球研发中心(G-QuAT),该中心部署了全球最大量子计算研究专用超级计算机 ABCI-Q。
    的头像 发表于 05-22 09:44 1087次阅读

    利用边缘计算和工业计算机实现智能视频分析

    IVA的好处、实际部署应用程序以及工业计算机如何实现这些解决方案。一、什么是智能视频分析(IVA)?智能视频分析(IVA)集成了复杂的计算机视觉,通常与卷积神经网
    的头像 发表于 05-16 14:37 974次阅读
    利用边缘<b class='flag-5'>计算</b>和工业<b class='flag-5'>计算机</b><b class='flag-5'>实现</b>智能视频分析

    一文带你了解工业计算机尺寸

    一项艰巨的任务。本博客将指导您了解关键的工业计算机尺寸、使用案例。关键工业计算机外形要素及其使用案例一、工业微型PC尺寸范围:宽度:100毫米-180毫米深度:10
    的头像 发表于 04-24 13:35 1197次阅读
    一文带你了解工业<b class='flag-5'>计算机</b>尺寸