0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Fugaku超级计算机程序已实现100倍的速度提升

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-12-28 09:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在不到18个月的时间里,密歇根大学的一个团队采用GPU,为一个基于复杂数学的程序实现了20倍的提速。该程序为量子科学奠定了基础。

Vikram Gavini 的实验室以创纪录的速度,跨越了微观世界的一座重要里程碑。

这支由三人组成的密歇根大学团队创建了一个使用复杂的数学来深入观察原子世界的程序。该程序将推动许多科学领域的发展,以及多重领域的设计工作——从更轻的汽车到更高效的药物。

凭借 GPU ,该团队开放源码库中的代码在短短18个月内实现了20倍速度提升。

通往Summit的旅程

2018年年中,当该团队正准备发布一个在 CPU 上运行的代码版本时,他们收到了橡树岭国家实验室 GPU 黑客马拉松的邀请。全球最快的超级计算机之一—— Summit 就位于该实验室。

机械工程和材料科学教授 Gavini 表示:“我们当时的想法是看看我们能实现什么。”

该实验室的博士后 Sambit Das 参加了这场为期五天的活动。他认为:“我们很快意识到我们的代码可以充分发挥GPU大规模并行处理的能力。”

在活动结束前, Das 和另一位实验室成员 Phani Motamarri 将代码转移到 CUDA 及其库中,实现了5倍速度提升。这也让他们意识到,未来能实现的还有更多。

6个月内实现从5倍到20倍的速度提升

在接下来的几个月里,该实验室继续对该程序进行调优,使其能够对1万个镁原子中的10万个电子进行分析。到2019年初,该程序已经可以在 Summit 上运行。

随着 Summit 的节点数量不断增加,该实验室采用迭代法,在节点上运行越来越多的代码。截止4月,该实验室使用了该系统27,000个 GPU 中的大部分,实现了近 46 petaflops 的性能,达到了之前的20倍。

对于一个基于密度泛函理论(DFT)的程序来说,这是一个前所未有的结果。密度函数理论是一项解释亚原子粒子之间量子相互作用的复杂数学理论。

适用于高难度算法的分布式计算

DFT 算法的复杂性和基础性使其目前占用了所有公共研究计算机四分之一的时间。在被引用次数最多的100篇科学论文中,有12篇是 DFT 为主题的。该计算还被用来分析从天体物理学到 DNA 链的一切。

最初,根据该实验室的报告,该程序使用了 Summit 的顶尖理论性能的近30%,这是一个异常高的效率。相比之下,大多数其他 DFT 代码除了能够使用数个处理器之外,很难实现进一步的扩展,因此就连效率报告都没有。

Gavini 表示:“能实现这一前所未有的效率令我们感到非常高兴。”

声名鹊起

2019年底,该团队被提名为戈登贝尔奖的入围者。这是该实验室首次参加这一“高性能计算领域诺贝尔奖”的评选。

Gavini 表示:“这为我们的实验室和大学带来了很高的知名度,我认为这次努力还只是一个开始。”

事实上,自评选以来,实验室在 Summit 上,将代码的性能提升到了 64 petaflops ,效率亦达到38%。并且该实验室已经在探索在其他系统和应用上的使用。

寻求更多的应用和更高的性能

最初,这项工作被用于分析镁。这种比当今汽车和飞机使用的钢和铝轻得多的金属有望大幅节省燃料。去年,该实验室与另一团队合作,研究电子在 DNA 中的移动方式,这项工作可以帮助其他研究者研发出更有效的药物。

接下来重要的一步是在 Perlmutter 上运行代码。这是一台使用最新 NVIDIA A100 Tensor Core GPU 的超级计算机。根据Das的报告,基于A100 GPU对TensorFloat-32的支持,与 Summit GPU 相比,这台计算机目前已经实现了4倍速度提升。TensorFloat-32 是一种既能提供快速结果,又能实现高精度的混合精度格式。

与其他 DFT 代码相比,该实验室程序已实现100倍的速度提升,但 Gavini 并没有就此止步。他已经在考虑在 Fugaku 上测试它。Fugaku 是基于 Arm 系统的全球最快的超级计算机。

他表示:“眼下的收获总会令人欣喜,但‘路漫漫其修远兮,吾将上下而求索’。这次的成果也是我们新征程的开始。”

原文标题:借助数学的力量:密歇根团队破解亚原子世界的密码

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134456
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92681
  • 代码
    +关注

    关注

    30

    文章

    4941

    浏览量

    73148

原文标题:借助数学的力量:密歇根团队破解亚原子世界的密码

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用NVIDIA技术驱动的超级计算机助力开放科学研究

    五个备受瞩目的 HPC 奖决赛入围项目凭借 Alps、JUPITER 和 Perlmutter 超级计算机的支持在气候建模、流体模拟等领域取得了重大突破。
    的头像 发表于 11-25 11:17 426次阅读

    快450000000!超导量子计算机“天衍-287”建成

    平台诞生,处理特定问题的速度较当前最快超级计算机快4.5亿,成为全球量子计算实用化进程中的关键里程碑。     “天衍-287”的核心竞争
    的头像 发表于 11-18 08:40 8092次阅读
    快450000000<b class='flag-5'>倍</b>!超导量子<b class='flag-5'>计算机</b>“天衍-287”建成

    谷歌芯片实现量子计算新突破,比超算快13000

    在特定任务上的运行速度比传统超级计算机快13000,并且这种算法可以在类似平台上得到重现。   量子比特极易受到环境干扰,导致计算错误,这
    的头像 发表于 10-27 06:51 9126次阅读

    今日看点:谷歌芯片实现量子计算比经典超算快13000;NFC 技术突破:读取距离从 5 毫米提升至 20 毫米

    性能甚至超越了最快的经典超级计算机速度快 13000 。   Willow是谷歌于去年12月宣布推出的量子芯片。当时,Willow量子芯片在5分钟内完成了一项传统
    发表于 10-23 10:20 1226次阅读

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业自动化在汽车制造中体现得最为明显,其中许多
    的头像 发表于 07-15 16:32 530次阅读
    自动化<b class='flag-5'>计算机</b>的功能与用途

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每一次都源于对技术的创造性再利用。例如,早期的超级
    的头像 发表于 06-26 19:39 979次阅读
    NVIDIA驱动的现代<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>如何突破<b class='flag-5'>速度</b>极限并推动科学发展

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30
    的头像 发表于 06-12 15:39 830次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC 和 AI 工作负载的
    的头像 发表于 06-12 15:33 1039次阅读

    NVIDIA助力全球最大量子研究超级计算机

    NVIDIA 宣布将开设量子-AI 技术商业应用全球研发中心(G-QuAT),该中心部署了全球最大量子计算研究专用超级计算机 ABCI-Q。
    的头像 发表于 05-22 09:44 672次阅读

    超级计算与 HPC 之间的界限日趋模糊

    本文由半导体产业纵横(ID:ICVIEWS)编译自semiengineering由于人工智能和分解而加速的性能改进正在推动计算前沿的重大变革。由于人工智能的普及,超级计算机和高性能计算机
    的头像 发表于 03-17 10:33 833次阅读
    <b class='flag-5'>超级</b><b class='flag-5'>计算</b>与 HPC 之间的界限日趋模糊

    加州理工学院开发出超100GHz时钟速度的全光计算机

    加州理工学院的研究人员取得重大突破,开发出一款能实现超过100GHz时钟速度的全光计算机。 长期以来,电子计算机时钟频率在近20年停滞于5G
    的头像 发表于 01-23 10:32 764次阅读

    NVIDIA推出个人AI超级计算机Project DIGITS

    NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS,全球的 AI 研究员、数据科学家和学生都可获取 NVIDIA Grace Blackwell 平台的强大功能。
    的头像 发表于 01-08 11:03 1159次阅读

    NVIDIA发布高性价比生成式AI超级计算机

    NVIDIA近日推出了一款全新的生成式AI超级计算机——Jetson Orin Nano Super开发者套件,这款超级计算机不仅体积小巧,而且性价比极高,为商业AI开发者、科技爱好者
    的头像 发表于 12-24 10:44 1008次阅读

    NVIDIA 推出高性价比的生成式 AI 超级计算机

    计算机,具有更高的性价比,通过软件升级即可实现性能提升。   全新 NVIDIA Jetson Orin Nano Super 开发者套件只有手掌大小,能够为商业 AI 开发者、科技爱好者和学生等各类
    发表于 12-18 17:01 948次阅读
    NVIDIA 推出高性价比的生成式 AI <b class='flag-5'>超级</b><b class='flag-5'>计算机</b>

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 12-17 10:19 944次阅读