0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA HPC SDK提高HPC应用性能和可移植性

星星科技指导员 来源:Jay Gould 作者:Jay Gould 2022-04-14 14:33 次阅读

NVIDIA 宣布了即将发布的 HPCSDK21.11 版本,其中包含新的库增强功能。该软件将在未来几周内免费提供。

NVIDIA HPC SDK 是一套用于高性能计算开发的综合编译器和库。它包括各种各样的工具,这些工具被证明可以最大限度地提高开发人员的生产率,以及 HPC 应用程序的性能和可移植性。

HPC SDK 及其组件每年都会更新多次,包括新功能、性能提升和其他增强功能。

有什么新鲜事吗

此 21.11 版本将包括对 HPC ++/ Fortran 编译器支持和开发人员环境的更新,以及新的多节点 mulit GPU 库功能。

编译器、构建系统和其他增强功能

NVFORTRAN 编译器在去年的版本 20.11 中引入,它自动并行化使用 DO 并发标准语言功能编写的代码,如 此文章 中所述。

在 21.11 版中,程序员可以使用 ISO Fortran 标准当前工作草案中描述的 REDUCE 子句来执行约简操作,这是许多科学算法的要求。

从 21. 11 版本开始, HPC 编译器现在支持– gcc 工具链选项,类似于基于 clang 的编译器。除了现有的指定非默认 GNU 编译器集合( GCC )版本的 rc 文件方法之外,还提供了此方法。 HPC 编译器利用开源 GCC 库来支持常见的系统操作和 C ++标准库支持。

有时,开发人员需要与系统默认版本不同的 GCC 工具链版本。现在, 21. 11 既有基于命令行的方式,也有基于文件的方式来制定该规范。除了– gcc 工具链之外, 21.11 HPC 编译器还添加了几个与 gcc 兼容的命令行标志,用于指定 x86-64 目标体系结构详细信息

21.11 版本现在包括两个新的 Fortran 模块,可与 NVIDIA 库集成, Fortran 应用程序可最大限度地利用 NVIDIA 平台, Fortran 开发人员可尽可能提高工作效率。用 Fortran 编写的 HPC 应用程序可以直接使用 cufftX —— NVIDIA 提供的高度优化的多 GPU FFT 库。它还可以更方便地使用 NVIDIA Tools Extension Library (NVTX) 进行性能和 Nsight 的评测研究。

版本 21. 11 将与 CsFig 配置文件一起运行,该文件定义了 HPCSDK 的各个组件的 CMAPK 目标。这为应用打包程序和开发人员提供了与 NVIDIA HPC SDK 更无缝的代码集成。

新的多节点、多 GPU 数学库

HPC SDK 21.11 版将包括我们即将推出的第一个多节点、多 GPU 数学库功能,即 cuSOLVERMp 。初始功能将包括 Cholesky 和 LU 分解,有无旋转。未来的版本将包括具有多个 RH 的 LU 。

关于作者

Jay Gould 是 NVIDIA 的高级产品营销经理,专注于 GPU 加速应用程序的 HPC 软件和平台。在 NVIDIA 之前,他曾在 Cray 、 Xilinx 和顶级 csp 从事高性能计算工作。杰伊在哈维·穆德学院获得学士学位。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4573

    浏览量

    101602
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4392

    浏览量

    126520
  • HPC
    HPC
    +关注

    关注

    0

    文章

    275

    浏览量

    23415
收藏 人收藏

    评论

    相关推荐

    康佳特欢迎COM-HPC载板设计指南Rev. 2.2的发布 COM-HPC Mini规范现已完善

      2024/4/2 中国上海 * * * 嵌入式和边缘计算技术的领先供应商德国康佳特--欢迎COM-HPC载板设计指南2.2修订版的发布,该指南为开发人员新增了基于95毫米x70毫米COM-HPC
    发表于 04-02 10:47 107次阅读
    康佳特欢迎COM-<b class='flag-5'>HPC</b>载板设计指南Rev. 2.2的发布 COM-<b class='flag-5'>HPC</b> Mini规范现已完善

    什么是HPC性能计算

    性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以及运用适合的算法和程序,提高计算效率和处理能力,实现对大量
    的头像 发表于 02-19 13:27 165次阅读
    什么是<b class='flag-5'>HPC</b>高<b class='flag-5'>性能</b>计算

    SOVD协议在HPC中的应用详解

    整车电子电器架构正在从分布式总线架构逐渐向以High Performance Computer(以下简称HPC)为中心的集中式架构转变
    的头像 发表于 12-29 16:34 2898次阅读
    SOVD协议在<b class='flag-5'>HPC</b>中的应用详解

    研扬最新COM-HPC模块让您获得源源不断的强劲性能

    HPC-RPSC的COM-HPC模块拥有比以往任何产品更多的接口、存储和处理能力,旨在为最苛刻的应用提供最高性能HPC-RPSC支持第12代和第13代IntelCore处理器,兼容超
    的头像 发表于 11-18 08:05 201次阅读
    研扬最新COM-<b class='flag-5'>HPC</b>模块让您获得源源不断的强劲<b class='flag-5'>性能</b>

    HPC与AI:完美融合

    HPC早于AI问世,因此这两个领域在软件和基础设施方面存在显著差异。要将它们有机地融合在一起,需要对工作负载管理和工具进行必要的调整。以下是HPC如何逐步发展以迎合AI挑战的一些方法。
    的头像 发表于 10-22 14:59 824次阅读

    PICMG发布COM-HPC 1.2规范

    和10GbE等高速接口的访问。 COM-HPC“高性能计算” 外形是几年前为支持PCIe Gen4的更强大的CPU(更高的TDP)推出的( COM Express 外形不能很好地处理PCIe Gen
    的头像 发表于 10-12 15:13 610次阅读
    PICMG发布COM-<b class='flag-5'>HPC</b> 1.2规范

    康佳特喜迎PICMG对COM-HPC 1.2规范的批准, 重磅推出COM-HPC Mini

    迷你尺寸,最高性能 2023/ 10 / 12 中国上海* * * 嵌入式和边缘计算技术的领先供应商,德国康佳特喜迎PICMG对COM-HPC 1.2规范的批准,该规范引入了COM-HPC Mini
    发表于 10-12 11:44 231次阅读
    康佳特喜迎PICMG对COM-<b class='flag-5'>HPC</b> 1.2规范的批准, 重磅推出COM-<b class='flag-5'>HPC</b> Mini

    中国HPC的高潜力与AI融合的未来

    云端HPC部署方面,根据数据显示,2020-2022年,用户上公有云的速度和应用速度加快,促使HPC云上支出增速大大高于HPC线下本地部署规模,2022年全球HPC云上支出市场规模达到
    的头像 发表于 09-10 10:53 770次阅读
    中国<b class='flag-5'>HPC</b>的高潜力与AI融合的未来

    以算筑基 以智赋能 丨 坤前闪耀CCF HPC China 2023!

    伴随八月翻涌的海浪,世界级超算盛会——第19届CCF全国高性能计算学术年会(简称“CCF HPC China 2023”)在青岛红岛国际会展中心圆满落幕。全球HPC领域院士专家、顶级学界精英、先锋
    的头像 发表于 09-08 17:42 230次阅读

    以算筑基 以智赋能 丨 坤前闪耀CCF HPC China 2023!

    伴随八月翻涌的海浪,世界级超算盛会——第19届CCF全国高性能计算学术年会(简称“CCF HPC China 2023”)在青岛红岛国际会展中心圆满落幕。全球HPC领域院士专家、顶级学界精英、先锋
    的头像 发表于 09-07 13:38 305次阅读
    以算筑基 以智赋能 丨 坤前闪耀CCF <b class='flag-5'>HPC</b> China 2023!

    NVIDIA最强CPU芯片架构——NVIDIA Grace CPU

    NVIDIA Grace Hopper Superchip将节能、高带宽的 NVIDIA Grace CPU 与功能强大的 NVIDIA H100 Hopper GPU 结合使用 NVLink-C2C,以最大限度地
    发表于 08-30 10:45 960次阅读
    <b class='flag-5'>NVIDIA</b>最强CPU芯片架构——<b class='flag-5'>NVIDIA</b> Grace CPU

    移植和优化用于Arm文档的HPC应用程序

    介绍如何将高性能计算(HPC)应用程序移植到基于ARM的硬件上,如何在移植后开始优化应用程序,以及ARM提供了哪些工具来帮助
    发表于 08-25 07:58

    针对ARM SVE 4.0版移植和优化HPC应用程序文档

    介绍如何将高性能计算(HPC)应用程序移植到基于SVE的Arm硬件,如何在移植后开始优化应用程序,以及Arm提供了哪些工具可以提供帮助。
    发表于 08-10 07:11

    为ARM 3.0版移植和优化HPC应用程序文档

    描述如何将高性能计算(HPC)应用程序移植到基于Arm的硬件,如何在移植后开始优化应用程序,以及Arm提供了哪些工具可以提供帮助
    发表于 08-10 06:37

    IP_数据表(Z-1):GPIO for TSMC 28nm HPM/HPC/HPC+

    IP_数据表(Z-1):GPIO for TSMC 28nm HPM/HPC/HPC+
    发表于 07-06 20:19 0次下载
    IP_数据表(Z-1):GPIO for TSMC 28nm HPM/<b class='flag-5'>HPC</b>/<b class='flag-5'>HPC</b>+