0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

近600个应用程序通过NVIDIA GPU实现了提速

NVIDIA英伟达企业解决方案 来源:cc 2019-02-14 14:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

十几年前,还不曾有加速应用程序。而如今已有近600个应用程序通过NVIDIA GPU实现了提速。

这些应用程序涵盖了物理、生物科学、分子动力学、化学和天气预报等各个领域。其中包括全球最热门的15个高性能计算应用程序,也都是通过GPU实现加速的。去年,NVIDIA GPU应用程序目录收录了100多个应用程序,接下来还会有更多的程序将被陆续添加到目录中。

Intersect 360研究所的一份报告中收录了数据中心运行的各个关键应用程序。其中,排名前15的应用程序均由GPU加速,这些都是一系列杀手级的核心科学应用程序。其中包括:

GROMACS(化学)– 分子动力学应用程序,旨在模拟包含了数百到数百万个粒子的系统的牛顿运动方程。

ANSYS(流体动力学分析)– 模拟液体和气体与表面的相互作用。

Gaussian(化学)– 预测分子系统的能量、分子结构和振动频率。

VASP(化学)– 用于从头计算法量子力学分子动力学模拟。

NAMD(化学)– 大型生物分子系统的高性能模拟。

Simulia Abaqus(结构分析)– 用于结构力学的模拟和分析。

WRF(天气/环境建模)– 数值天气预报系统,专为大气研究和操作预测应用程序而设计。

OpenFOAM(流体动力学分析)– 通用型 CFD 软件的求解器库。

ANSYS(结构分析)– 对高频和高速电子元件中的 3D 全波电磁场进行建模。

LS-DYNA(结构分析)– 结构力学的模拟和分析工具。

BLAST(生物科学)– 应用最为广泛的生物信息学工具之一。

LAMMPS(化学)– 经典分子动力学程序包。

Amber(化学)– 专门针对生物分子系统模拟而开发的分子动力学应用程序。

Quantum Espresso(化学)– 一套集成的计算机代码,用于电子结构计算和纳米级材料建模。

GAMESS(化学)– 用于模拟原子和分子电子结构的计算化学套件。

这些工具本身无法实现性能的递增性提升。但通过采用NVIDIA GPU的服务器,其性能通常可提高10 倍或更多。并且,GPU加速可以改善数据中心的经济效益。

预测天气

天气预报是一项远比其看起来更加困难的工作。天气预报是高性能计算领域的一个重要分支。准确可靠的天气预报不仅可以拯救生命,还有助于航空、能源和公用事业、保险、零售和其他行业做出经济决策。

天气预报需要大量的计算资源,包括几何尺度(尤其是全球天气预报),和大量描述大气状态的变量。

但是,受限于可用的计算量和应用程序的性能,当前的天气预报模型仅限于低分辨率的模拟,例如12公里的分辨率。

这些模型忽略了一些重要的细节,例如云层的影响(云层可以反射太阳辐射,在天气模式中扮演着重要的角色)。采用1公里云分辨率可以改善预测效果,但这需要 应用程序的性能提升1700倍。

GPU加速可以弥补此差距,提高天气预报的准确性。

加速空气动力学模拟

使用NASA的FUN3D代码模拟SLS Block 1B助推器分离流场。该图片由Jamie Meeroff,Henry Lee,NASA/Ames提供。

火箭能够以超高的速度飞行,然而利用大规模空气动力学模拟,我们可以对其进行改进,让火箭可以飞得更快、更高效。

NASA兰利研究中心开发的FUN3D计算流体动力学软件,可用于模拟各种空气动力学应用程序中的流体流动。该应用程序在NASA Pleiades超级计算机上消耗的周期比其他任何应用程序都要多。借助于GPU加速,采用了6个NVIDIA V100 Tensor Core GPU的服务器能够以高出双插槽CPU服务器30倍的性能运行这些模拟。

总结:GPU具备非常好的性能,从而高效地计算规模更大、更复杂的模拟。NASA已经证明,在Summit超级计算机上,仅需运行1000台GPU服务器就可以完成100多万个CPU核心的工作。而且,其能源成本远低于CPU。

性能持续提升

我们在各个加速计算领域都拥有深厚的储备。结合由100多万名开发人员组成的生态系统,我们将共同形成一个不断改进的平台。该平台可以在相同的 GPU加速服务器上提供更高的应用程序性能。

例如,在包含 11 个高性能计算应用程序的组合中,对于采用4个NVIDIA Tesla P100 GPU的服务器,其当前的运行速度比两年前提高了2倍。如果同时改进软件堆栈和GPU架构,您可以获得更大的性能提升。

现在,通过单一平台,您可以加速各种高性能计算领域的应用程序:科学计算、工业模拟、深度学习机器学习

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109094
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134461

原文标题:GPU已加速的近600个高性能计算应用程序都有哪些?

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的头像 发表于 11-28 09:39 3666次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b>性能测试

    NVIDIA Isaac Lab多GPU多节点训练指南

    NVIDIA Isaac Lab 是一适用于机器人学习的开源统一框架,基于 NVIDIA Isaac Sim 开发,其模块化高保真仿真适用于各种训练环境,可提供各种物理 AI 功能和由 GP
    的头像 发表于 09-23 17:15 1980次阅读
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多节点训练指南

    DeepSeek R1 MTP在TensorRT-LLM中的实现与优化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录,Multi-Token Prediction (MTP) 实现
    的头像 发表于 08-30 15:47 3968次阅读
    DeepSeek R1 MTP在TensorRT-LLM中的<b class='flag-5'>实现</b>与优化

    NVIDIA RTX PRO 4500 Blackwell GPU测试分析

    今天我们带来全新 NVIDIA Blackwell 架构 GPU —— NVIDIA RTX PRO 4500 Blackwell 的测试,对比上一代产品 NVIDIA RTX 450
    的头像 发表于 08-28 11:02 2872次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>测试分析

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 997次阅读

    NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    本文将探讨 NVIDIA TensorRT-LLM 如何基于 8 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延迟场景中的性能纪录:在 G
    的头像 发表于 07-02 19:31 2938次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    两种结构: ①GPU-GPU ②CPU-GPU 这是书中介绍的一包括完全
    发表于 06-18 19:31

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI开发

    NVIDIA GTC 推出新一代专业级 GPU 和 AI 赋能的开发者工具—同时,ChatRTX 更新现已支持 NVIDIA NIM,RTX Remix 正式结束测试阶段,本月的 NVIDIA
    的头像 发表于 03-28 09:59 1073次阅读

    可以手动构建imx-gpu-viv吗?

    所需的库版本。但是当我尝试运行应用程序时,它导致分段错误。 有没有办法在 Debian 10 中自己构建 imx-gpu 库,这样它们就不需要 glibc 2.28 版本? 如
    发表于 03-28 06:35

    NVIDIA GPU助力科研人员探索外星世界

    NVIDIA GPU 驱动的深度学习在短短几秒内解读出了卡西尼号土星探测器多年来收集的海量数据,为科研人员探索外星世界提供更加智能的方式。
    的头像 发表于 02-27 10:37 849次阅读

    0xmd公司通过NVIDIA GPU打造医疗AI解决方案

    本案例中,0xmd 公司通过 NVIDIA GPU 打造医疗 AI 解决方案,覆盖影像分析和文本解读等领域。
    的头像 发表于 01-14 16:23 900次阅读

    NVIDIA助力FinCatch开发智能投资辅助系统

    本案例中通过 NVIDIA GPU 和 RAPIDS 加速平台,FinCatch 实现投资研究流程的全面智能化,提升数据分析速度和准确性,
    的头像 发表于 01-07 09:23 784次阅读

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 1247次阅读

    借助NVIDIA GPU提升鲁班系统CAE软件计算效率

    本案例中鲁班系统高性能 CAE 软件利用 NVIDIA 高性能 GPU实现复杂产品的快速仿真,加速产品开发和设计迭代,缩短开发周期,提升产品竞争力。
    的头像 发表于 12-27 16:24 1150次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    问题,但会降低旧GPU硬件性能,可通过NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些
    发表于 12-16 14:25