0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU领跑运算性能,实现高性能计算新突破

NVIDIA英伟达企业解决方案 来源:未知 作者:胡薇 2018-10-24 17:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2018 全国高性能计算学术年会(HPC CHINA 2018)于10月20日在青岛闭幕。大会以“HPC+一切皆可计算”为主题,围绕高性能计算技术的研究发展与发展趋势、高性能计算的重大应用等主题展开。

年会上,各领域专家学者围绕着高性能计算技术各抒己见,分享了高性能计算在其各自领域的最新研究进展。NVIDIA公司高性能计算及新兴业务中国区总经理刘通在大会主论坛发表了“NVIDIA GPU面向未来计算的持续创新”主题演讲, 为大家介绍了GPU在高性能计算领域的应用以及创新。

近年来,随着传统处理器在单线程运算方面遭遇到瓶颈,性能加速放缓。GPU为加速计算指明了新方向,GPU加速器每年正在以稳定的速率实现性能提升,其性能提升态势也将持续到未来:

如今 ,GPU框架凭借其强大的并行计算能力,已被众多超级计算机选做算力核心。目前,包括美国Summit、Sierra;日本ABCI;欧洲的Piz Daint在内的诸多全球顶级超级计算机都采用了NVIDIA GPU作为其算力核心。而且,目前已有70%的通用HPC程序已经实现GPU加速:

然而,与其强大算力相对应的是GPU服务器突出的性价比优势。相较于CPU服务器,GPU服务器成本需求更低,原本需要由160台Skylake CPU服务器才能完成的计算量,只需8台V100 GPU 4 卡服务器即可完成,而总体成本仅是Skylake CPU服务器的1/5;1台DGX-2的计算量相当于300台Dual-CPU服务器,总体成本却只有其1/8:

此外,GPU能够实现HPC与AI的融合计算。HPC可为精准计算提供支持,AI则可以提高结果预测准确性加快反应速度。NVIDIA TENSOR CORE GPU能够满足HPC与AI的融合计算,利用多精度混合计算,实现HPC应用性能新突破。

应用广泛,GPU加速计算渗入各个领域

在实现加速计算的同时,GPU加速的超算平台还具有广阔的产业应用范围,能够在精准医药、气象模拟、新材料、无人驾驶、AI等众多领域发挥作用。中国石油东方地球物理公司研究数据处理中心赖能和总工程师在NVIDIA新技术与应用主题分论坛中介绍,中石油正在利用NVIDIA GPU加速计算处理石油海量数据。

在服务产业应用的同时,NVIDIA GPU加速计算也被广泛应用到科学研究中。南京大学周建教授介绍,南京大学高性能计算研究中心在使用NVIDIA GPU加速计算解决VASP杂化泛函数计算时感受了到GPU显著的加速计算效果。在进行CrGeTe3的杂化泛函自洽计算测试时,相较于CPU,GPU的加速计算效果明显。据统计,对于此类较大的系统,1个V100 GPU可以比一个双路CPU服务器快10倍左右:

武汉大学蔡浩教授也在分论坛中进行了介绍,武汉大学过去在使用满带宽振幅分析软件(FALLS)进行分波分析时,存在要处理的事例数巨大;拟合模型非常复杂,参数空间巨大;拟合算法需要的计算步数非常多的困难。然而通过程序优化,拆掉大的数据结构,将计算部分的CUDA代码,全部分解成小的片段,交由GPU计算,提高计算效率;将条件分支全部移到程序外部,交给CPU处理,从而实现了充分调动计算单元:

同时,进行算法优化,将所有的求和计算都在GPU中进行,GPU和CPU之间的数据交互降到最低:

目前,FALLS已经实现了多GPU联合计算,并且实现了线性加速。如今,FALLS可以处理更大的数据量和更大的参数空间,相较于算法优化之前,计算时常实现了1000倍加速:

中科院高能物理研究所石京燕工程师也表示,中科院高能研究所在进行高能物理实验时,同样会面临海量的数据和复杂的计算过程,许多应用程序都对采用GPU加速计算提出了强烈需求。如今,通过在Juno实验中引入GPU加速计算;通过GPU加速计算进行交互式数据分析;基于深度学习进行事件重建,中科院高难研究所已经受益颇丰。

NVIDIA支持高校高性能计算教育

NVIDIA CUDA应用市场总监侯宇涛在10月19日的演讲中表示NVIDIA在关注GPU技术创新的同时,也致力于支持高校中的GPU教育。2018年8月20-24日,NVIDIA支持举办了国内首次OpenACC GPU Hackathon大赛,多支来自国内顶尖高校的队伍参赛。各团队基于NVIDIA V100 GPU对程序应用进行优化,实现了最大40倍速的计算速度提升。

此次HPC CHINA,NVIDIA的专家们还把NVIDIA深度学习学院(DLI)带到了年会现场,为学员现场揭秘深度学习技术及其应用,带领学员动手实验,展示如何通过在Caffe框架上的NVIDIA DIGITS和MINIST手写数据集,在深度学习工作流程中利用深度学习神经网络(DNN),尤其是卷积神经网络(CNN)解决图像分类问题。

NVIDIA GPU关注未来计算,持续创新

如今,具备更高计算能力的GPU技术为HPC应用的高速发展带来前所未有的强大计算引擎。随着HPC与AI的融合在更多领域的应用,计算单元需要同时具备超强的传统HPC计算力和深度学习计算力。最新的NVIDIA GPU系列,完美融合CUDA核心与Tensor核心,同时满足传统计算与AI计算的需求,并且配置一系列加速软件库,为应用开发提供最简洁优化的编程工具。NVIDIA GPU将不断向更高性能发起挑战,无论是硬件还是软件,都将保持着技术的高速创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5687

    浏览量

    110117
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136069

原文标题:HPC CHINA 2018 | GPU加速实现高性能计算新突破

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MAX17409:高性能GPU的电源控制利器

    MAX17409:高性能GPU的电源控制利器 在今日的高性能图形处理器(GPU)应用领域,对于高效、稳定且响应迅速的电源控制的需求日益增长。MAX17409作为一款1 - 相Quick
    的头像 发表于 03-17 14:20 187次阅读

    成功案例:象帝先计算技术与Imagination合作——面向现代图形与计算工作负载的专业GPU

    为专业计算设计桌面GPU桌面GPU不仅用于游戏,还能加速从专业可视化、高级模拟到数据密集型计算在内的多种现代工作负载。专业用户需要能在多种应用场景中稳定运行的
    的头像 发表于 03-09 09:17 451次阅读
    成功案例:象帝先<b class='flag-5'>计算</b>技术与Imagination合作——面向现代图形与<b class='flag-5'>计算</b>工作负载的专业<b class='flag-5'>GPU</b>

    LT1208高速运算放大器:高性能与多应用的完美结合

    LT1208/LT1209高速运算放大器:高性能与多应用的完美结合 在电子工程领域,高速运算放大器是实现许多高性能电路的关键组件。今天我们要
    的头像 发表于 01-29 14:55 269次阅读

    高性能运算放大器AD845:特性、应用与设计要点

    高性能运算放大器AD845:特性、应用与设计要点 在电子工程师的设计工具箱中,运算放大器是不可或缺的基础元件。今天,我们要深入探讨一款高性能运算
    的头像 发表于 01-25 10:05 380次阅读

    高性能145MHz FastFET运算放大器AD8066的深度剖析

    高性能145MHz FastFET运算放大器AD8065/AD8066的深度剖析 在电子设计领域,运算放大器是不可或缺的基础元件。今天,我们要深入探讨的是Analog Devices公司推出的
    的头像 发表于 01-24 09:25 682次阅读

    高性能运算放大器AD712:特性、应用与设计要点

    高性能运算放大器AD712:特性、应用与设计要点 在电子工程师的日常设计工作中,运算放大器是不可或缺的基础元件之一。今天,我们要深入探讨的是一款高性能的双
    的头像 发表于 01-22 10:30 448次阅读

    Samtec NITROWAVE™高性能微波电缆组件:突破传统的卓越之选

    Samtec NITROWAVE™高性能微波电缆组件:突破传统的卓越之选 在电子工程领域,高性能微波电缆组件的性能直接关系到各种系统的运行效果。Samtec新推出的NITROWAVE™
    的头像 发表于 12-18 11:25 498次阅读

    炎核开源开放平台上架推出OpenSparseBlas高性能稀疏计算

    在科学计算与工程仿真领域,高效处理大规模稀疏矩阵运算是提升整体计算效能的关键。为此,我们在炎核开源开放平台上架推出 OpenSparseBlas——一个专为稀疏矩阵/向量计算而打造的
    的头像 发表于 12-15 15:18 980次阅读

    瀚海量子与沐曦股份达成战略合作 量子计算软件领军者+高性能GPU芯片领军者

    当量子计算软件领军者遇上高性能GPU芯片领军者,国产算力领域迎来一项重磅合作。 近日, 合肥瀚海量子科技有限公司(简称“瀚海量子”)与沐曦集成电路(上海)股份有限公司(简称“沐曦股份”)正式签署战略
    的头像 发表于 11-24 19:02 3381次阅读

    知合计算:RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM为代表的处理器架构之下,RISC-V在高性能计算
    的头像 发表于 07-18 14:17 2984次阅读
    知合<b class='flag-5'>计算</b>:RISC-V架构创新,阿基米德系列剑指<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    中科曙光构建全国产化基因组学高性能计算平台

    近日,中科曙光承建的国内某研究所基因组学高性能计算平台正式交付。这是国内生物信息学领域首个从底层硬件到上层软件实现完全自主可控,并深度融合高性能计算
    的头像 发表于 06-26 17:36 1146次阅读

    高性能计算集群在AI领域的应用前景

    随着人工智能技术的飞速发展,高性能计算集群(HPC)在AI领域的应用前景日益受到关注。HPC提供的计算能力与AI的智能分析能力相结合,为解决复杂问题和推动科学研究提供了新的动力。1、HPC与AI
    的头像 发表于 06-23 13:07 1425次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群在AI领域的应用前景

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一直从事的事芯片
    发表于 06-18 19:31

    使用树莓派构建 Slurm 高性能计算集群:分步指南!

    在这篇文章中,我将分享我尝试使用树莓派构建Slurm高性能计算集群的经历。一段时间前,我开始使用这个集群作为测试平台,来创建一个更大的、支持GPU计算
    的头像 发表于 06-17 16:27 1961次阅读
    使用树莓派构建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群:分步指南!

    高性能计算面临的芯片挑战

    高性能计算(简称HPC)听起来像是科学家在秘密实验室里才会用到的东西,但它实际上是当今世界上最重要的技术之一。从预测天气到研发新药,甚至训练人工智能,高性能计算系统都能帮助解决普通
    的头像 发表于 05-27 11:08 1236次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>面临的芯片挑战