0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU领跑运算性能,实现高性能计算新突破

NVIDIA英伟达企业解决方案 来源:未知 作者:胡薇 2018-10-24 17:43 次阅读

2018 全国高性能计算学术年会(HPC CHINA 2018)于10月20日在青岛闭幕。大会以“HPC+一切皆可计算”为主题,围绕高性能计算技术的研究发展与发展趋势、高性能计算的重大应用等主题展开。

年会上,各领域专家学者围绕着高性能计算技术各抒己见,分享了高性能计算在其各自领域的最新研究进展。NVIDIA公司高性能计算及新兴业务中国区总经理刘通在大会主论坛发表了“NVIDIA GPU面向未来计算的持续创新”主题演讲, 为大家介绍了GPU在高性能计算领域的应用以及创新。

近年来,随着传统处理器在单线程运算方面遭遇到瓶颈,性能加速放缓。GPU为加速计算指明了新方向,GPU加速器每年正在以稳定的速率实现性能提升,其性能提升态势也将持续到未来:

如今 ,GPU框架凭借其强大的并行计算能力,已被众多超级计算机选做算力核心。目前,包括美国Summit、Sierra;日本ABCI;欧洲的Piz Daint在内的诸多全球顶级超级计算机都采用了NVIDIA GPU作为其算力核心。而且,目前已有70%的通用HPC程序已经实现GPU加速:

然而,与其强大算力相对应的是GPU服务器突出的性价比优势。相较于CPU服务器,GPU服务器成本需求更低,原本需要由160台Skylake CPU服务器才能完成的计算量,只需8台V100 GPU 4 卡服务器即可完成,而总体成本仅是Skylake CPU服务器的1/5;1台DGX-2的计算量相当于300台Dual-CPU服务器,总体成本却只有其1/8:

此外,GPU能够实现HPC与AI的融合计算。HPC可为精准计算提供支持,AI则可以提高结果预测准确性加快反应速度。NVIDIA TENSOR CORE GPU能够满足HPC与AI的融合计算,利用多精度混合计算,实现HPC应用性能新突破。

应用广泛,GPU加速计算渗入各个领域

在实现加速计算的同时,GPU加速的超算平台还具有广阔的产业应用范围,能够在精准医药、气象模拟、新材料、无人驾驶、AI等众多领域发挥作用。中国石油东方地球物理公司研究数据处理中心赖能和总工程师在NVIDIA新技术与应用主题分论坛中介绍,中石油正在利用NVIDIA GPU加速计算处理石油海量数据。

在服务产业应用的同时,NVIDIA GPU加速计算也被广泛应用到科学研究中。南京大学周建教授介绍,南京大学高性能计算研究中心在使用NVIDIA GPU加速计算解决VASP杂化泛函数计算时感受了到GPU显著的加速计算效果。在进行CrGeTe3的杂化泛函自洽计算测试时,相较于CPU,GPU的加速计算效果明显。据统计,对于此类较大的系统,1个V100 GPU可以比一个双路CPU服务器快10倍左右:

武汉大学蔡浩教授也在分论坛中进行了介绍,武汉大学过去在使用满带宽振幅分析软件(FALLS)进行分波分析时,存在要处理的事例数巨大;拟合模型非常复杂,参数空间巨大;拟合算法需要的计算步数非常多的困难。然而通过程序优化,拆掉大的数据结构,将计算部分的CUDA代码,全部分解成小的片段,交由GPU计算,提高计算效率;将条件分支全部移到程序外部,交给CPU处理,从而实现了充分调动计算单元:

同时,进行算法优化,将所有的求和计算都在GPU中进行,GPU和CPU之间的数据交互降到最低:

目前,FALLS已经实现了多GPU联合计算,并且实现了线性加速。如今,FALLS可以处理更大的数据量和更大的参数空间,相较于算法优化之前,计算时常实现了1000倍加速:

中科院高能物理研究所石京燕工程师也表示,中科院高能研究所在进行高能物理实验时,同样会面临海量的数据和复杂的计算过程,许多应用程序都对采用GPU加速计算提出了强烈需求。如今,通过在Juno实验中引入GPU加速计算;通过GPU加速计算进行交互式数据分析;基于深度学习进行事件重建,中科院高难研究所已经受益颇丰。

NVIDIA支持高校高性能计算教育

NVIDIA CUDA应用市场总监侯宇涛在10月19日的演讲中表示NVIDIA在关注GPU技术创新的同时,也致力于支持高校中的GPU教育。2018年8月20-24日,NVIDIA支持举办了国内首次OpenACC GPU Hackathon大赛,多支来自国内顶尖高校的队伍参赛。各团队基于NVIDIA V100 GPU对程序应用进行优化,实现了最大40倍速的计算速度提升。

此次HPC CHINA,NVIDIA的专家们还把NVIDIA深度学习学院(DLI)带到了年会现场,为学员现场揭秘深度学习技术及其应用,带领学员动手实验,展示如何通过在Caffe框架上的NVIDIA DIGITS和MINIST手写数据集,在深度学习工作流程中利用深度学习神经网络(DNN),尤其是卷积神经网络(CNN)解决图像分类问题。

NVIDIA GPU关注未来计算,持续创新

如今,具备更高计算能力的GPU技术为HPC应用的高速发展带来前所未有的强大计算引擎。随着HPC与AI的融合在更多领域的应用,计算单元需要同时具备超强的传统HPC计算力和深度学习计算力。最新的NVIDIA GPU系列,完美融合CUDA核心与Tensor核心,同时满足传统计算与AI计算的需求,并且配置一系列加速软件库,为应用开发提供最简洁优化的编程工具。NVIDIA GPU将不断向更高性能发起挑战,无论是硬件还是软件,都将保持着技术的高速创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4541

    浏览量

    101472
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4335

    浏览量

    126288

原文标题:HPC CHINA 2018 | GPU加速实现高性能计算新突破

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是HPC高性能计算

    高性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以及运用适合的算法和程序,提高
    的头像 发表于 02-19 13:27 124次阅读
    什么是HPC<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    佰维存储研发突破,为AI高性能计算赋能

    近日,佰维存储在接受调研时透露,公司近期成功研发并发布了支持CXL2.0规范的CXLDRAM内存扩展模块。这款产品具有支持内存容量和带宽扩展、内存池化共享、高带宽、低延迟、高可靠性等优势,特别适合于AI高性能计算的应用。
    的头像 发表于 01-23 16:13 385次阅读

    佰维发布CXL 2.0 DRAM,赋能高性能计算

    导语: CXL是一种开放式全新互联技术标准,可在主机处理器与加速器、内存缓冲区、智能I/O设备等设备之间提供高带宽、低延迟连接,从而满足高性能异构计算的要求,并且其维护CPU/GPU内存空间和连接
    发表于 12-27 15:17 110次阅读
    佰维发布CXL 2.0 DRAM,赋能<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    佰维发布CXL 2.0 DRAM,赋能高性能计算

    导语: CXL是一种开放式全新互联技术标准,可在主机处理器与加速器、内存缓冲区、智能I/O设备等设备之间提供高带宽、低延迟连接,从而满足高性能异构计算的要求,并且其维护CPU/GPU内存空间和连接
    的头像 发表于 12-27 10:35 297次阅读
    佰维发布CXL 2.0 DRAM,赋能<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    异构众核系统高性能计算架构

    随着计算机技术的发展,单核处理器已经难以满足高性能计算的需求,众核处理器成为了一种有效的解决方案。众核处理器是指在一个芯片上集成多个处理器核心,通过并行计算
    的头像 发表于 11-30 08:27 398次阅读
    异构众核系统<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>架构

    一种高性能多通道通用DMA设计与实现

    为充分发挥异构多核DSP芯片的实时计算能力,设计并实现了一种高性能多通道的通用DMA,该DMA最大支持64个通道的数据搬运,并支持一维、二维、转置以及级联描述符等多种传输模式。芯片实测传输性能
    的头像 发表于 11-20 15:52 511次阅读
    一种<b class='flag-5'>高性能</b>多通道通用DMA设计与<b class='flag-5'>实现</b>

    清华大学团队在超高性能计算芯片领域取得新突破

    清华大学团队在超高性能计算芯片领域取得新突破,相关研究发表在Nature上。
    的头像 发表于 10-29 09:20 559次阅读
    清华大学团队在超<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>芯片领域取得新<b class='flag-5'>突破</b>

    【昉·星光 2 高性能RISC-V单板计算机体验】星光 2 功耗测评

    星光 2是迄今最高性能单板机。 搭载高性能昉·惊鸿7110搭载64位高性能四核RISC-V CPU,2MB的二级缓存,工作频率最高可达1.5 GHz。昉·惊鸿7110具有多个的高速本地接口,支持
    发表于 09-28 10:34

    Mali GPU性能分析工具

    本文档描述了马里GPU性能分析工具2.2版中的已知勘误表。 这是一个贯穿整个产品生命周期的工作文档,因此,随着新信息的发现,其内容可能会被修改。 本文中包含的信息是ARM有限公司的财产,对错误或遗漏
    发表于 09-05 07:08

    【昉·星光 2 高性能RISC-V单板计算机体验】与星光 2的第一次邂逅

    能有机会近距离使用这样一块全球首款集成3D GPU高性能量产RISC-V 单板计算机。
    的头像 发表于 08-04 09:12 687次阅读
    【昉·星光 2 <b class='flag-5'>高性能</b>RISC-V单板<b class='flag-5'>计算</b>机体验】与星光 2的第一次邂逅

    Arm高性能计算工具试用分析

    全球排名前20的超级计算机用户中有70%使用Arm工具来快速理解应用程序性能,并通过调试、分析和优化更快地获得结果努力。
    发表于 08-02 09:51

    智能网卡简介及其在高性能计算中的作用

    最先进的人工智能模型在不到五年的时间内经历了超过 5,000 倍的规模扩展。这些 AI 模型严重依赖复杂的计算和大量内存来实现高性能深度神经网络 (DNN)。只有使用 CPU、GPU
    发表于 07-28 10:10

    面向后E级计算高性能处理器技术参考和借鉴

    商用高性能计算处理器市场主要被NVIDIA、AMD和Intel3家公司长期占据,在面向E级计算 的 高 性 能 处 理 器 中,AMD 最 新 的Instinct MI250X处理器双精度浮点
    发表于 06-19 09:34 338次阅读
    面向后E级<b class='flag-5'>计算</b>的<b class='flag-5'>高性能</b>处理器技术参考和借鉴

    易飞扬携高性能计算互连硬件和液冷互连解决出席德国ISC高性能计算大会

    [中国,深圳,2023年5月6日]5月21-25日,全球领先的高性能计算和超级计算领域的国际会议之一的ISC高性能计算大会(ISC High
    的头像 发表于 05-06 18:21 419次阅读

    如何使用iMX8mmini提高GPU性能

    我正在使用 iMX8mmini 并尝试提高 GPU 性能。使用下面的命令我发现当前 GPU 以 500 MHz 的频率运行。根据数据表或设备树节点,GPU 以 800 MHz 的标称频
    发表于 04-18 07:17