0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

黄仁勋SC18激情演讲,高性能计算平台未来可期

DPVg_AI_era 来源:未知 作者:李倩 2018-11-16 10:31 次阅读

黄仁勋日前在全球超算领域年度盛会SC18发表演讲,展望高性能及通用计算的未来。除了深度学习突飞猛进,Nvidia的GPU在超算、云平台等高性能计算领域发挥着举足轻重的作用。黄仁勋表示,Nvidia最好的产品还没有到来,未来计算的重任就交给GPU来抗。

11月11日~16日,2018年全球超算领域年度盛会、全球超级计算大会(SC18)在美国得克萨斯州达拉斯召开。昨天,Nvidia CEO黄仁勋发表了主旨演讲,简单说,就是未来计算的大旗放心交给英伟达来抗。

老黄在演讲中使用了数据图表、产品图片、甚至是超新星的精美画面,描述了加速器和人工智能驱动的计算转换,包括多精度处理器、新兴软件工具、垂直堆栈和容器等,当然还有Nvidia的产品,这些都将推动未来高性能计算的发展。

其实他在演讲中说的大多数挑战和解决方案大家都不陌生,不过我们可以理解他表现出的热情。因为GPU(或者更具体地说,是Nvidia 的GPU和CUDA),一直是HPC用以应对摩尔定律崩溃的关键手段。

深度学习热浪奔涌,Nvidia豪赌GPU终获回报

最近,基于加速器的异构架构的不断兴起,这在世界超级计算机Top 500榜单上表现得很明显。在最新的榜单上,有127台超级计算机系统中使用了Nvidia的产品,包括目前世界上运算速度最快的两台超级计算机Summit和Sierra。

同样,Nvidia对混合精度功能的支持,对于提升机器学习和深度学习性能至关重要,这在Nvidia在Volta100和T4 GPU上部署的Tensor Core技术中可见一斑。

无论是敏锐的远见也好,聪明的机会主义也罢,Nvidia对GPU的豪赌都取得了丰厚的回报。现在的GPU对传统的建模和仿真任务,以及新兴的数据驱动的AI任务的支持越来越广泛。

关于HPC和GPU如何协同工作还有很多事情需要解决,至少近期,基于加速器的异构系统可以作为两者共同的动力。黄仁勋将Nvidia作为先行者,进行了不拘一格的技术讨论,并宣布了一系列内容,包括HPC性能基准、产品对市场推动力、新合作伙伴的努力以及对开源的模式赞誉等。

横扫云平台和Top500榜单:Nvidia突破性的一年

世界超级计算机Top 500榜单中,Nvidia进步明显。现在,榜单中使用Nvidia GPU的系统数量同比增长了48%,是五年前的三倍。两台全球顶级超级计算机Summit(橡树岭国家实验室)和Sierra(劳伦斯利弗莫尔国家实验室)一共使用了超过40000个Nvidia V100 Tensor Core GPU。Top500榜单中的近一半计算力(702/1417 petaflops)来自加速系统。在10年前,榜单中根本没有出现加速系统。

截至今年11月的最新超算Top 500榜单(前5名),中美各占两席

DGX-2为顶级实验室提供算力。黄仁勋表示,美国第一批Nvidia DGX-2 AI超级计算机已经运抵美国领先的一些研究实验室——布鲁克海文国家实验室、橡树岭国家实验室和桑迪亚国家实验室。DGX-2利用NVSwitch技术实现16个Nvidia TeslaV100 Tensor Core GPU的互联,提供了超过2 petaflop的算力。

在谷歌云上可以使用T4。据Nvidia发布的消息,新的T4 GPU推出后仅两个月,用即在57个独立的服务器设计中得到了应用,现在已经可以在云中使用,谷歌云平台首先可用于谷歌云平台的GPU。“我们有从未见过这么快就被数据中心采用的处理器,“Nvidia的加速计算副总裁兼总经理Ian Buck说。

容器业务扩展迅速。Nvidia的NGC容器注册表现在提供41个框架和应用程序(去年为18个),用于深度学习,HPC及其可视化。最近增加的内容包括CHROMA,Matlab,MILC,ParaView,RAPIDS和VMD。

Nvidia发布了新的多节点HPC和可视化容器,允许超级计算用户在大规模集群上运行工作负载。此外,NGC容器现在可以在Singularity本地使用,Singularity是一种在超级计算中广泛采用的容器技术。

其他值得一提的亮点。Nvidia GPU也为欧洲和日本最快的超级计算机提供加速服务。今天发布的Green 500排行榜测试了世界上最快系统的能效,榜单显示,前25个“最环保”的系统中,有22个系统使用Nvidia的GPU。

“对于Nvidia来说,这是超级计算领域的突破性的一年。”黄仁勋在发布会上表示,事实确实如此。

黄仁勋花了相当多的时间讨论Nvidia对其GPU生态系统的支持,他指出,CUDA版本的向后兼容性以及对一系列开源工具和框架的支持,对于Nvidia开发标准化垂直堆栈的努力至关重要。他说,这些堆栈将消灭大部分“苦差事”,并实现更广泛的各种AI功能。

同样值得一提的是T4在市场上的出色表现。 使用T4的服务器公司包括戴尔EMC,IBM,联想和超微。T4的功耗仅70瓦,可以灵活地适应标准服务器或任何面向开源计算项目的超大规模服务器设计。

服务器设计的适用范围从单个T4 GPU一直到单个节点中的20个GPU。 T4的多精度功能可提供四种不同精度级别的工作负载,FP32提供8.1 TFLOPS,FP16提供65TFLOPS,INT8提供130 TFLOPS,INT4提供260 TFLOPS。

在演讲的最后,黄仁勋激动地表示,英伟达最好的产品还没有到来。让我们拭目以待。

谷歌定向优化TensorFlow,寻求GPU性能极限

作为最早在云服务平台上应用Nvidia T4 GPU的企业,谷歌一直与Nvidia有着良好的合作关系。近日,谷歌的研究人员在 Medium上发布了一篇官方博文,题为《用XLA将GPU性能推向极限》(Pushing the limits of GPU performance withXLA)。

XLA 是 TensorFlow 图模型的编译器(complier),用于优化 TensorFlow 计算。虽然这篇博文中并未提到谷歌最新采用的英伟达T4 虚拟机,但很明显可以看出,谷歌在针对GPU做TensorFlow模型优化,未来也将如此。

使用了XLA的TF1.12在英伟达Tesla V100GPU上训练ResNet-50,速度相比没有使用 XLA的TF1.11有了显著提升:合成数据为每秒10526幅图,真实数据为每秒10,267幅图。谷歌研究人员表示,他们观察到各种内部模型的加速最小的有1.13倍,最高的有3.04倍。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 超级计算机
    +关注

    关注

    2

    文章

    431

    浏览量

    41603
  • 人工智能
    +关注

    关注

    1775

    文章

    43679

    浏览量

    230468
  • 深度学习
    +关注

    关注

    73

    文章

    5219

    浏览量

    119860

原文标题:黄仁勋:英伟达豪赌GPU终获回报,但我更看好高性能计算

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    :AI的尽头是光伏和储能!

    行业芯事行业资讯
    深圳市浮思特科技有限公司
    发布于 :2024年03月11日 14:12:14

    :AGI最快五年内问世

    行业芯事行业资讯
    深圳市浮思特科技有限公司
    发布于 :2024年03月04日 16:46:06

    称AI“临界点”已到

    行业芯事行业资讯
    深圳市浮思特科技有限公司
    发布于 :2024年02月22日 15:43:19

    什么是HPC高性能计算

    高性能计算(HighPerformanceComputing,简称HPC),是指利用集群、网格、超算等计算机技术,通过合理地组织计算机资源以及运用适合的算法和程序,提高
    的头像 发表于 02-19 13:27 167次阅读
    什么是HPC<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    首访越南就要下大单

    行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年12月11日 16:11:50

    FPGA在高性能计算中的优势及其用例都有哪些?

    近年来,现场可 编程 门阵列 ( FPGA ) 因其可定制性、并行处理和低延迟而成为高性能计算 (HPC) 的可行技术。 高性能计算 (HPC) 是一个
    的头像 发表于 12-09 12:15 433次阅读
    FPGA在<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>中的优势及其用例都有哪些?

    异构众核系统高性能计算架构

    随着计算机技术的发展,单核处理器已经难以满足高性能计算的需求,众核处理器成为了一种有效的解决方案。众核处理器是指在一个芯片上集成多个处理器核心,通过并行计算
    的头像 发表于 11-30 08:27 426次阅读
    异构众核系统<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>架构

    SC23 | 新型加速节能 AI 系统开创超级计算的新时代

    月 13 日,NVIDIA 在 SC23 上发布了一系列新技术,将全球各地的科学和工业研究中心推向性能和能效新高。 NVIDIA 高性能计算和超大规模数据中心业务副总裁 Ian Bu
    的头像 发表于 11-15 18:45 331次阅读
    <b class='flag-5'>SC</b>23 | 新型加速节能 AI 系统开创超级<b class='flag-5'>计算</b>的新时代

    CCF HPC China 2023 | 超融合以太加持:北京大学高性能计算平台将迎来大提速

    计算平台超融合以太数据中心网络解决方案实践”。 北京大学计算中心工程师 付振新 现场分享 为满足校内的教学科研计算需求,北京大学从2018年起陆续建设了“未名一号”、“未名生科一号”、
    的头像 发表于 08-25 18:10 494次阅读
    CCF HPC China 2023 | 超融合以太加持:北京大学<b class='flag-5'>高性能</b><b class='flag-5'>计算</b><b class='flag-5'>平台</b>将迎来大提速

    智能网卡简介及其在高性能计算中的作用

    最先进的人工智能模型在不到五年的时间内经历了超过 5,000 倍的规模扩展。这些 AI 模型严重依赖复杂的计算和大量内存来实现高性能深度神经网络 (DNN)。只有使用 CPU、GPU 或专用芯片等
    发表于 07-28 10:10

    自动驾驶≠速度与激情

    充满速度与激情未来驾驶,方向盘由谁掌控?
    的头像 发表于 06-07 09:28 648次阅读
    自动驾驶≠速度与<b class='flag-5'>激情</b>

    NVIDIA仍不死心,再次加入ARM站场

    在GTC 2021主题演讲中,英伟达首席执行官确认了英伟达将会和联发科(MediaTek)展开合作。当时展示的幻灯片内容里,显示联发科将得到GeForce RTX 30系列GPU
    发表于 05-28 08:51

    联发科回应结盟英伟达合攻 Arm 架构芯片传闻

    联发科计划周一下午举行 2023“旗舰科技 智领未来”记者会,由联发科 CEO 蔡力行与重量级嘉宾一同出席,这位嘉宾应该是近来引起全球关注、并成为 AI 创新推动者的英伟达 CEO
    发表于 05-28 08:47

    易飞扬携高性能计算互连硬件和液冷互连解决出席德国ISC高性能计算大会

    [中国,深圳,2023年5月6日]5月21-25日,全球领先的高性能计算和超级计算领域的国际会议之一的ISC高性能计算大会(ISC High
    的头像 发表于 05-06 18:21 448次阅读

    先楫高性能MCU搭载OpenHarmony,共赢芯未来

    高性能MCU产品,是个多方共赢的好事。 砥砺深耕,履践致远。未来先楫半导体将延续开放的理念,与OpenHarmony的适配也会更加丰富,让更多的应用落地。” 论坛结束后,大会主办方授予先楫半导体
    发表于 04-23 15:01