0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

独家解读NVIDIA CUDA支持Arm——百万兆级超算竞争再加剧?

张慧娟 来源:电子发烧友网 作者:张慧娟 2019-06-18 03:19 次阅读

在法兰克福举办的全球超级计算大会上,重磅消息传来,NVIDIA宣布CUDA支持Arm CPU,为高性能计算开辟全新途径,以构建具有极高能效水平的百万兆级AI超级计算机。北京时间6月17日下午四点,NVIDIA与媒体召开电话会议。下文将详解双方合作始末,以及<电子发烧友>独家求证后获知的信息

NVIDIA携手Arm意欲何在?

随着传统计算规模扩展步伐的停止,功率将成为所有超级计算机的限制因素。对于与Arm的携手,NVIDIA创始人兼首席执行官黄仁勋表示:“NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合,将助力HPC社区实现大幅提升,以达到百万兆级。”

双方合作的原因主要有两方面:首先,客户需要更多选择,一旦完成堆栈优化,Nvidia将加速所有主要CPU架构,包括x86、Power和ARM;其次,通过将NVIDIA软件栈引入Arm生态系统,将进一步助推在HPC服务器市场的创新。

年底前,NVIDIA将向Arm生态系统提供全堆栈的AI和HPC软件,该堆栈为600多个HPC应用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

NVIDIA解决方案架构与工程团队副总裁Marc Hamilton透露,NVIDIA和Arm已为这个计划准备了两年左右,认为现在是最佳的发布时机。建立在双方超过10年的合作基础之上,此前,NVIDIA几款用于便携式游戏、自动驾驶汽车、机器人嵌入式AI计算的系统级芯片产品都采用了Arm。全球众多涉及超级计算的项目或单位都在寻求Arm的加入,包括欧洲处理器计划(European Processor Initiative)、日本先进情报项目中心 (RIKEN)、美国能源部的先锋项目(DOE Vanguard project)等。

合作仅止于HPC软件方面?还是会进一步影响到某些应用市场?NVIDIA表示,合作同时也是对于其他平台的补充,例如Jetson Xavier,并将进一步拓展在数据中心和HPC平台的合作。

超算竞争再加剧

在超级计算机中使用基于Arm的体系结构是值得注意的,和其他架构相比,Arm的一大特色在于出色的能效,能够为超级计算提供开放式架构,用户可以实现更为高度的集成。对于需要快速处理和分析大型数据集的研究密集型任务,能够满足内存容量和可扩展性需求。

Arm已经在世界各地的许多HPC中心获得了越来越多的关注,NVIDIA支持Arm CPU后,将为研发超算的研究人员们提供了除英特尔和IBM外的第三种选择,并使得研发者可以通过这种方式获得更多的自主控制能力。对于已经选择了Arm CPU的用户来说,他们同时可以获得NVIDIA GPU加速计算选项。CUDA强大的软件能力,将能够和Arm的软件生态无缝衔接,强强联合。

一直以来,Arm并没有放弃将其处理器扩展至高性能计算领域的坚持。近年来大的举动有:2016年8月宣布将与日本富士通公司合作,开发一个以64位ARMv8-A驱动的Post K超级计算机,并于当年12月宣布收购Allinea Software公司,后者主要为超级计算机提供性能分析工具。在2018年11月的TOP500列表上,首次出现了Arm的身影,而且是安装在大名鼎鼎的美国桑迪亚国家实验室。与此同时,Cray于2018年11月在英国气象局交付了一台基于Arm的超级计算机"Isambard",而日本的下一代超级计算机"Post-K"也同样基于Arm架构。

超算未来将更为注重能耗

超算届有两个重要排名:TOP500和Green500。TOP500主要按照性能基准,提供通用高端应用的系统排名。而相比TOP500,Green500除了追求运算速度,更加重视超算的能耗问题。

根据今年刚刚发布的Green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于NVIDIA的支持。关键因素在于:采用NVIDIA GPU的超级计算机能够将繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上;NVIDIA与Mellanox合作优化整体超级计算集群的处理;以及NVIDIA发明的SXM 3D封装和可实现极密集型扩展节点的NVIDIA NVLink互连技术。

携手打造超豪华“朋友圈”

包括超算中心和系统提供商以及系统级芯片制造商等在内的众多HPC行业及Arm生态系统中的全球领先企业,都表达了其对于NVIDIA携手Arm的支持。

对于超算百万兆级时代的愿景,Cray认为主要在于将AI和分析与建模、仿真相结合的系统,这些系统能够支持、也经常需要为科学、工程和数字化转型所需的数据密集型工作负载构建的多种处理器架构和系统。Cray系统管理和编程环境(编译器、库和工具)已经能够在XC和未来的Shasta超级计算机上支持Arm处理器,将CUDA和CUDA-X HPC和AI软件堆栈用于Arm平台,并将其与Cray系统管理和编程环境紧密集成,能够助力其超级计算机实现最终愿景。

“欧洲处理器计划(European Processor Initiative,EPI)总经理Philippe Notton则表示,打造欧盟自己的高端、低功耗、通用和加速器解决方案,EPI和其工业合作伙伴SiPearl非常看好NVIDIA所带来的全新可能性。将EPI基于Arm的微处理器与NVIDIA加速器相结合,能够匹配未来欧洲百万兆级模块化超级计算机中的构建模块。”

考虑到未来几年内百万兆级系统和大规模AI计算的兴起,Jülich超算中心负责人Thomas Lippert表示, NVIDIA对Arm处理器的支持是非常令人兴奋的发展,对于实现未来超级计算机和可组合数据中心的真正模块化至关重要。

在HPC网络方面处于领先地位的Mellanox Technologies,其InfiniBand和以太网技术连接了全球多款大型的超级计算机,其中就包括第一代基于Arm的各系统。该公司创始人兼首席执行官Eyal Waldman希望通过持续合作,部署200Gb/s HDR和计算网络技术,以优化HPC和AI工作负载,并实现新一代基于Arm的超级计算机的超级连接。

百万兆级意义何在?

全球超级计算机竞赛正朝着“百万兆级计算”这个里程碑似的目标前进着。

百万兆级意味着什么?一个百万兆级的计算机一瞬间进行的计算量,相当于地球上所有人每天每秒都不停地计算四年。

这种非凡的力量将使研究人员能够进行大规模复杂的模拟,从而在许多领域取得进展,从气候科学到基因组学、可再生能源和人工智能。田纳西大学的超级计算机专家Jack Dongarra曾说过:“百万兆级的计算机是一项有力的科学工具,就像粒子对撞机或巨型望远镜一样。”这些机器在工业上也很有用,它们可以被用于加速产品设计和识别新材料。军方和情报机构也渴望这样的超级计算机能够将被用于维护国家安全。超级计算机是促进科学发现的重要工具,建立百万兆级超级计算将能够极大地扩展人类知识的边界。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8648

    浏览量

    361756
  • NVIDIA
    +关注

    关注

    14

    文章

    4588

    浏览量

    101702
  • 超级计算
    +关注

    关注

    1

    文章

    36

    浏览量

    11126
  • HPC
    HPC
    +关注

    关注

    0

    文章

    279

    浏览量

    23418
  • CUDA
    +关注

    关注

    0

    文章

    119

    浏览量

    13460
收藏 人收藏

    评论

    相关推荐

    Keil使用AC6编译提示CUDA版本过高怎么解决?

    \' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1
    发表于 04-11 07:56

    深度解读Nvidia AI芯片路线图

    Nvidia是一个同时拥有 GPU、CPU和DPU的计算芯片和系统公司。Nvidia通过NVLink、NVSwitch和NVLink C2C技术将CPU、GPU进行灵活连接组合形成统一的硬件架构,并于CUDA一起形成完整的软硬件
    发表于 03-13 09:25 354次阅读
    深度<b class='flag-5'>解读</b><b class='flag-5'>Nvidia</b> AI芯片路线图

    什么是CUDA?谁能打破CUDA的护城河?

    在最近的一场“AI Everywhere”发布会上,Intel的CEO Pat Gelsinger炮轰NvidiaCUDA生态护城河并不深,而且已经成为行业的众矢之的。
    的头像 发表于 12-28 10:26 1720次阅读
    什么是<b class='flag-5'>CUDA</b>?谁能打破<b class='flag-5'>CUDA</b>的护城河?

    OpenCV4.8 CUDA编程代码教程

    OpenCV4支持通过GPU实现CUDA加速执行,实现对OpenCV图像处理程序的加速运行,当前支持加速的模块包括如下。
    的头像 发表于 12-05 09:56 437次阅读
    OpenCV4.8 <b class='flag-5'>CUDA</b>编程代码教程

    OpenCV4.8+CUDA+扩展模块支持编译指南

    OpenCV4.8+CUDA+扩展模块支持编译指南
    的头像 发表于 11-30 16:45 359次阅读
    OpenCV4.8+<b class='flag-5'>CUDA</b>+扩展模块<b class='flag-5'>支持</b>编译指南

    IAR能否支持易的GD32进行编程开发?

    IAR能否支持易的GD32进行编程开发
    发表于 10-11 07:30

    CUDA核心是什么?CUDA核心的工作原理

    CUDA核心(Compute Unified Device Architecture Core)是NVIDIA图形处理器(GPU)上的计算单元,用于执行并行计算任务。每个CUDA核心可以执行单个线程的指令,包括算术运算、逻辑操作
    发表于 09-27 09:38 4857次阅读
    <b class='flag-5'>CUDA</b>核心是什么?<b class='flag-5'>CUDA</b>核心的工作原理

    在线研讨会 | 专家中文解读:即将上市的 CUDA Toolkit 新特性、新功能

    基于 NVIDIA CUDA 架构师 Stephen Jones 近期的 CUDA 技术简报(Accelerated Computing / CUDA Technical Briefi
    的头像 发表于 09-22 18:45 330次阅读
    在线研讨会 | 专家中文<b class='flag-5'>解读</b>:即将上市的 <b class='flag-5'>CUDA</b> Toolkit 新特性、新功能

    Arm Forge 22.1.3版用户指南

    Arm Forge支持许多并行体系结构和模型,包括MPI、CUDA和OpenMP。 Arm Forge是一款跨平台工具,支持最新的编译器
    发表于 08-10 06:29

    开发者活动 | 2023 NVIDIA &amp; 创乐博 CUDA 训练营成功举办,助力学生和开发者们成为高性能计算领域的未来之星

      NVIDIA 为推动全球性的人工智能和科学计算的发展,长期致力于推广高性能技术应用为社会发展做出贡献。尤其在国内高等教育领域,十多年来,NVIDIA 持续不断地为众多高校提供培养学生的 CUDA
    的头像 发表于 08-03 19:25 306次阅读
    开发者活动 | 2023 <b class='flag-5'>NVIDIA</b> &amp; 创乐博 <b class='flag-5'>CUDA</b> 训练营成功举办,助力学生和开发者们成为高性能计算领域的未来之星

    开发者活动 | 2023 NVIDIA &amp; 创乐博 CUDA 线上训练营火热报名中

    NVIDIA 作为一家全栈式 AI 计算平台的赋能者,致力于推动全球性的人工智能和科学计算的发展,通过推广高性能技术应用为社会发展做出积极贡献。尤其在国内高等教育领域,十多年来 NVIDIA 一直
    的头像 发表于 07-13 21:15 403次阅读
    开发者活动 | 2023 <b class='flag-5'>NVIDIA</b> &amp; 创乐博 <b class='flag-5'>CUDA</b> 线上训练营火热报名中

    AI竞争加剧,但追赶Nvidia并非易事

    竞争对手也需要接受一个残酷的现实。目前,Nvidia的领先地位如此之大,要想跨越它,需要巨大的跃进、灵活的步伐,还需要运气。这是因为搞AI并不是靠蛮力。它需要一套协调得天衣无缝的动作和部件,就像一部交响乐。
    的头像 发表于 06-14 15:08 448次阅读

    周三研讨会预告 | 从 CUDA 到 CV-CUDA:如何为自己定制高效的 CV 任务算子

    随着科技的不断发展,计算机视觉已成为当今最炙手可热的技术领域之一,被广泛应用于图像处理、视频分析、自动驾驶等多个场景。GPU 高性能的计算能力对于计算机视觉任务的成功实现至关重要。NVIDIA 推出
    的头像 发表于 06-13 20:55 282次阅读
    周三研讨会预告 | 从 <b class='flag-5'>CUDA</b> 到 CV-<b class='flag-5'>CUDA</b>:如何为自己定制高效的 CV 任务算子

    NVIDIA “魔盒”有哪些“内涵”

    来了解下,这款号称“魔盒”的AI边缘计算终端有哪些值得称道的地方。 一、处理性能和视频分析 先来回顾一下AI 边缘计算终端FCU3001的参数,其搭载的CPU为六核NVIDIA Carmel(ARM
    发表于 05-26 14:12

    介绍CUDA编程模型及CUDA线程体系

    CUDA 编程模型主要有三个关键抽象:层级的线程组,共享内存和栅同步(barrier synchronization)。
    的头像 发表于 05-19 11:32 1131次阅读
    介绍<b class='flag-5'>CUDA</b>编程模型及<b class='flag-5'>CUDA</b>线程体系