0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA宣布CUDA支持Arm 开辟实现百万兆级超算的新途径

NVIDIA英伟达 来源:yxw 2019-06-18 17:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA近日宣布支持Arm CPU,为高性能计算行业开辟了一条全新途径,以构建具有极高能效水平的百万兆级AI超级计算机。

NVIDIA将于年底前向Arm®生态系统提供全堆栈的AI和HPC软件,该堆栈为600多个HPC应用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI™和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

堆栈优化完成后,NVIDIA将为所有主要CPU架构提供加速,包括x86、POWER和Arm。

NVIDIA创始人兼首席执行官黄仁勋表示:“超级计算机是促进科学发现的重要工具,建立百万兆级超级计算将能够极大地扩展人类知识的边界。随着传统计算规模扩展步伐的停止,功率也将成为所有超级计算机的限制因素。NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合,将助力HPC社区实现大幅提升,以达到百万兆级。”

“Arm正在与生态系统合作,为基于Arm的SoC带来前所未有的计算性能提升,并实现百万兆级功能,”Arm首席执行官Simon Segars表示,“HPC社区已经部署了Arm技术,以应对全球最复杂的研究挑战。通过与NVIDIA合作,将CUDA加速引入Arm架构,这一举措对于HPC社区来说,可谓是一大重要里程碑。”

根据今日发布的Green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于NVIDIA的支持。

而使之成为可能的关键因素在于:采用NVIDIA GPU的超级计算机能够将繁重的处理作业卸载至更为节能的并行处理CUDA® GPU之上;NVIDIA与Mellanox合作优化整体超级计算集群的处理;以及NVIDIA发明的SXM 3D封装和可实现极密集型扩展节点的NVIDIA NVLink®互连技术。

NVIDIA对基于Arm的HPC系统的支持建立在双方超过10年的合作基础之上。NVIDIA的几款用于便携式游戏、自动驾驶汽车、机器人嵌入式AI计算的系统级芯片产品都采用了Arm。

强大的生态系统支持

包括超算中心和系统提供商以及系统级芯片制造商等在内的,众多HPC行业及Arm生态系统中的全球领先企业,都表达了其对此举的支持。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9588

    浏览量

    393695
  • NVIDIA
    +关注

    关注

    14

    文章

    5696

    浏览量

    110120
  • AI
    AI
    +关注

    关注

    91

    文章

    41182

    浏览量

    302626
  • CUDA
    +关注

    关注

    0

    文章

    128

    浏览量

    14550

原文标题:NVIDIA宣布CUDA支持Arm,开辟实现百万兆级超算的新途径

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RV生态又一里程碑:英伟达官宣CUDA将兼容RISC-V架构!

    电子发烧友网报道(文/梁浩斌)英伟达生态护城河CUDA,从最初支持x86、Power CPU架构,到2019年宣布支持Arm CPU,不断拓
    的头像 发表于 07-19 00:04 6825次阅读
    RV生态又一里程碑:英伟达官宣<b class='flag-5'>CUDA</b>将兼容RISC-V架构!

    中兴通讯重磅发布节点技术白皮书

    近日,中兴通讯重磅发布《节点技术白皮书》,提出以节点为核心打造标准化“AI工厂”,通过系统架构创新突破力极限与能效瓶颈,为AI基础设施可持续发展
    的头像 发表于 02-10 13:47 710次阅读

    借助NVIDIA CUDA Tile IR后端推进OpenAI Triton的GPU编程

    NVIDIA CUDA Tile 是基于 GPU 的编程模型,其设计目标是为 NVIDIA Tensor Cores 提供可移植性,从而释放 GPU 的极限性能。CUDA Tile 的
    的头像 发表于 02-10 10:31 531次阅读

    如何在NVIDIA CUDA Tile中编写高性能矩阵乘法

    本博文是系列课程的一部分,旨在帮助开发者学习 NVIDIA CUDA Tile 编程,掌握构建高性能 GPU 内核的方法,并以矩阵乘法作为核心示例。
    的头像 发表于 01-22 16:43 5304次阅读
    如何在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile中编写高性能矩阵乘法

    NVIDIA CUDA Tile的创新之处、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,这是自 2006 年 NVIDIA
    的头像 发表于 12-24 10:17 660次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile的创新之处、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的头像 发表于 12-13 10:12 1430次阅读
    在Python中借助<b class='flag-5'>NVIDIA</b> <b class='flag-5'>CUDA</b> Tile简化GPU编程

    NVIDIA CUDA 13.1版本的新增功能与改进

    NVIDIA CUDA 13.1 是自 CUDA 二十年前发明以来,规模最大、内容最全面的一次更新。
    的头像 发表于 12-13 10:08 2454次阅读

    NVIDIA 与新思科技宣布建立战略合作伙伴关系,携手重塑工程与设计未来

    长期战略合作涵盖了 NVIDIA CUDA 加速计算、代理式 AI 和物理 AI 以及 Omniverse 数字孪生,以实现以前通过传统 CPU 计算难以企及的仿真速度和规模,为工程领域各类场景
    的头像 发表于 12-03 10:27 1198次阅读
    <b class='flag-5'>NVIDIA</b> 与新思科技<b class='flag-5'>宣布</b>建立战略合作伙伴关系,携手重塑工程与设计未来

    Arm Neoverse平台集成NVIDIA NVLink Fusion

    新闻重点 ArmNVIDIA 持续深化合作,在 AI 时代推动协同设计与合作迈向新高度。 生态系统合作伙伴可将高效的 Arm 架构计算能力集成至 NVIDIA NVLink Fu
    的头像 发表于 11-26 11:08 578次阅读

    NVIDIA宣布开源Aerial软件

    NVIDIA 开源其 Aerial 软件,并将 NVIDIA Sionna 研究套件和 Aerial 测试平台引入 NVIDIA DGX Spark 平台,为研究人员提供强大的工具和便捷的访问
    的头像 发表于 11-03 15:14 1180次阅读

    OpenAI和NVIDIA宣布达成合作,部署10吉瓦NVIDIA系统

    此次合作将助力 OpenAI 构建和部署至少 10 吉瓦(gigawatt)的 AI 数据中心,这些数据中心将采用 NVIDIA 系统,包含数百万NVIDIA GPU,为 OpenAI 的下一代 AI 基础设施提供
    的头像 发表于 09-23 14:37 1582次阅读
    OpenAI和<b class='flag-5'>NVIDIA</b><b class='flag-5'>宣布</b>达成合作,部署10吉瓦<b class='flag-5'>NVIDIA</b>系统

    NVIDIA在Hot Chips 2025大会展示创新技术

    本周在加利福尼亚州帕洛阿尔托(Palo Alto)举行的 Hot Chips 大会上,NVIDIA 专家详细介绍了 NVIDIA NVLink 和Spectrum-X 以太网技术、Blackwell 以及 CUDA 如何为全球数
    的头像 发表于 08-27 12:52 2066次阅读

    IAR平台现已提供对Zephyr RTOS的量产支持

    IAR宣布,其嵌入式开发平台正式推出对Zephyr RTOS的量产支持。该支持自IAR的Arm开发工具链v9.70起全面提供。
    的头像 发表于 07-09 15:43 758次阅读

    软通智完成亿A轮融资,加速AI力产业布局

    北京 2025年6月18日 /美通社/ -- 近日,软通动力旗下软通智科技(广东)集团有限公司(以下简称"软通智")完成亿A轮融资,本轮融资由盛景嘉成创投领投,广发信德、毅达资
    的头像 发表于 06-18 15:37 711次阅读

    NVIDIA 采用纳微半导体开发新一代数据中心电源架构 800V HVDC 方案,赋能下一代AI力需求

    全球 AI 力基础设施革新迎来关键进展。近日,纳微半导体(Navitas Semiconductor, 纳斯达克代码:NVTS)宣布参与NVIDIA 英伟达(纳斯达克股票代码: NVDA) 下一代
    发表于 05-23 14:59 3357次阅读
    <b class='flag-5'>NVIDIA</b> 采用纳微半导体开发新一代数据中心电源架构 800V HVDC 方案,赋能下一代AI<b class='flag-5'>兆</b>瓦<b class='flag-5'>级</b><b class='flag-5'>算</b>力需求