0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

VIDIA宣布在AI超级计算平台中加入融合了AI与高性能计算的新技术

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-06-29 09:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA A100 80G PCIe、NVIDIA NDR 400G InfiniBand和NVIDIA Magnum IO三箭齐发!超强HGX助力广大HPC系统和云服务

NVIDIA宣布在NVIDIA HGX AI超级计算平台中加入融合了AI与高性能计算的新技术,使越来越多的行业能够更加充分地利用超级计算的力量。

为了加快产业AI和HPC新时代的到来,NVIDIA在HGX平台中加入了三项关键技术:NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand网络和NVIDIA Magnum IO GPUDirect Storage软件。三者结合,提供了卓越的性能,以实现产业 HPC 的创新。

目前,已有数十家合作伙伴将NVIDIA HGX平台用于新一代系统和解决方案,其中包括源讯(Atos)、戴尔科技(Dell Technologies,)、慧与(Hewlett Packard Enterprise )、联想(Lenovo)、Microsoft Azure以及NetApp等。

NVIDIA创始人兼首席执行官黄仁勋先生表示:“HPC 革命始于学术界,并迅速扩展到各行各业。产业各项关键趋势正在推动超指数、超摩尔定律的发展速度,使HPC变成各行业都能使用的工具。NVIDIA 的 HGX 平台为研究人员提供了卓越的高性能计算加速能力,以解决行业面临的那些最棘手的问题。”

行业领导者使用 HGX 平台推动创新突破

高科技产业先驱者通用电气正在使用HGX 平台,将 HPC 创新应用于计算流体动力学模拟,以指导大型燃气轮机和喷气发动机的设计创新。HGX平台在通用电气的 GENESIS 代码中实现了突破性CFD 方法的数量级加速,该代码采用大涡模拟来研究涡轮机内部湍流的影响。涡轮机由数百个单独的叶片组成,需要独特的复杂几何形状。

除了推动产业 HPC 转型外,HGX平台还在加速世界各地的科学 HPC 系统,包括同样在今日宣布的位于爱丁堡大学的新一代超级计算机。

NVIDIA A100 80GB PCIe GPU提升AI和HPC性能

NVIDIA A100 TensorCore GPU提供了前所未有的HPC加速能力,解决了与产业HPC相关的复杂AI、数据分析、模型训练和计算模拟等挑战。与A100 40GB相比,A100 80GB PCIe GPU的内存带宽增加了25%,达到2TB/s,并且提供80GB的HBM2e高带宽内存。

A100 80GB PCIe的巨大内存容量与高内存带宽,可以保存更多的数据和更大的神经网络,从而最大限度地减少节点间通信和能耗。凭借其更快的内存带宽,研究人员能够获得更高的吞吐量和更快得到结果,实现IT投资价值的最大化。

A100 80GB PCIe GPU基于NVIDIA Ampere架构。该架构内置Multi-Instance GPU(MIG)功能,可为AI推理等小型工作负载提供加速。MIG允许HPC系统缩小计算和内存规模的同时并保证服务质量。除了PCIe之外,还有四卡和八卡的NVIDIA HGX A100配置。

NVIDIA合作伙伴为A100 80GB PCIe GPU提供了广泛的支持,包括源讯(Atos)、思科(Cisco)、戴尔科技(Dell Technologies)、富士通(Fujitsu)、新华三(H3C)、慧与(Hewlett Packard Enterprise )、浪潮(Inspur)、联想(Lenovo)、PenguinComputing、云达科技(QCT)以及超微(Supermicro)。通过NVLink 互连的基于 A100 GPU 的HGX 平台也可通过来自 AWS (Amazon Web Services)、Microsoft Azure 和Oracle Cloud Infrastructure 的云服务获得。

新一代NDR 400Gb/s InfiniBand交换机系统

NVIDIA InfiniBand是全球唯一具有完全卸载功能的网络计算的互连系统,为那些需要超大数据通道的HPC系统提供超强支持。通过NDR InfiniBand网络可以轻松扩展性能,以应对产业HPC和科学HPC系统面临的大量挑战。基于NVIDIA Quantum-2单芯片的交换机系统可提供64个NDR 400Gb/s InfiniBand端口(或128个NDR200端口),其端口密度比HDR InfiniBand高出3倍。

NVIDIA Quantum-2模块化交换机提供了可扩展的端口配置选项,最高可提供2048个NDR400Gb/s InfiniBand端口(或4096个NDR200端口),双向总吞吐量达到1.64Pb/s,是上一代HDR InfiniBand模块化交换机系列的5倍。相比上一代,这款2048端口交换机的扩展能力增加了6.5倍,采用DragonFly+网络拓扑,只需三个网络Hop就能连接超过一百万个节点。第三代 NVIDIA SHARP 网络计算数据归约技术,比上一代的AI 加速能力提高了 32 倍,可大幅提升高性能产业和科学应用的性能。

此外,NVIDIA UFM Cyber-AI平台还提供了先进的管理功能,如网络自修复功能等,以及NVIDIA网络计算加速引擎,进一步将数据中心的停机时间降至最低。

基于行业标准的NVIDIA Quantum-2 交换机(预计在年底前可出样品)具有向后和向前的兼容性,可以轻松迁移和扩展现有系统和软件。

包括源讯(Atos)、DDN、戴尔科技(DellTechnologies)、Excelero 、技嘉科技(GIGABYTE)、慧与(HPE)、联想(Lenovo)、PenguinComputing、云达科技(QCT)、超微(Supermicro)、VAST以及 WekaIO 在内的业内领先基础设施制造商等,均计划将Quantum-2 NDR 400Gb/s InfiniBand交换机集成到其企业级产品和HPC产品中。另外,包括Azure在内的云服务供应商们也正在使用InfiniBand技术。

Magnum IO GPUDirect Storage介绍

Magnum IO GPUDirect Storage提供GPU内存和存储之间的直接内存访问,实现了优异的复杂工作负载处理性能。这条直接的通路让应用程序从低I/O延迟中受益,并能够充分利用到网卡的全部带宽,同时减少CPU在通信中的负载,并可以管理逐渐增加的数据消耗所产生的影响。

支持 Magnum IO GPUDirect Storage(现已上市)的行业领导者包括 DDN、戴尔科技(Dell Technologies)、Excelero、慧与(HPE)、IBM Storage、Micron、NetApp、Pavilion、ScaleFlux、VAST 和 WekaIO。

想要了解 NVIDIA 的 Marc Hamilton 的最新消息和参与 NVIDIA HPC 专家的现场问答,请在北京时间6月29日中午12点30分收听 NVIDIA ISC2021 特别演讲。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41964

    浏览量

    303060
  • 超级计算
    +关注

    关注

    1

    文章

    45

    浏览量

    11596
  • HPC
    HPC
    +关注

    关注

    0

    文章

    351

    浏览量

    25105
  • 数据分析
    +关注

    关注

    2

    文章

    1524

    浏览量

    36415

原文标题:ISC2021 | NVIDIA与全球合作伙伴联合发布全新HGX A100系统,为产业AI和HPC提速

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    黑马-Java+AI新版V16零基础就业班百度云网盘下载+Java+AI全栈开发工程师

    传统开发升级,Java+AI 融合开发精讲——构建下一代企业级智能应用的技术栈重塑 人工智能加速渗透至各行各业的当下,Java 开发者正面临一个关键转折点:要么被动旁观
    发表于 05-01 11:29

    OrangePi RV2 深度技术评测:RISC-V AI融合架构的先行者

    x265 视频编码 :仅1.2 fps,远低于主流 ARM 平台 整体结论 :通用计算性能相当于5 年前入门级 ARM 处理器 (如Cortex-A53),无法胜任重度计算任务。 2
    发表于 03-03 20:19

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 嵌入式与 AI 领域落地

    据科技区角报道半导体解决方案提供商 Quintauris 最近宣布和 RISC-V 处理器 IP 领域的头部厂商 SiFive 达成战略合作,目标直接瞄准加速 RISC-V 嵌入式、AI 系统等
    发表于 12-18 12:01

    NVIDIAISC 2025分享最新超级计算进展

    从 NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现飞跃。 SC25 上展示的加速系统突显全球
    的头像 发表于 11-25 10:59 1172次阅读
    NVIDIA<b class='flag-5'>在</b>ISC 2025分享最新<b class='flag-5'>超级</b><b class='flag-5'>计算</b>进展

    RK3576驱动高端显控系统升级:多屏拼控与AI视觉融合解决方案

    ,RK3576 凭借高算力、低功耗和强扩展性的优势,成为工业控制、交通调度、能源监控、安防指挥中心等领域的核心计算平台。未来,随着 AI 技术与显控需求的不断升级,RK3576 将进一
    发表于 11-21 17:51

    融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件

    *附件:ai study.zip*附件:融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件.pdf 基于开源鸿蒙编写的ai
    发表于 11-12 15:38

    【产品介绍】Altair HPCWorks高性能计算管理平台(HPC平台

    ,AltairHPCWorks使高性能和云计算变得快速、高效和提高有效产出-无论您的资源是本地、云端还是混合环境中。专业地管理IT复杂性并支持最新的AI工作负载。使用成本控制
    的头像 发表于 09-18 17:56 1060次阅读
    【产品介绍】Altair HPCWorks<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>管理<b class='flag-5'>平台</b>(HPC<b class='flag-5'>平台</b>)

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予人的智能,科学家们希望没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑本质上
    发表于 09-06 19:12

    RK3576助力智慧安防:8路高清采集与AI识别

    推出的米尔RK3576开发板,凭借强大的多媒体处理能力、丰富的接口支持和优异的能效表现,为新一代安防监控平台提供高性能、低功耗的解决方案。 1. 安防行业痛点与需求传统安防监控往往存在以下问题: 1
    发表于 08-22 17:41

    AI 边缘计算网关:开启智能新时代的钥匙​—龙兴物联

    顺畅地通向云端,实现设备与云端之间高效的数据传输与交互。通过融合先进的边缘计算和人工智能技术AI 边缘计算网关能够
    发表于 08-09 16:40

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算
    的头像 发表于 06-26 19:39 1494次阅读
    NVIDIA驱动的现代<b class='flag-5'>超级</b><b class='flag-5'>计算</b>机如何突破速度极限并推动科学发展

    高性能计算集群AI领域的应用前景

    随着人工智能技术的飞速发展,高性能计算集群(HPC)AI领域的应用前景日益受到关注。HPC提供的计算
    的头像 发表于 06-23 13:07 1470次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群<b class='flag-5'>在</b><b class='flag-5'>AI</b>领域的应用前景

    芯原可扩展的高性能GPGPU-AI计算IP赋能汽车与边缘服务器AI解决方案

    与人工智能 (AI) 加速器相融合,这些IP热和功耗受限的环境下,能够高效支持大语言模型 (LLM) 推理、多模态感知以及实时决策等复杂的AI工作负载。 芯原的GPGPU-
    的头像 发表于 06-16 10:44 1591次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级
    的头像 发表于 06-12 15:33 1766次阅读