0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC 研究人员借助 NVIDIA BlueField DPU 为网络计算的未来打下坚实基础

21克888 来源:厂商供稿 作者:NVIDIA 2022-05-31 14:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

全球的超级计算中心都在纷纷利用NVIDIA Quantum InfiniBand网络上的NVIDIA BlueField DPU将加速计算提升到一个新的水平


在欧洲和美国,HPC开发者正在利用NVIDIA BlueField-2 DPU内的Arm核和加速器的强大功能为超级计算机提供强大助力。

美国洛斯阿拉莫斯国家实验室(LANL)正在与NVIDIA进行一项为期多年的广泛合作,这项合作旨在将计算型多物理应用的性能提高30倍。

LANL研究人员预计,使用在NVIDIA Quantum InfiniBand网络上运行的DPU(数据处理器)可显著提升性能。这将使利用BlueField以及NVIDIA DOCA软件框架在计算存储、模式匹配等领域实现技术创新。

面向DPU的开放式API

这些努力还将有助于进一步定义OpenSNAPI,任何人都可通过该应用接口来控制DPU。这是统计计算框架( Unified Communication Framework)的一个项目,Unified Communication Framework是一个旨在实现HPC应用异构计算的联盟,成员包括Arm、IBM、NVIDIA、美国国家实验室和美国的一些大学。

LANL已经感受到网络计算的强大功能,这要归功于其创建的DPU赋能的存储系统。

加速闪存盒(ABoF,如下图所示)将固态存储与DPU和InfiniBand加速器相结合,可为Linux文件系统的关键性能部分提供加速。它的性能高达同类存储系统的30倍,并将成为LANL基础架构中的关键组件。

一位研究人员在近期的LANL博客中表示:“ABoF让计算靠近存储,可更大限度减少数据移动,从而提高仿真和数据分析工作流程的效率。”

德克萨斯州打造出云原生超级计算平台

德克萨斯高级计算中心(TACC)近期也开始在Dell PowerEdge服务器中采用BlueField-2。它将在InfiniBand网络上使用DPU,使其Lonestar6系统成为云原生超级计算的开发平台。

TACC的Lonestar6为德州农工大学、德州理工大学和北德克萨斯大学的众多HPC开发者,以及一些研究中心和教职人员提供服务。

MPI获得加速

在距TACC东北部1200英里的地方,俄亥俄州立大学的研究人员展示了DPU如何将一个HPC热门编程模型的运行速度提高26%。

他们通过卸载消息传递接口(MPI)的关键部分,加速了P3DFFT,这是一个用于众多大规模HPC仿真的数学库。

俄亥俄州立大学计算机科学与工程专业的教授Dhabaleswar K. (DK) Panda在其带领的MVAPICH开源软件团队推动DPU工作,他表示:“DPU就像是为忙碌的高管处理工作的助手,它们将成为主流,因为它们可以加速运行各种工作负载。”

HPC中心和云中的DPU


对于运行药物研发或飞机设计等HPC仿真应用的超级计算机而言,高达两位数的性能加速是惊人的。Panda表示,云服务可以利用这些加速提高客户的生产力,他已收到多个HPC中心的代码请求。

Quantum InfiniBand网络以及NVIDIA SHARP特性,助力他高效完成工作。

他说:“其他人还在谈论网络计算,而InfiniBand已经在为它提供支持。”

达勒姆开发负载均衡


欧洲的多个研究团队正利用BlueField DPU加速MPI和其他HPC工作负载。

例如,英格兰北部的达勒姆大学正在开发一款软件,用于在16个节点的Dell PowerEdge集群上使用BlueField DPU以实现MPI作业的负载均衡。该项目的首席调查员Tobias Weinzierl表示,该软件将为全球各地的HPC设施更高效地处理更好算法铺平道路。

剑桥大学和慕尼黑的DPU应用

剑桥大学、伦敦和慕尼黑的研究人员也在使用DPU。

伦敦大学学院正在探索如何在BlueField-2 DPU上为主机系统调度作业。例如,可以使用它的能力在主机处理器之间移动数据,以便在需要时数据已然就位。

Dell PowerEdge服务器内的BlueField DPU可为Cambridge Service for Data Driven Discovery服务卸载主机CPU的安全策略、存储框架和其他作业,从而更大限度地提高系统性能。

与此同时,慕尼黑工业大学计算机体系架构和并行系统组的研究人员正在寻找方法,使用DPU来卸载MPI和操作系统任务,这是EuroHPC项目的一部分。

在美国,佐治亚理工学院的研究人员正在与桑迪亚国家实验室合作,利用BlueField-2 DPU加速分子动力学研究。一篇论文描述了他们目前的工作成果,其中表明,算法可以加速高达20%,且不会损失模拟的准确性。

不断扩展的网络


本月早些时候,日本研究人员宣布将推出一款采用新版NVIDIA H100 Tensor Core GPU的系统,该系统将搭载速度更快、更智能的NVIDIA Quantum-2 InfiniBand网络平台。

NEC将使用H100的为筑波大学计算科学中心构建算力大约为6 PFLOPS超级计算机。研究人员将使用该系统实现气候学、天体物理学、大数据、AI和更多方面的研究。

与此同时,Panda等研究人员已经开始考虑如何使用BlueField-3 DPU的核心功能。

他打趣道:“这就像雇佣拥有大学学位的行政助理,而不是那些拥有高中文凭的行政助理一样,所以我希望能够完成越来越多的工作卸载。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39715
  • HPC
    HPC
    +关注

    关注

    0

    文章

    342

    浏览量

    24828
  • 网络计算机
    +关注

    关注

    0

    文章

    3

    浏览量

    6669
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA在ISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示
    的头像 发表于 11-25 10:59 493次阅读
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超级<b class='flag-5'>计算</b>进展

    NVIDIA宣布开源Aerial软件

    NVIDIA 开源其 Aerial 软件,并将 NVIDIA Sionna 研究套件和 Aerial 测试平台引入 NVIDIA DGX Spark 平台,
    的头像 发表于 11-03 15:14 579次阅读

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和
    的头像 发表于 11-03 14:48 601次阅读

    基于NVIDIA BlueField DPU的5G UPF数据面加速方案

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI
    的头像 发表于 09-04 11:26 885次阅读

    利用NVIDIA DPU重塑网络安全格局

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI
    的头像 发表于 08-20 14:31 1026次阅读

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每个版本都扩展了 NVIDIA BlueField
    的头像 发表于 07-04 14:27 964次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮点解析

    第三届NVIDIA DPU黑客松开启报名

    碰撞的绝佳机会。本次竞赛采用开放式主题,参与者将通过 NVIDIA DOCA 软件框架构建创新的加速应用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、
    的头像 发表于 05-27 10:16 744次阅读

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾一度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出一个模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 736次阅读

    Node‑RED可视化拖拽编程实践-成都纵横智控EG边缘计算网关

    成都纵横智控EG边缘计算网关借助Node‑RED的开放性与可视化优势,打破了传统工业控制系统对高级编程技能的依赖,现场自动化提供了“人人皆可配置”的新范式。其多协议、多网络及本地智能
    的头像 发表于 04-17 15:38 836次阅读
    Node‑RED可视化拖拽编程实践-成都纵横智控EG边缘<b class='flag-5'>计算</b>网关

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制
    的头像 发表于 03-20 18:59 1275次阅读
    <b class='flag-5'>NVIDIA</b> GTC2025 亮点  <b class='flag-5'>NVIDIA</b>推出 DGX Spark个人AI<b class='flag-5'>计算</b>机

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制
    发表于 03-19 09:59 504次阅读
       <b class='flag-5'>NVIDIA</b> 宣布推出 DGX Spark 个人 AI <b class='flag-5'>计算</b>机

    HPC计算的技术架构

    HPC计算结合了HPC的强大计算能力和云计算的弹性、可扩展性,用户提供了按需获取高性能
    的头像 发表于 02-05 14:51 702次阅读

    利用NVIDIA DPF引领DPU加速云计算未来

    越来越多的企业开始采用加速计算,从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架(DPF),该框架提供了基础构建模块来释放 NVIDIA BlueFie
    的头像 发表于 01-24 09:29 1281次阅读
    利用<b class='flag-5'>NVIDIA</b> DPF引领<b class='flag-5'>DPU</b>加速云<b class='flag-5'>计算</b>的<b class='flag-5'>未来</b>

    NVIDIA BlueField-3 DPU上运行WEKA客户端的实际优势

    WEKA是可扩展软件定义数据平台的先驱,NVIDIA 正在与其合作,将 WEKA 先进的数据平台解决方案与功能强大的NVIDIA BlueField DPU相结合。
    的头像 发表于 01-07 09:43 1051次阅读
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField</b>-3 <b class='flag-5'>DPU</b>上运行WEKA客户端的实际优势

    计算HPC的关系

    尽管云计算HPC在架构、应用场景和成本效益等方面存在显著差异,但云计算HPC之间并非孤立存在,而是相互补充、协同发展的关系。下面,AI部落小编带您探讨云
    的头像 发表于 12-14 10:35 670次阅读