0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用NVIDIA BlueField DPU将加速计算提升到新的水平

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-06-01 10:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

全球的超级计算中心都在纷纷利用 NVIDIA Quantum InfiniBand 网络上的 NVIDIA BlueField DPU 将加速计算提升到一个新的水平。

在欧洲和美国,HPC 开发者正在利用 NVIDIA BlueField-2 DPU 内的 Arm 核和加速器的强大功能为超级计算机提供强大助力。

美国洛斯阿拉莫斯国家实验室(LANL)正在与 NVIDIA 进行一项为期多年的广泛合作,这项合作旨在将计算型多物理应用的性能提高 30 倍。

LANL 研究人员预计,使用在 NVIDIA Quantum InfiniBand 网络上运行的 DPU(数据处理器)可显著提升性能。这将使利用 BlueField 以及 NVIDIA DOCA 软件框架在计算存储、模式匹配等领域实现技术创新。

面向 DPU 的开放式 API

这些努力还将有助于进一步定义 OpenSNAPI ,任何人都可通过该应用接口来控制 DPU 。这是统计计算框架(Unified Communication Framework)的一个项目,Unified Communication Framework 是一个旨在实现 HPC 应用异构计算的联盟,成员包括 Arm 、IBM 、NVIDIA 、美国国家实验室和美国的一些大学。

LANL 已经感受到网络计算的强大功能,这要归功于其创建的 DPU 赋能的存储系统。

加速闪存盒(ABoF,如下图所示)将固态存储与 DPU 和 InfiniBand 加速器相结合,可为 Linux 文件系统的关键性能部分提供加速。它的性能高达同类存储系统的 30 倍,并将成为 LANL 基础架构中的关键组件。

一位研究人员在近期的 LANL 博客中表示:“ABoF 让计算靠近存储,可更大限度减少数据移动,从而提高仿真和数据分析工作流程的效率。”

德克萨斯州打造出云原生超级计算平台

德克萨斯高级计算中心(TACC)近期也开始在 Dell PowerEdge 服务器中采用 BlueField-2 。它将在 InfiniBand 网络上使用 DPU,使其 Lonestar6 系统成为云原生超级计算的开发平台。

TACC 的 Lonestar6 为德州农工大学、德州理工大学和北德克萨斯大学的众多 HPC 开发者,以及一些研究中心和教职人员提供服务。

MPI 获得加速

在距 TACC 东北部 1200 英里的地方,俄亥俄州立大学的研究人员展示了 DPU 如何将一个 HPC 热门编程模型的运行速度提高 26%。

他们通过卸载消息传递接口(MPI)的关键部分,加速了 P3DFFT ,这是一个用于众多大规模 HPC 仿真的数学库。

俄亥俄州立大学计算机科学与工程专业的教授 Dhabaleswar K. (DK) Panda 在其带领的 MVAPICH 开源软件团队推动 DPU 工作,他表示:“DPU 就像是为忙碌的高管处理工作的助手,它们将成为主流,因为它们可以加速运行各种工作负载。”

HPC 中心和云中的 DPU

对于运行药物研发或飞机设计等 HPC 仿真应用的超级计算机而言,高达两位数的性能加速是惊人的。Panda 表示,云服务可以利用这些加速提高客户的生产力,他已收到多个 HPC 中心的代码请求。

Quantum InfiniBand 网络以及 NVIDIA SHARP 特性,助力他高效完成工作。

他说:“其他人还在谈论网络计算,而 InfiniBand 已经在为它提供支持。”

达勒姆开发负载均衡

欧洲的多个研究团队正利用 BlueField DPU 加速 MPI 和其他 HPC 工作负载。

例如,英格兰北部的达勒姆大学正在开发一款软件,用于在 16 个节点的 Dell PowerEdge 集群上使用 BlueField DPU 以实现 MPI 作业的负载均衡。该项目的首席调查员 Tobias Weinzierl 表示,该软件将为全球各地的 HPC 设施更高效地处理更好算法铺平道路。

剑桥大学和慕尼黑的 DPU 应用

剑桥大学、伦敦和慕尼黑的研究人员也在使用 DPU 。

伦敦大学学院正在探索如何在 BlueField-2 DPU 上为主机系统调度作业。例如,可以使用它的能力在主机处理器之间移动数据,以便在需要时数据已然就位。

Dell PowerEdge 服务器内的 BlueField DPU 可为 Cambridge Service for Data Driven Discovery 服务卸载主机 CPU 的安全策略、存储框架和其他作业,从而更大限度地提高系统性能。

与此同时,慕尼黑工业大学计算机体系架构和并行系统组的研究人员正在寻找方法,使用 DPU 来卸载 MPI 和操作系统任务,这是 EuroHPC 项目的一部分。

在美国,佐治亚理工学院的研究人员正在与桑迪亚国家实验室合作,利用 BlueField-2 DPU 加速分子动力学研究。一篇论文描述了他们目前的工作成果,其中表明,算法可以加速高达 20% ,且不会损失模拟的准确性。

不断扩展的网络

本月早些时候,日本研究人员宣布将推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系统,该系统将搭载速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 网络平台。

NEC 将使用 H100 的为筑波大学计算科学中心构建算力大约为 6 PFLOPS 超级计算机。研究人员将使用该系统实现气候学、天体物理学、大数据、AI 和更多方面的研究。

与此同时,Panda 等研究人员已经开始考虑如何使用 BlueField-3 DPU 的核心功能。

他打趣道:“这就像雇佣拥有大学学位的行政助理,而不是那些拥有高中文凭的行政助理一样,所以我希望能够完成越来越多的工作卸载。”

原文标题:ISC22 | HPC 研究人员借助 NVIDIA BlueField DPU 为网络计算的未来打下坚实基础

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109048
  • 计算
    +关注

    关注

    2

    文章

    458

    浏览量

    39832
  • DPU
    DPU
    +关注

    关注

    0

    文章

    407

    浏览量

    26176

原文标题:ISC22 | HPC 研究人员借助 NVIDIA BlueField DPU 为网络计算的未来打下坚实基础

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA在ISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示的加速
    的头像 发表于 11-25 10:59 465次阅读
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超级<b class='flag-5'>计算</b>进展

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和
    的头像 发表于 11-03 14:48 585次阅读

    基于NVIDIA BlueField DPU的5G UPF数据面加速方案

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
    的头像 发表于 09-04 11:26 863次阅读

    利用NVIDIA DPU重塑网络安全格局

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
    的头像 发表于 08-20 14:31 1015次阅读

    通信不发愁,PROFINET转DEVICENET网关诊断解决方案状态监测提升到水平

    PROFINET 诊断解决方案状态监测提升到水平 生产基地,用于生产镁合金部件。该基地新增了四台超现代化压铸机,压铸压力分别为2500吨和1800吨。自新压铸机投入使用以来,客户一直使用开放式
    的头像 发表于 08-05 17:25 320次阅读
    通信不发愁,PROFINET转DEVICENET网关诊断解决方案<b class='flag-5'>将</b>状态监测<b class='flag-5'>提升到</b>新<b class='flag-5'>水平</b>

    NVIDIA Dynamo新增对亚马逊云科技服务的支持

    ) 和 AWS Elastic Fabric Adapter (EFA) 的现有集成。此次更新大规模部署大语言模型 (LLM) 的性能、可扩展性和成本效益提升到了新的水平
    的头像 发表于 07-28 14:31 770次阅读
    <b class='flag-5'>NVIDIA</b> Dynamo新增对亚马逊云科技服务的支持

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每个版本都扩展了 NVIDIA BlueField
    的头像 发表于 07-04 14:27 947次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮点解析

    全球各大品牌利用NVIDIA AI技术提升运营效率

    欧莱雅、LVMH 集团和雀巢利用 NVIDIA 加速的智能体 AI 和物理 AI,大幅提升产品设计、营销及物流等方面的运营效率。
    的头像 发表于 06-19 14:36 960次阅读

    第三届NVIDIA DPU黑客松开启报名

    碰撞的绝佳机会。本次竞赛采用开放式主题,参与者通过 NVIDIA DOCA 软件框架构建创新的加速应用程序,充分挖掘 NVIDIA BlueFie
    的头像 发表于 05-27 10:16 741次阅读

    2.5D/3DIC物理验证提升到更高水平

    高密度先进封装 (HDAP) 在各种最终用户应用中的采用率持续攀升。使用中介层(硅或有机)的 2.5D 集成电路 (IC) 设计通常针对高端应用,如军事、航空航天和高性能计算,而类似台积电集成扇出
    的头像 发表于 02-20 11:36 1182次阅读
    <b class='flag-5'>将</b>2.5D/3DIC物理验证<b class='flag-5'>提升到</b>更高<b class='flag-5'>水平</b>

    利用NVIDIA DPF引领DPU加速计算的未来

    越来越多的企业开始采用加速计算,从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架(DPF),该框架提供了基础构建模块来释放 NVIDIA
    的头像 发表于 01-24 09:29 1261次阅读
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> DPF引领<b class='flag-5'>DPU</b><b class='flag-5'>加速</b>云<b class='flag-5'>计算</b>的未来

    NVIDIA BlueField-3 DPU上运行WEKA客户端的实际优势

    WEKA是可扩展软件定义数据平台的先驱,NVIDIA 正在与其合作, WEKA 先进的数据平台解决方案与功能强大的NVIDIA BlueField
    的头像 发表于 01-07 09:43 1045次阅读
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField</b>-3 <b class='flag-5'>DPU</b>上运行WEKA客户端的实际优势

    借助NVIDIA GPU提升鲁班系统CAE软件计算效率

    本案例中鲁班系统高性能 CAE 软件利用 NVIDIA 高性能 GPU,实现复杂产品的快速仿真,加速产品开发和设计迭代,缩短开发周期,提升产品竞争力。
    的头像 发表于 12-27 16:24 1136次阅读

    NVIDIA预测2025年AI行业发展

    NVIDIA 加速计算、数据科学和研究领域专家预测,多模态模型推动行业创新和效率提升
    的头像 发表于 12-18 13:49 1697次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIA和AMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 - NVIDIA GPU:详细列出了支持
    发表于 12-16 14:25