0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU为高性能计算系统提供空前的创新空间

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-09-12 10:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

为了满足更先进的科研需求,全球各地的学术机构都在致力于重新设计代码和算法。英国的面向 E 级计算算法和基础设施优化的 ExCALIBUR (the Exascale Computing ALgorithms and Infrastructures Benefiting UK Research) 项目就是这样一个致力于为英国最重要的研究领域提供新一代高性能模拟软件的科研项目。这些领域涉及到计算高度密集型的应用,例如模拟整个宇宙的演变、了解地震波和引力波、评估海啸以及对物质的基本结构进行建模等。

新型计算方案的出现,包括智能且可编程的互连解决方案如 DPU(数据处理器)等,为研究人员在新的高性能计算系统上提供了空前的创新空间。NVIDIA BlueField DPU 集强大的网络计算引擎、高速网络和丰富的可编程性于一体,为最苛刻的应用提供了软件定义、硬件加速的解决方案。

拥有分布在剑桥大学、莱斯特大学、杜伦大学和爱丁堡大学这四所大学的计算资源的 DiRAC(Distributed Research utilising Advanced Computing)正在参与ExCALIBUR 项目,正在以全新的方式利用 BlueField DPU 丰富的可编程能力助力科学突破。

例如杜伦大学的计算宇宙学院和计算机科学系,他们正在对地震波和引力波的传播进行大规模模拟,该模拟使用动态笛卡尔网格和 ExaHyPE 代码将大部分的计算转化为多任务操作。

在过去几年中,他们付出了大量的精力来标记和识别那些需要与其它网格发生变化的节点或任务同步的关键任务。由于存在大量的低优先级任务,保证整个系统的负载平衡的工作量将会很大。即使达到最佳负载平衡后,一旦域内任何参数发生变化,系统立刻就会随之变得不平衡,要想再次达到最佳负载平衡会非常困难并且会耗费大量的时间或成本。

为了提升系统的应变能力,研究人员必须将轻量任务和闲置任务转移到其它资源上,但是,编排就会变得十分困难,同时通过调节 MPI 运行时来确保在正确的时间用正确的步长来进行计算,也会抢占计算资源。

凭借 BlueField DPU 计算核,杜伦大学可以使用 DPU 作为 MPI 处理引擎来节省计算资源,例如观察和引导任务,以及及时缓存/接受任务等。这项工作延伸了 ExaHyPE 组织内部的研究合作,尤其是 TUM 的 Michael Bader 小组,对于以 CPU 核心的计算任务提出来一个全新的观点,即开始由智能网络承担起数据处理工作。

伦敦大学学院的研究生 James Legg 正在使用 BlueField DPU 通过使用基于任务的调度机制来加速计算代码。James 的研究方向就是使用 BlueField DPU,尤其是其 Arm 处理器子系统来作为任务调度器,由主机处理器来运行计算任务或内核。这颠覆了传统的加速卡运行在内核,由主机来管理所有任务的认知。以前,当调度器和内核都在主机上运行时,它们会强夺处理器资源,使得调度器的设计必须简单。在 BlueField DPU 上,调度器可以轻松拥有几个专用线程,实现了调度处理和与主机运行内核的并行化,并可以执行更复杂的调度操作。另外一项研究是如何在主机处理器完全不参与的情况下,利用 BlueField DPU 上的调度器在任意主机 RAM 之间移动计算数据。

CSD3 (Cambridge Service for Data Driven Discovery)是英国国家研究云,同时也是世界上性能最强大的科研云原生超级计算机之一。CSD3 通过 BlueField DPU 来卸载主机上的安全策略和存储框架等基础设施管理操作,同时提供了应用的加速与隔离,以此实现了 I/O 性能的最大化。这既实现了安全性又得到了裸金属性能,使研究人员能够以全新的方式进行研究。

以上只是研究人员如何利用 DPU 性能和可编程性来探索创新的一部分。为了进一步简化编程,加速创新,NVIDIA 推出了 DOCA SDK,使基础设施开发人员能够使用行业标准的 API,在 BlueField DPU 上快速创建网络、存储、安全、管理以及 AI 和高性能计算(HPC)应用和服务。凭借 DOCA,开发人员可以通过创建高性能、软件定义和云原生的 DPU 加速服务,对未来的超级计算基础设施进行编程。现在,开发人员即可通过注册提前体验。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5513

    浏览量

    109177
  • DPU
    DPU
    +关注

    关注

    0

    文章

    408

    浏览量

    26287

原文标题:DPU 助力英国高性能计算研究人员创新和改进超算基础设施

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ‌SL1590Q 24V/8A高效同步降压转换器:高性能电源方案

    ‌,现代电子设备提供了卓越的电源转换方案。 ‌核心技术创新‌ ‌1. 高效集成与功率优化‌ 内置‌20mΩ和10mΩ低阻抗MOSFET‌,支持‌最大8A输出电流‌ ‌4.5V至24V宽输入电压范围
    发表于 11-04 16:43

    曙光存储支持西湖大学高性能计算中心部署完成全新存储系统

    近日,曙光存储支持西湖大学高性能计算中心部署完成全新存储系统AI研发、科学计算和信息化平台等提供
    的头像 发表于 08-25 11:48 981次阅读

    中科驭数亮相2025 CCF全国高性能计算学术大会

    在昨日开幕的中国计算机学会全国高性能计算学术大会(CCF HPC China 2025)上,中科驭数作为高通量以太网联盟成员参与联盟成果发布。同期举办的世界算力博览会上,中科驭数展出的DPU
    的头像 发表于 08-20 09:39 671次阅读

    知合计算:RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM代表的处理器架构之下,RISC-V在高性能
    的头像 发表于 07-18 14:17 2431次阅读
    知合<b class='flag-5'>计算</b>:RISC-V架构<b class='flag-5'>创新</b>,阿基米德系列剑指<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    高性能计算集群在AI领域的应用前景

    随着人工智能技术的飞速发展,高性能计算集群(HPC)在AI领域的应用前景日益受到关注。HPC提供计算能力与AI的智能分析能力相结合,解决
    的头像 发表于 06-23 13:07 1091次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群在AI领域的应用前景

    OrangePi 5 Plus 全面兼容openKylin操作系统,拓展高性能边缘计算新生态

    openKylin边缘计算开发者提供了更丰富的开源软件选择,推动高性能硬件与开源系统协同创新
    的头像 发表于 06-20 15:11 829次阅读
    OrangePi 5 Plus 全面兼容openKylin操作<b class='flag-5'>系统</b>,拓展<b class='flag-5'>高性能</b>边缘<b class='flag-5'>计算</b>新生态

    使用树莓派构建 Slurm 高性能计算集群:分步指南!

    在这篇文章中,我将分享我尝试使用树莓派构建Slurm高性能计算集群的经历。一段时间前,我开始使用这个集群作为测试平台,来创建一个更大的、支持GPU计算高性能
    的头像 发表于 06-17 16:27 1405次阅读
    使用树莓派构建 Slurm <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群:分步指南!

    佑驾创新获长安汽车量产定点 提供高性能辅助驾驶域控制器产品

    佑驾创新(2431.HK)近日宣布,与长安汽车达成重要合作,获得其旗下新能源自主品牌主力车型的定点项目。佑驾创新作为选定供应商,将为其提供高性能辅助驾驶域控制器产品,共同助推全场景辅助
    的头像 发表于 06-06 09:54 1434次阅读

    创新拉丁美洲大型光储一体化项目提供高性能储能电芯

    近日,中创新拉丁美洲大型光储一体化项目——智利塔拉帕卡Aurora项目提供高性能储能电芯。
    的头像 发表于 05-28 16:30 689次阅读

    高性能计算面临的芯片挑战

    高性能计算(简称HPC)听起来像是科学家在秘密实验室里才会用到的东西,但它实际上是当今世界上最重要的技术之一。从预测天气到研发新药,甚至训练人工智能,高性能计算
    的头像 发表于 05-27 11:08 849次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>面临的芯片挑战

    重磅发布 | 晶丰明源多相数字控制器和DrMOS,NVIDIA显卡提供高性能供电解决方案

    BPD93204,搭配晶丰明源高可靠性 DrMOS BPD80350E使用,AI服务器、显卡、笔记本电脑和高性能计算需求等应用提供了高效、灵活且可靠的电源
    发表于 02-18 15:06 1407次阅读
    重磅发布 | 晶丰明源多相数字控制器和DrMOS,<b class='flag-5'>为</b>NVIDIA显卡<b class='flag-5'>提供</b><b class='flag-5'>高性能</b>供电解决方案

    高性能计算,名副其实的“算力皇冠”

    和推理的高性能计算技术。今天,我们就来聊一聊高性能计算计算机科学的“皇冠”初次涉及高性能
    的头像 发表于 02-08 14:27 1317次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>,名副其实的“算力皇冠”

    FE1.1S的国产替代芯片DPU1.1S 高性能、低功耗4口高速USB2.0HUB控制器芯片 USB拓展坞等应用之选

    DPU1.1S是一款高性能、低功耗4口高速 USB2.0 HUB 控制器,上行端口兼容高速 480MHz和全速12MHz两种模式,4个下行端口兼容高速480MHz、全速12MHz、低速1.5MHz
    发表于 01-24 12:16

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    NEXT的原生页面高性能解决方案,从页面滑动、跳转及应用冷启动等关键环节,开发者提供全面的支持。目前,这些解决方案均已上线OpenHarmony开源社区,可在OpenHarmony三方库中心仓进行搜索,欢迎开发者多多使用和共
    发表于 01-02 18:00

    Triton编译器在高性能计算中的应用

    先进的编译技术,高性能计算提供了强大的支持。 Triton编译器简介 Triton编译器是一种开源的编译器框架,旨在为异构计算环境
    的头像 发表于 12-25 09:11 1614次阅读