0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU为高性能计算系统提供空前的创新空间

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-09-12 10:17 次阅读

为了满足更先进的科研需求,全球各地的学术机构都在致力于重新设计代码和算法。英国的面向 E 级计算算法和基础设施优化的 ExCALIBUR (the Exascale Computing ALgorithms and Infrastructures Benefiting UK Research) 项目就是这样一个致力于为英国最重要的研究领域提供新一代高性能模拟软件的科研项目。这些领域涉及到计算高度密集型的应用,例如模拟整个宇宙的演变、了解地震波和引力波、评估海啸以及对物质的基本结构进行建模等。

新型计算方案的出现,包括智能且可编程的互连解决方案如 DPU(数据处理器)等,为研究人员在新的高性能计算系统上提供了空前的创新空间。NVIDIA BlueField DPU 集强大的网络计算引擎、高速网络和丰富的可编程性于一体,为最苛刻的应用提供了软件定义、硬件加速的解决方案。

拥有分布在剑桥大学、莱斯特大学、杜伦大学和爱丁堡大学这四所大学的计算资源的 DiRAC(Distributed Research utilising Advanced Computing)正在参与ExCALIBUR 项目,正在以全新的方式利用 BlueField DPU 丰富的可编程能力助力科学突破。

例如杜伦大学的计算宇宙学院和计算机科学系,他们正在对地震波和引力波的传播进行大规模模拟,该模拟使用动态笛卡尔网格和 ExaHyPE 代码将大部分的计算转化为多任务操作。

在过去几年中,他们付出了大量的精力来标记和识别那些需要与其它网格发生变化的节点或任务同步的关键任务。由于存在大量的低优先级任务,保证整个系统的负载平衡的工作量将会很大。即使达到最佳负载平衡后,一旦域内任何参数发生变化,系统立刻就会随之变得不平衡,要想再次达到最佳负载平衡会非常困难并且会耗费大量的时间或成本。

为了提升系统的应变能力,研究人员必须将轻量任务和闲置任务转移到其它资源上,但是,编排就会变得十分困难,同时通过调节 MPI 运行时来确保在正确的时间用正确的步长来进行计算,也会抢占计算资源。

凭借 BlueField DPU 计算核,杜伦大学可以使用 DPU 作为 MPI 处理引擎来节省计算资源,例如观察和引导任务,以及及时缓存/接受任务等。这项工作延伸了 ExaHyPE 组织内部的研究合作,尤其是 TUM 的 Michael Bader 小组,对于以 CPU 核心的计算任务提出来一个全新的观点,即开始由智能网络承担起数据处理工作。

伦敦大学学院的研究生 James Legg 正在使用 BlueField DPU 通过使用基于任务的调度机制来加速计算代码。James 的研究方向就是使用 BlueField DPU,尤其是其 Arm 处理器子系统来作为任务调度器,由主机处理器来运行计算任务或内核。这颠覆了传统的加速卡运行在内核,由主机来管理所有任务的认知。以前,当调度器和内核都在主机上运行时,它们会强夺处理器资源,使得调度器的设计必须简单。在 BlueField DPU 上,调度器可以轻松拥有几个专用线程,实现了调度处理和与主机运行内核的并行化,并可以执行更复杂的调度操作。另外一项研究是如何在主机处理器完全不参与的情况下,利用 BlueField DPU 上的调度器在任意主机 RAM 之间移动计算数据。

CSD3 (Cambridge Service for Data Driven Discovery)是英国国家研究云,同时也是世界上性能最强大的科研云原生超级计算机之一。CSD3 通过 BlueField DPU 来卸载主机上的安全策略和存储框架等基础设施管理操作,同时提供了应用的加速与隔离,以此实现了 I/O 性能的最大化。这既实现了安全性又得到了裸金属性能,使研究人员能够以全新的方式进行研究。

以上只是研究人员如何利用 DPU 性能和可编程性来探索创新的一部分。为了进一步简化编程,加速创新,NVIDIA 推出了 DOCA SDK,使基础设施开发人员能够使用行业标准的 API,在 BlueField DPU 上快速创建网络、存储、安全、管理以及 AI 和高性能计算(HPC)应用和服务。凭借 DOCA,开发人员可以通过创建高性能、软件定义和云原生的 DPU 加速服务,对未来的超级计算基础设施进行编程。现在,开发人员即可通过注册提前体验。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4541

    浏览量

    101479
  • DPU
    DPU
    +关注

    关注

    0

    文章

    287

    浏览量

    23962

原文标题:DPU 助力英国高性能计算研究人员创新和改进超算基础设施

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    ,国内国外两股部队都在朝着超大规模计算部署。而专用处理器在大规模处理上带来的经济和效率优势是通用计算不可比拟的。DPU在云计算高性能,高功
    发表于 12-24 10:54

    《数据处理器:DPU编程入门》读书笔记

    首先感谢电子发烧友论坛提供的试读机会。 第一周先阅读了DPU的技术发展背景,了解到DPU是结合了高性能及软件可编程的多核CPU、高性能网络接
    发表于 12-21 10:47

    《数据处理器:DPU编程入门》+初步熟悉这本书的结构和主要内容

    ,并提高系统的响应速度和隐私保护。 4. 高性能计算DPU可以在高性能计算领域中使用,例如科学
    发表于 12-08 18:03

    异构众核系统高性能计算架构

    随着计算机技术的发展,单核处理器已经难以满足高性能计算的需求,众核处理器成为了一种有效的解决方案。众核处理器是指在一个芯片上集成多个处理器核心,通过并行计算
    的头像 发表于 11-30 08:27 401次阅读
    异构众核<b class='flag-5'>系统</b><b class='flag-5'>高性能</b><b class='flag-5'>计算</b>架构

    什么是DPU

    DPU则进行数据处理。” 什么是DPU? 数据处理器 基于行业标准,高性能及软件可编程的多核CPU 高性能网络接口 灵活、可编程的加速引擎 DPU
    发表于 11-03 10:55

    【书籍评测活动NO.23】数据处理器:DPU编程入门

    开启自己的开发之旅。 DPU + GPU + CPU “3U”一体的新数据中心架构是计算的未来 基于DPU可以实现软件定义、硬件加速的数据中心基础设施,极具灵活性、扩展性、可编程性,支持极致的
    发表于 10-24 15:21

    DPU企业云脉芯联获浪潮信息投资入股

    云脉芯联是主要云计算现场metafusion系列dpu产品和主力rdma高性能网络的metaconnect系列智能局域网先后推出了产品,数据中心云计算、智能
    的头像 发表于 09-19 14:55 524次阅读
    <b class='flag-5'>DPU</b>企业云脉芯联获浪潮信息投资入股

    AMD为合作伙伴的数据中心应用创新提供更宽广的空间

    ,并发表主题为“新算力 新格局 新未来”的精彩演讲。 刘宏兵表示,“AMD通过积极的技术创新,为数据中心从核心高性能计算,智能网络,AI 和边缘计算
    的头像 发表于 09-15 10:09 379次阅读

    构筑下一代数据中心互联的“超级高速公路”,中科驭数正式发布KPU FLEXFLOW®-2100R RDMA加速DPU卡!

    ,旨在面向高速网络、高性能存储搭建起算力集群内部通信的"超级高速公路” , 助力高性能计算领域创新 。 ▲  详解 KPU FLEXFLOW-2100R RDMA 网络加速
    的头像 发表于 09-07 19:05 341次阅读
    构筑下一代数据中心互联的“超级高速公路”,中科驭数正式发布KPU FLEXFLOW®-2100R RDMA加速<b class='flag-5'>DPU</b>卡!

    中科驭数携DPU系列创新产品亮相2023服贸会,解锁高性能计算新可能!

    ” 携 最新数据处理器 DPU 亮相,展示了多项创新性的 DPU 加速卡产品和解决 方案,以技术创新引领算力底座变革。 ■  硬核DPU
    的头像 发表于 09-06 19:15 380次阅读
    中科驭数携<b class='flag-5'>DPU</b>系列<b class='flag-5'>创新</b>产品亮相2023服贸会,解锁<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>新可能!

    2023 CCF全国高性能计算学术年会:中科驭数以DPU先进计算技术,夯实下一代金融IT基础设施底座

    由中国计算机学会主办的第 19届CCF全国高性能计算学术年会(CCF HPC China 2023)于8月23日至26日在青岛成功召开。在“高性能金融
    的头像 发表于 08-28 18:55 351次阅读
    2023 CCF全国<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>学术年会:中科驭数以<b class='flag-5'>DPU</b>先进<b class='flag-5'>计算</b>技术,夯实下一代金融IT基础设施底座

    面向高性能和可扩展计算系统的IBM b-type网络

    电子发烧友网站提供《面向高性能和可扩展计算系统的IBM b-type网络.pdf》资料免费下载
    发表于 08-28 14:39 0次下载
    面向<b class='flag-5'>高性能</b>和可扩展<b class='flag-5'>计算</b><b class='flag-5'>系统</b>的IBM b-type网络

    智能网卡简介及其在高性能计算中的作用

    高性能。SmartNIC 通过提供高级网络功能以及专门的硬件加速,在 HPC 应用中表现出色。提高人工智能系统的效率当前的机器学习趋势涉及分布式学习,它通常采用并行数据训练,其中每个节点在不同的数据
    发表于 07-28 10:10

    易飞扬携高性能计算互连硬件和液冷互连解决出席德国ISC高性能计算大会

    [中国,深圳,2023年5月6日]5月21-25日,全球领先的高性能计算和超级计算领域的国际会议之一的ISC高性能计算大会(ISC High
    的头像 发表于 05-06 18:21 419次阅读

    中科驭数携手DaoCloud道客开拓DPU在云原生计算场景的应用

    近日,中科驭数与DaoCloud 道客正式达成战略合作。本次合作依托中科驭数DPU技术优势与DaoCloud 道客云原生技术面向智算、超算、金融交易、电信等高性能云原生应用场景和行业领域,共同
    的头像 发表于 04-20 09:31 847次阅读