0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全球最快超级计算机正在发生飞速的变化

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-11-18 09:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着最新一代超级计算机日益与人工智能云计算相结合,衡量这些机器的方式也在发生变化。

从科学模拟、可视化、数据分析再到机器学习,各种现代计算的工作负载正在推动超级计算中心、云服务提供商和企业重新思考他们的计算架构。 仅靠处理器、网络或软件优化已经无法满足研究人员、工程师和数据科学家的最新需求。

数据中心取而代之,成为新的计算单元,因此企业必须关注整个技术堆栈。 全球最强系统的最新排名显示,在新一代超级计算机中,这种使用全栈方法的趋势还在持续。 在本周SC21高性能计算大会上最新发布的TOP500榜单上,NVIDIA技术为355套超级计算机系统提供加速,占榜单的70%以上,而新增系统中90% 以上都采用了NVIDIA 的技术。

对比6月份发布的TOP500榜单上342个系统(占榜单68%)使用NVIDIA技术,增长趋势明显。 NVIDIA在全球最节能系统Green500榜单上也继续保持领先优势,占据了榜单排名前25名系统中的23套,与6月份持平。平均来看,采用NVIDIA GPU的系统能耗效率比非GPU系统高3.5倍。

来自微软的GPU加速Azure超级计算机在榜单上排名第十。这是基于云的系统首次跻身前10名,新一代云原生系统就此崭露头角。 人工智能正带来一场科学计算的革命。近年来,研究高性能计算和机器学习的论文数量激增,从2018年的约600篇增长到2020年的近5000篇。

包括HPL-AI和MLPerf HPC在内的新基准也强调了高性能计算和AI工作负载的持续融合。 作为一个融合了高性能计算和人工智能工作负载的新基准,HPL-AI使用了深度学习和许多科学与商业工作的基础——混合精度计算,同时还提供高性能计算基准传统的标准标尺——双精度计算的高度准确性。 MLPerf HPC基准适用于通过人工智能实现超级计算机模拟加速和增强的计算方式,主要被用来测试高性能计算中心天体物理学(Cosmoflow)、天气(Deepcam)和分子动力学(Opencatalyst)三大关键工作负载的性能表现。 NVIDIA通过GPU加速处理、智能网络、GPU优化应用程序和支持AI和高性能计算融合的库来解决整个堆栈的问题。这一方法提升了工作负载的性能表现,并推动了科学突破。 让我们来具体看一看NVIDIA是如何助力超级计算机实现性能提升的。

加速计

GPU的并行处理能力再加上超过2500个GPU优化应用程序,在多数情况下可以让用户把高性能计算任务的时间从几周减少到几个小时。

NVIDIA一直在优化CUDA-X库和GPU加速应用程序,所以用户如果发现自己的GPU架构性能突然有了提升也很正常。 因此,应用范围最广的科学应用程序(我们称之为“黄金套件”)的性能在过去6年里提高了16倍,而且还在不断提升。

为帮助用户快速提升性能,NVIDIA通过NGC目录中的容器提供最新版本的人工智能和高性能计算软件。用户只需在数据中心或云端的超级计算机上拖拽并运行应用程序即可。

高性能计算与人工智能融合

人工智能在高性能计算中的应用能帮助研究人员加快模拟速度,同时保持传统模拟方法的准确性。 为此,越来越多的研究人员开始利用人工智能来加快研究的速度,比如今年超算领域最有声望的戈登·贝尔奖(GordonBell prize)决赛的四组晋级团队。各大企业正在竞相建造E级人工智能计算机,以支持这种融合高性能计算和人工智能的新模式。 一些相对较新的基准(如HPL-AI和MLPerf HPC)也印证了这一趋势,强调了高性能计算和AI工作负载的持续融合。 为推动这一趋势,上周NVIDIA推出了一系列用于高性能计算的先进的新的库和软件开发工具套件。 图是现代数据科学中的一个关键数据结构。通过一个名为深度图库(DGL)的新型Python包,用户现在可以把图投影到深度神经网络框架中。

NVIDIA Modulus构建并训练了一个内嵌物理信息的机器学习模型,可以用来学习并遵循物理定律。 NVIDIA推出了三个新库:

ReOpt – 可提高规模高达10万亿美元的物流行业的运营效率。

cuQuantum – 可加速量子计算研究。

cuNumeric – 为Python社区的科学家、数据科学家、机器学习和人工智能研究人员加速NumPy。

NVIDIA的虚拟世界模拟和3D工作流协作平台NVIDIA Omniverse负责把一切整合到一起。

Omniverse可用来模拟仓库、工厂、物理和生物系统、5G边缘、机器人自动驾驶汽车甚至是虚拟形象的数字孪生。

NVIDIA上周宣布,将利用Omniverse构建一台名为Earth-2的超级计算机,通过创建一个数字孪生地球来预测气候变化。

云原生超级计算

随着超级计算机在数据分析、人工智能、模拟和可视化方面承担越来越多的工作负载,CPU不得不在大型复杂的系统上支持更多的通信任务。 DPU(数据处理器)可以卸载多种操作,有效减轻这一压力。 作为一个完全集成的片上数据中心平台,NVIDIA BlueField DPU可以卸载和管理数据中心的基础设施任务,释放主机的处理器资源,从而实现更强的安全性和更高效的超级计算编排工作。 与NVIDIA Quantum InfiniBand平台相结合,该架构可提供最佳裸机性能,同时原生支持多节点租户隔离。

NVIDIA的Quantum InfiniBand平台提供可预测的裸机性能隔离。并且采用零信任安全防护,因而这些新系统也更加安全。

BlueField DPU将用户应用与基础设施任务隔离开来。最新的BlueField软件平台NVIDIA DOCA 1.2支持下一代分布式防火墙和更广泛的线速数据加密。而NVIDIA Morpheus则会假设入侵者已经进入数据中心,将利用基于深度学习的数据科学来实时检测入侵者的活动。 新的网络技术则会加速上述这些趋势场景。 上周NVIDIA还发布了NVIDIA Quantum-2。这是一个400Gbps InfiniBand平台,由Quantum-2交换机、ConnectX-7网卡、BlueField-3DPU以及用于新网络架构的软件组成。 NVIDIA Quantum-2提供了裸机高性能和安全多租户优势,可以让下一代超级计算机实现安全性、云原生以及更高的效率。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7763

    浏览量

    92666
  • 网卡
    +关注

    关注

    4

    文章

    334

    浏览量

    28712
  • 交换机
    +关注

    关注

    23

    文章

    2868

    浏览量

    103902
  • 数据中心
    +关注

    关注

    16

    文章

    5515

    浏览量

    74628

原文标题:SC21 | 全球最快超级计算机正飞速发生变化

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用NVIDIA技术驱动的超级计算机助力开放科学研究

    五个备受瞩目的 HPC 奖决赛入围项目凭借 Alps、JUPITER 和 Perlmutter 超级计算机的支持在气候建模、流体模拟等领域取得了重大突破。
    的头像 发表于 11-25 11:17 410次阅读

    快450000000倍!超导量子计算机“天衍-287”建成

    平台诞生,处理特定问题的速度较当前最快超级计算机快4.5亿倍,成为全球量子计算实用化进程中的关键里程碑。     “天衍-287”的核心竞争
    的头像 发表于 11-18 08:40 8068次阅读
    快450000000倍!超导量子<b class='flag-5'>计算机</b>“天衍-287”建成

    奥士康召开DGX Spark AI超级计算机项目表彰大会

    2025年9月22日,奥士康科技股份有限公司隆重召开DGXSparkAI超级计算机项目表彰大会,以表彰在客户开发、产品研发、工程设计和批量生产等方面作出突出贡献的核心团队。
    的头像 发表于 09-24 10:51 590次阅读

    【作品合集】赛昉科技VisionFive 2单板计算机开发板测评

    赛昉科技VisionFive 2单板计算机开发板测评作品合集 产品介绍: 昉·星光 2是全球首款集成了3D GPU的高性能量产RISC-V单板计算机,搭载昉·惊鸿-7110(型号:JH-7110
    发表于 09-04 09:08

    NVIDIA助力AI超级计算机Isambard-AI投入使用

    英国布里斯托大学的超级计算机 Isambard-AI 采用 NVIDIA Grace Hopper 超级芯片,其 AI 算力达到了 21 ExaFLOPS,不仅是英国最快的系统,同时也
    的头像 发表于 07-28 15:07 911次阅读

    工业计算机与商用计算机的区别有哪些

    工业计算机是一种专为工厂和工业环境设计的计算系统,具有高可靠性和稳定性,能够应对恶劣环境下的自动化、制造和机器人操作。其特点包括无风扇散热技术、无电缆连接和防尘防水设计,使其在各种工业自动化场景中
    的头像 发表于 07-10 16:36 509次阅读
    工业<b class='flag-5'>计算机</b>与商用<b class='flag-5'>计算机</b>的区别有哪些

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    ,研究人员用个人电脑构建了强大的集群,甚至改造游戏显卡,把它们用于科学研究。 当今的高性能计算系统专为高速计算而设计,其中许多都采用了 NVIDIA 加速计算技术。在 ISC 2025 大会上揭晓的最新
    的头像 发表于 06-26 19:39 964次阅读
    NVIDIA驱动的现代<b class='flag-5'>超级</b><b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展

    Blue Lion超级计算机将在NVIDIA Vera Rubin上运行

    德国莱布尼茨超算中心(LRZ)将迎来全新超级计算机 Blue Lion,其算力比该中心现有的 SuperMUC-NG 高性能计算机提升了约 30 倍。这台新的超级
    的头像 发表于 06-12 15:39 818次阅读

    NVIDIA技术赋能欧洲最快超级计算机JUPITER

    NVIDIA 宣布,搭载 NVIDIA Grace Hopper 平台的 JUPITER 超级计算机成为欧洲最快超级计算机,其运行 HPC
    的头像 发表于 06-12 15:33 1033次阅读

    NVIDIA助力全球最大量子研究超级计算机

    NVIDIA 宣布将开设量子-AI 技术商业应用全球研发中心(G-QuAT),该中心部署了全球最大量子计算研究专用超级计算机 ABCI-Q。
    的头像 发表于 05-22 09:44 668次阅读

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算机

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technologies、HP
    发表于 03-19 09:59 502次阅读
       NVIDIA 宣布推出 DGX Spark 个人 AI <b class='flag-5'>计算机</b>

    超级计算与 HPC 之间的界限日趋模糊

    本文由半导体产业纵横(ID:ICVIEWS)编译自semiengineering由于人工智能和分解而加速的性能改进正在推动计算前沿的重大变革。由于人工智能的普及,超级计算机和高性能
    的头像 发表于 03-17 10:33 819次阅读
    <b class='flag-5'>超级</b><b class='flag-5'>计算</b>与 HPC 之间的界限日趋模糊

    NVIDIA推出个人AI超级计算机Project DIGITS

    NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS,全球的 AI 研究员、数据科学家和学生都可获取 NVIDIA Grace Blackwell 平台的强大功能。
    的头像 发表于 01-08 11:03 1159次阅读

    NVIDIA发布高性价比生成式AI超级计算机

    NVIDIA近日推出了一款全新的生成式AI超级计算机——Jetson Orin Nano Super开发者套件,这款超级计算机不仅体积小巧,而且性价比极高,为商业AI开发者、科技爱好者
    的头像 发表于 12-24 10:44 1005次阅读

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的
    的头像 发表于 12-17 10:19 932次阅读