0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是 BlueField SuperNIC?

NVIDIA英伟达 来源:未知 2023-11-21 21:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

BlueField SuperNIC 是面向 AI 云数据中心的一种网络加速器,可在 GPU 服务器之间提供可靠、无缝的连接。

wKgaomVctrmAU3JlAADoI3vg6BQ608.jpg

生成式 AI 是快速变化的数字领域的新转折。在此领域的一个突破性创新技术是一个新术语:BlueField SuperNIC

什么是 BlueField SuperNIC?

BlueField SuperNIC 是一类新型网络加速器,旨在为基于以太网的 AI 云上运行的超大规模 AI 工作负载提供强效助力。它为 GPU 到 GPU 通信提供快速的网络连接,使用基于以太网的远程直接内存访问(RoCE)技术实现 400Gb/s 的速度。

BlueField SuperNIC 结合了以下独特属性:

  • 高速数据包重排序可确保数据包的接收和处理顺序与源端发送的顺序相同。这可保持数据流的顺序完整性。

  • 使用实时遥测数据和网络感知算法进行高级拥塞控制,以管理和预防 AI 网络中的拥塞。

  • 输入/输出 (I/O) 路径上的可编程计算,可实现 AI 云数据中心网络基础设施的自定义和可扩展性。

  • 节能高效的半高设计,可在有限的功率预算范围内高效适应 AI 工作负载。

  • 全栈 AI 优化,包括计算、网络、存储、系统软件、通信库和应用框架。

NVIDIA 最近推出了全球首款专为 AI 计算定制的 BlueField SuperNIC,基于 BlueField-3 网络平台。它是 NVIDIA Spectrum-X 平台的一部分,与 Spectrum-4 以太网交换机系统无缝集成。

NVIDIA BlueField-3 SuperNIC 和 Spectrum-4 交换机系统共同构成专为优化 AI 工作负载而设计的加速计算架构。Spectrum-X 始终如一地提供极高网络效率水平,远超传统的以太网环境。

NVIDIA DPU 和网卡产品副总裁 Yael Shenhav 表示:“AI 正在推动新一波的技术创新,BlueField-3 SuperNIC 是其中至关重要的一个齿轮。BlueField SuperNIC 可确保您的 AI 工作负载得到高效和快速的执行,必将成为实现 AI 计算未来的基础组件。”

不断发展的 AI 和网络格局

AI 领域正在经历一场地震级转变,这要归功于生成式 AI 和大语言模型,这些强大的技术释放了新的可能性,使计算机能够处理新任务。

AI 的成功很大程度上依赖于 GPU 加速计算来处理海量数据、训练大型 AI 模型并实现实时推理。这种新的计算能力开辟了新的可能性,但也对以太网云网络提出了挑战。

传统以太网是互联网基础设施的基础技术,旨在提供广泛的兼容性和连接松耦合的应用程序。它的设计并不是为了满足现代 AI 工作负载的苛刻计算需求,这些工作负载涉及紧耦合的并行处理、快速数据传输和独特的通信模式,所有这些都需要优化的网络连接。

传统网络接口卡(NIC)为通用计算、通用数据传输和互操作性而设计,并没有为 AI 工作负载计算强度带来的独特挑战进行优化设计。

标准网卡(NIC)缺乏必要的特性和功能来实现高效的数据传输、低延迟和对 AI 任务至关重要的确定性能。而 BlueField SuperNIC 则专为现代 AI 工作负载而构建。

AI 计算环境中的 BlueField SuperNIC 优势

数据处理器(DPU)提供丰富的高级功能,可提供高吞吐量、低延迟的网络连接等。自 2020 年推出以来,DPU 在云计算领域越来越受欢迎,主要是因为其能够卸载、加速和隔离数据中心基础设施处理。

尽管 DPU 和 BlueField SuperNIC 具有一系列相同的特性和功能,但 BlueField SuperNIC 针对 AI 加速网络进行了独特的优化。下图显示了它们的对比情况:

wKgaomVctrmAXQeYAADCs1figRI395.png

分布式 AI 训练和推理通信流很大程度上取决于网络带宽的可用性。BlueField SuperNIC 以其独特的设计而引人注目,其扩展比 DPU 更有效,每个 GPU 可提供惊人的 400Gb/s 网络带宽。

系统内 GPU 与 BlueField SuperNIC 的 1:1 配比可以显著提高 AI 工作负载效率,从而提高企业的生产力和卓越成果。

BlueField SuperNIC 的唯一目的是加速 AI 云计算的网络。因此,它比 DPU 消耗更少的计算能力,而 DPU 需要大量计算资源来卸载主机 CPU 中的应用程序。

计算需求的降低也转化为功耗的降低,这在包含多达 8 个 BlueField SuperNIC 的系统中尤为重要。

BlueField SuperNIC 的其他显著特性包括其专用的 AI 网络功能。当与为 AI 优化的 NVIDIA Spectrum-4 交换机紧密集成时,它提供了自适应路由、乱序数据包处理和优化的拥塞控制。这些高级功能有助于加速以太网 AI 云环境。

革新 AI 云计算

NVIDIA BlueField-3 SuperNIC 具有多项优势,是 AI 基础设施就绪的关键:

  • AI 工作负载峰值效率:BlueField-3 SuperNIC 专为网络密集型大规模并行计算而构建,是 AI 工作负载的理想选择。它可确保 AI 任务高效运行,消除通信瓶颈。

  • 一致且可预测的性能:在同时处理大量任务的多租户数据中心,BlueField-3 SuperNIC 可确保每个作业和租户的性能都是隔离的、可预测的,并且不受其他网络活动的影响。

  • 安全的多租户云基础设施:安全是重中之重,尤其是在处理敏感信息的数据中心。BlueField-3 SuperNIC 保持极高的安全级别,使多个租户能够共存,同时保持数据和处理隔离。

  • 可扩展的网络基础设施:BlueField-3 SuperNIC 的范围并不受限,它高度灵活,可适应各种其他网络基础设施需求。

  • 广泛的服务器制造商支持:BlueField-3 SuperNIC 无缝适用于大多数企业级服务器,无需额外供电,为数据中心实现高效节能。

扫描下方二维码,阅读白皮书,详细了解 NVIDIA BlueField-3 SuperNIC,包括它们如何跨 NVIDIA 数据中心平台进行集成:新一代网络,迎接新一波 AI 浪潮。

wKgaomVctrmADY7dAAAEHsvLcnE104.png


wKgaomVctrmAQRirAABAFFJlyZc132.gif  

更多精彩内容 利用 NVIDIA DOCA Flow 实现 DPU 加速数据包转向逻辑
使用 NVIDIA BlueField DPU 加速 Suricata IDS / IPS
使用 NVIDIA BlueField-3 DPU 驱动下一波应用程序 wKgaomVctrmABbd7AABAFFJlyZc485.gif    

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。扫描下方海报二维码,立即注册 GTC 大会


原文标题:什么是 BlueField SuperNIC?

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4047

    浏览量

    97789

原文标题:什么是 BlueField SuperNIC?

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索AP53781:高度集成的USB PD DRP控制器

    探索AP53781:高度集成的USB PD DRP控制器 在电子设备飞速发展的今天,USB Type - C接口凭借其强大的功能和便捷性,成为了各类设备的标配。而在USB Type - C的应用中,电源管理和协议控制至关重要。今天,我们就来深入了解一款高度集成的USB PD3.1 DRP控制器——AP53781。 文件下载: AP53781.pdf 一、AP53781简介 AP53781是一款高度集成的USB Type - C PD3.2 Dual - Role Power(DRP)控制器,它支持Extended Power Range(EPR)/ Adjustable Voltage Supply(AVS)高达28V,以及Standard Power Range(S
    的头像 发表于 12-16 20:10 323次阅读

    以“新”为擎 智汇湾区—— CITE 2026蓄势待发

    2025年12月16日,中国电子信息博览会组委会在深圳召开新闻发布会,宣布第十四届中国电子信息博览会(CITE 2026)将于2026年4月9日—11日在深圳会展中心(福田)盛大举办,并向社会各界发布博览会相关筹备情况。本届博览会以“新技术、新产品、新场景”为主题,秉持开放合作理念,着力构建覆盖全球电子信息全产业链的高端展示平台,旨在推动科技创新与产业融合,促进中国电子信息产业高质量发展,全景展现产业前沿成果与未来发展趋势。     深
    的头像 发表于 12-16 18:40 386次阅读
    以“新”为擎 智汇湾区—— CITE 2026蓄势待发

    NVIDIA 收购开源工作负载管理提供商 SchedMD

    NVIDIA 将持续提供 SchedMD 的厂商中立的开源 Slurm 软件,确保其在高性能计算(HPC)和 AI 领域的广泛可用性。 NVIDIA 宣布收购 SchedMD,该公司是 Slurm 软件的主要开发商,Slurm 是一款用于 HPC 和 AI 的开源工作负载管理系统。此次收购旨在帮助强化开源软件生态系统,并推动研究人员、开发者和企业的 AI 创新。 NVIDIA 将继续开发并提供 Slurm 这一厂商中立的开源软件,支持其在各种硬件和软件环境中广泛可用,并得到 HPC 和 AI 社区的支持。 NVIDIA 与 SchedMD 已合作
    的头像 发表于 12-16 18:24 431次阅读

    摩根士丹利发布人形机器人科技25强名单,一家国产传感器公司进入(附全名单)

    近日,全球知名投资机构 摩根士丹利,重磅发布“Humanoid Tech 25(人形机器人科技 25 强)”榜单。 该榜单聚焦全球最具影响力的 25 家机器人及相关技术企业,在“Sensors & Vision”领域,有两家中国公司入榜,分别是禾赛科技、地平线机器人,其中禾赛科技是唯一中国传感器硬件公司入榜,亦是全球唯一入选的激光雷达公司。 此外,进入榜单的公司还包括 英伟达、超威半导体、索尼、三星、安森美、地平线机器人 以及 百度 等多家全球科技与机器人领域
    的头像 发表于 12-16 18:23 667次阅读
    摩根士丹利发布人形机器人科技25强名单,一家国产传感器公司进入(附全名单)

    负债达70亿元,曾经的美国最大激光雷达公司Luminar,破产!

        全球知名的激光雷达开发商Luminar Technologies( LAZR-US )周一晚间宣布,已于美国得州南区破产法院主动申请Chapter 11破产保护,并计划出售其半导体子公司Luminar Semiconductors,以重整资本结构并持续业务运作。   该公司指出,目前已获得91%第一顺位债券持有人与86%第二顺位债券持有人的支持,协助推进其LiDAR业务与Luminar Semiconductors子公司股权的出售流程。 今年10月底的时候,Luminar Technologies( LAZR-US )宣布,由于面临重大财务与业务挑战,公司已正式撤回2
    的头像 发表于 12-16 18:23 668次阅读
    负债达70亿元,曾经的美国最大激光雷达公司Luminar,破产!

    TPS2586x-Q1:汽车USB充电端口的高效解决方案

    TPS2586x-Q1:汽车USB充电端口的高效解决方案 在汽车电子领域,USB充电端口的需求日益增长。为了满足这一需求,德州仪器(TI)推出了TPS2586x-Q1系列产品,这是一款集成式USB充电端口解决方案,专为汽车应用而设计。本文将深入探讨TPS2586x-Q1的特性、应用、设计要点以及相关注意事项,帮助电子工程师更好地理解和应用这款产品。 文件下载: tps25860-q1.pdf 一、TPS2586x-Q1的特性亮点 1. 汽车级标准合规 TPS2586x-Q1符合面向汽车应用的AEC-Q100标准,温度等级1涵盖了
    的头像 发表于 12-16 18:20 390次阅读

    NVIDIA在ISC 2025分享最新超级计算进展

    从 NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示的加速系统突显了全球超级计算和 AI 的进展。
    的头像 发表于 11-25 10:59 557次阅读
    NVIDIA在ISC 2025分享最新超级计算进展

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务为 AI 数据存储、网络和安全带来突破性的加速。
    的头像 发表于 11-03 14:48 647次阅读

    基于NVIDIA BlueField DPU的5G UPF数据面加速方案

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
    的头像 发表于 09-04 11:26 928次阅读

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每个版本都扩展了 NVIDIA BlueField DPU 和 ConnectX SuperNIC 的功能,从而实现了前所未有的 AI
    的头像 发表于 07-04 14:27 983次阅读
    NVIDIA DOCA 3.0版本的亮点解析

    第三届NVIDIA DPU黑客松开启报名

    碰撞的绝佳机会。本次竞赛采用开放式主题,参与者将通过 NVIDIA DOCA 软件框架构建创新的加速应用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、网络、存储和安全等领域的强大潜能。
    的头像 发表于 05-27 10:16 761次阅读

    富士通合并两个SAP系统,简化其在德国的业务结构

    富士通与SNP合作,采用BLUEFIELD™方法,五个月内成功合并两家德国子公司SAP系统,实现快速迁移、高效合作、极短停机时间和业务连续性,增强了数字化转型竞争力。
    的头像 发表于 03-05 17:00 686次阅读

    NVIDIA网络安全AI平台助力保护关键基础设施

    此平台集成了 NVIDIA BlueField 和 Morpheus,并为 Armis、Check Point Software Technologies、CrowdStrike、Deloitte 和 WWT 的下一代网络防御提供支持。
    的头像 发表于 02-19 10:22 947次阅读

    利用NVIDIA DPF引领DPU加速云计算的未来

    越来越多的企业开始采用加速计算,从而满足生成式 AI、5G 电信和主权云的需求。NVIDIA 推出了 DOCA 平台框架(DPF),该框架提供了基础构建模块来释放 NVIDIA BlueField
    的头像 发表于 01-24 09:29 1312次阅读
    利用NVIDIA DPF引领DPU加速云计算的未来

    在NVIDIA BlueField-3 DPU上运行WEKA客户端的实际优势

    WEKA是可扩展软件定义数据平台的先驱,NVIDIA 正在与其合作,将 WEKA 先进的数据平台解决方案与功能强大的NVIDIA BlueField DPU相结合。
    的头像 发表于 01-07 09:43 1082次阅读
    在NVIDIA <b class='flag-5'>BlueField</b>-3 DPU上运行WEKA客户端的实际优势