0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA推出BlueField-4 STX存储架构

NVIDIA英伟达 来源:NVIDIA英伟达 2026-03-18 14:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新闻摘要:

全新 NVIDIA STX 参考架构可提升高达 5 倍的 Token 吞吐量,能效提升高达 4 倍,数据摄取速度提升 2 倍。

率先将 STX 用于上下文记忆存储的厂商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure(OCI)和 Vultr。

多家存储厂商与制造合作伙伴正在基于 NVIDIA 模块化参考设计来构建基础设施,以推进代理式 AI 的发展,包括 AIC、Cloudian、DDN、戴尔科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、Supermicro、Quanta Cloud Technology(QCT)、VAST Data 和 WEKA。

加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、云计算及 AI 服务商轻松部署加速存储基础设施,以满足代理式 AI 所需的长上下文推理能力。

传统数据中心提供大容量通用存储,但难以满足与跨多步骤、多工具和多轮会话的 AI 智能体无缝交互所需的响应速度。代理式 AI 需要实时访问数据和上下文工作记忆,以确保对话和多任务的快捷性和连贯性。随着上下文规模的不断扩大,传统存储和数据路径可能会降低 AI 推理的速度,并降低 GPU 利用率。

NVIDIA STX助力存储厂商构建数据就近并可大规模访问的基础设施,从而使代理式 AI 工厂能够在推理、训练和分析方面提供更高的吞吐量和响应速度。

首个机架级部署方案集成了全新的NVIDIA CMX™ 上下文记忆存储平台。通过引入高性能的上下文层来扩展 GPU 内存,从而实现可扩展的推理和代理式系统。与传统存储相比,每秒可处理的 Token 提升高达 5 倍。

NVIDIA 创始人兼首席执行官黄仁勋表示:“代理式 AI 正在重新定义软件的能力,必须重塑其背后的计算基础设施才能跟上这一步伐。能够基于海量上下文进行推理并持续学习的 AI 系统,需要新的存储方案。NVIDIA STX 重新定义了存储堆栈,为 AI 原生基础设施提供了模块化基础,确保 AI 工厂始终保持峰值性能高效运行。”

STX 由 NVIDIA Vera Rubin 平台提供加速,集成了针对存储进行优化的全新NVIDIA BlueField-4 处理器。该处理器将NVIDIA Vera CPU、NVIDIA ConnectX® -9 SuperNIC相结合,并配合NVIDIA Spectrum-X™ 以太网网络、NVIDIA DOCA™以及NVIDIA AI Enterprise软件共同运行。

与传统 CPU 架构相比,STX 架构的能效提升高达 4 倍,从而实现高性能存储,并且在处理企业级 AI 数据时,每秒可处理的内存页数提升 2 倍。

众多存储厂商合作伙伴正在基于 NVIDIA STX 共同设计新一代 AI 基础架构,包括 Cloudian、DDN、戴尔科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、VAST Data 和 WEKA。

正在构建基于 STX 系统的制造合作伙伴包括 AIC、Supermicro 和 Quanta Cloud Technology (QCT)。

计划采用 STX 进行上下文记忆存储的主要 AI 实验室和云服务提供商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、OCI 和 Vultr。

基于 STX 的平台将于今年下半年由合作伙伴推出。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20325

    浏览量

    254692
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • 存储
    +关注

    关注

    13

    文章

    4881

    浏览量

    90251

原文标题:GTC2026 | NVIDIA 推出 BlueField-4 STX 存储架构,获业界广泛采用

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Supermicro率先发布NVIDIA BlueField-4 STX存储服务器,提升AI推理性能

      Supermicro凭借其基于NVIDIA STX AI存储参考架构打造的上下文内存(CMX)存储服务器,进一步彰显其行业领先地位。
    的头像 发表于 03-19 15:46 164次阅读
    Supermicro率先发布<b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField-4</b> <b class='flag-5'>STX</b><b class='flag-5'>存储</b>服务器,提升AI推理性能

    每块GPU对应16TB SSD,英伟达KV缓存虹吸高性能TLC SSD

    作者:黄晶晶   不久前,英伟达宣布其Vera Rubin平台将采用搭载BlueField-4芯片的ICMS架构,通过卸载KV Cache突破内存瓶颈、提升AI推理性能。该架构单台服务器每个GPU需
    的头像 发表于 02-10 11:12 1.4w次阅读

    梅赛德斯奔驰推出基于NVIDIA DRIVE AV软件的全新S级车型

    梅赛德斯-奔驰在其 140 周年之际,推出专为 AI 时代打造的全新 S 级车型。它将汽车安全与 NVIDIA 先进的自动驾驶平台相结合,旨在打造一个值得信赖的 L4 级自动驾驶就绪架构
    的头像 发表于 02-03 14:14 1400次阅读

    NVIDIA BlueField-4为推理上下文记忆存储平台提供强大支持

    随着代理式 AI 工作流将上下文窗口扩展到数百万个 token,并将模型规模扩展到数百万亿个参数,AI 原生企业正面临着越来越多的扩展挑战。这些系统目前依赖于智能体长期记忆来存储跨多轮、工具和会话持续保存的上下文,以便智能体能够基于先前的推理进行构建,而不是每次请求都从头开始。
    的头像 发表于 02-02 10:29 1258次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField-4</b>为推理上下文记忆<b class='flag-5'>存储</b>平台提供强大支持

    NVIDIA BlueField-4数据处理器重塑新型AI原生存储基础设施

    NVIDIA 宣布,NVIDIA BlueField®-4 数据处理器作为全栈 NVIDIA BlueF
    的头像 发表于 01-09 10:33 618次阅读

    NVIDIA在CES 2026发布新一代Rubin AI平台

    通过跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机的极致协同设计,大幅缩短训练时间,降低推理 token 生成成本。
    的头像 发表于 01-09 10:23 781次阅读

    NVIDIA 推出 Nemotron 3 系列开放模型

    的吞吐量比 Nemotron 2 Nano 高 4 倍,并通过突破性的异构混合专家 (Hybrid Mixture-of-Experts) 架构,在大规模多智能体系统中实现了领先的每秒生成
    的头像 发表于 12-16 09:27 795次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>推出</b> Nemotron 3 系列开放模型

    NVIDIA在ISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示的加速系统突显了全球超级计算和 AI 的进展。
    的头像 发表于 11-25 10:59 1072次阅读
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超级计算进展

    NVIDIA推出NVQLink高速互连架构

    NVIDIA 推出 NVIDIA NVQLink,这是一种开放式系统架构,可将 GPU 计算的极致性能与量子处理器紧密结合,以构建加速的量子超级计算机。
    的头像 发表于 11-03 14:53 874次阅读

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务为 A
    的头像 发表于 11-03 14:48 1197次阅读

    曙光存储推出面向金融的可信AI存储

    近日,曙光存储推出面向金融的可信AI存储,助力金融行业高效、安全、稳定地使用关键业务敏感数据。该方案基于全球领先的集中式全闪存储FlashNexus,构建“真存算分离”
    的头像 发表于 10-23 09:24 765次阅读

    基于NVIDIA BlueField DPU的5G UPF数据面加速方案

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
    的头像 发表于 09-04 11:26 1372次阅读

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每个版本都扩展了 NVIDIA BlueField
    的头像 发表于 07-04 14:27 1369次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮点解析

    第三届NVIDIA DPU黑客松开启报名

    碰撞的绝佳机会。本次竞赛采用开放式主题,参与者将通过 NVIDIA DOCA 软件框架构建创新的加速应用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、网络、
    的头像 发表于 05-27 10:16 997次阅读

    NVIDIA推出NVLink Fusion技术

    NVIDIA 发布 NVIDIA NVLink Fusion,这款全新芯片将助力行业用户通过全球领先且广泛采用的计算互连架构 —— NVIDIA NVLink 打造的强健合作伙伴生态系
    的头像 发表于 05-22 09:59 1004次阅读