新闻摘要:
全新 NVIDIA STX 参考架构可提升高达 5 倍的 Token 吞吐量,能效提升高达 4 倍,数据摄取速度提升 2 倍。
率先将 STX 用于上下文记忆存储的厂商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure(OCI)和 Vultr。
多家存储厂商与制造合作伙伴正在基于 NVIDIA 模块化参考设计来构建基础设施,以推进代理式 AI 的发展,包括 AIC、Cloudian、DDN、戴尔科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、Supermicro、Quanta Cloud Technology(QCT)、VAST Data 和 WEKA。
加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、云计算及 AI 服务商轻松部署加速存储基础设施,以满足代理式 AI 所需的长上下文推理能力。
传统数据中心提供大容量通用存储,但难以满足与跨多步骤、多工具和多轮会话的 AI 智能体无缝交互所需的响应速度。代理式 AI 需要实时访问数据和上下文工作记忆,以确保对话和多任务的快捷性和连贯性。随着上下文规模的不断扩大,传统存储和数据路径可能会降低 AI 推理的速度,并降低 GPU 利用率。
NVIDIA STX助力存储厂商构建数据就近并可大规模访问的基础设施,从而使代理式 AI 工厂能够在推理、训练和分析方面提供更高的吞吐量和响应速度。
首个机架级部署方案集成了全新的NVIDIA CMX™ 上下文记忆存储平台。通过引入高性能的上下文层来扩展 GPU 内存,从而实现可扩展的推理和代理式系统。与传统存储相比,每秒可处理的 Token 提升高达 5 倍。
NVIDIA 创始人兼首席执行官黄仁勋表示:“代理式 AI 正在重新定义软件的能力,必须重塑其背后的计算基础设施才能跟上这一步伐。能够基于海量上下文进行推理并持续学习的 AI 系统,需要新的存储方案。NVIDIA STX 重新定义了存储堆栈,为 AI 原生基础设施提供了模块化基础,确保 AI 工厂始终保持峰值性能高效运行。”
STX 由 NVIDIA Vera Rubin 平台提供加速,集成了针对存储进行优化的全新NVIDIA BlueField-4 处理器。该处理器将NVIDIA Vera CPU、NVIDIA ConnectX® -9 SuperNIC相结合,并配合NVIDIA Spectrum-X™ 以太网网络、NVIDIA DOCA™以及NVIDIA AI Enterprise软件共同运行。
与传统 CPU 架构相比,STX 架构的能效提升高达 4 倍,从而实现高性能存储,并且在处理企业级 AI 数据时,每秒可处理的内存页数提升 2 倍。
众多存储厂商合作伙伴正在基于 NVIDIA STX 共同设计新一代 AI 基础架构,包括 Cloudian、DDN、戴尔科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、VAST Data 和 WEKA。
正在构建基于 STX 系统的制造合作伙伴包括 AIC、Supermicro 和 Quanta Cloud Technology (QCT)。
计划采用 STX 进行上下文记忆存储的主要 AI 实验室和云服务提供商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、OCI 和 Vultr。
基于 STX 的平台将于今年下半年由合作伙伴推出。
-
处理器
+关注
关注
68文章
20325浏览量
254692 -
NVIDIA
+关注
关注
14文章
5682浏览量
110095 -
存储
+关注
关注
13文章
4881浏览量
90251
原文标题:GTC2026 | NVIDIA 推出 BlueField-4 STX 存储架构,获业界广泛采用
文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
Supermicro率先发布NVIDIA BlueField-4 STX存储服务器,提升AI推理性能
每块GPU对应16TB SSD,英伟达KV缓存虹吸高性能TLC SSD
梅赛德斯奔驰推出基于NVIDIA DRIVE AV软件的全新S级车型
NVIDIA BlueField-4为推理上下文记忆存储平台提供强大支持
NVIDIA BlueField-4数据处理器重塑新型AI原生存储基础设施
NVIDIA在CES 2026发布新一代Rubin AI平台
NVIDIA 推出 Nemotron 3 系列开放模型
NVIDIA在ISC 2025分享最新超级计算进展
NVIDIA推出NVQLink高速互连架构
NVIDIA推出全新BlueField-4 DPU
曙光存储推出面向金融的可信AI存储
基于NVIDIA BlueField DPU的5G UPF数据面加速方案
NVIDIA DOCA 3.0版本的亮点解析
NVIDIA推出BlueField-4 STX存储架构
评论