0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA BlueField-4数据处理器重塑新型AI原生存储基础设施

NVIDIA英伟达 来源:NVIDIA英伟达 2026-01-09 10:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

新闻摘要:

NVIDIA BlueField-4 为 NVIDIA 推理上下文记忆存储平台提供支持,这是一种专为超大规模推理而设计的新型 AI 原生存储基础设施,旨在加速和扩展代理式 AI。

全新存储处理器平台专为长上下文处理的代理式 AI 系统而构建,并具备超快速的长短期记忆功能。

推理上下文记忆存储平台可扩展 AI 智能体的长期记忆,并实现了机架级 AI 系统集群之间的高带宽上下文共享,从而将每秒处理的 token 数量和能效提升高达 5 倍。

凭借 NVIDIA Spectrum-X 以太网,多轮 AI 智能体的扩展上下文记忆可提高响应速度、提高每个 GPU 的吞吐量,并支持智能体推理的高效扩展。

拉斯维加斯 —— CES —— 太平洋时间 2026 年 1 月 5 日—NVIDIA 宣布,NVIDIA BlueField®-4 数据处理器作为全栈NVIDIA BlueField平台的一部分,为 NVIDIA 推理上下文记忆存储平台提供支持,这是一种新型 AI 原生存储基础设施,专为 AI 新前沿而打造。

随着 AI 模型扩展到数万亿参数和多步骤推理,它们会生成大量的上下文数据,并以键值 (KV) 缓存表示,这对准确性、用户体验和连续性至关重要。

键值 (KV) 缓存无法长期存储在 GPU 上,因为这会成为多智能体系统中实时推理的瓶颈。AI 原生应用需要一种新型的可扩展基础设施来存储和共享这些数据。

NVIDIA 推理上下文记忆存储平台通过扩展 GPU 内存容量,为上下文记忆提供基础设施,实现跨节点的高速共享,与传统存储相比,可将每秒处理的 token 数量和能效提升高达 5 倍。

NVIDIA 创始人兼首席执行官黄仁勋表示:“AI 正在彻底改变整个计算堆栈,现在,存储也加入了这场变革。AI 不再是那种单次交互的聊天机器人,而是能够理解物理世界、进行长期推理、基于事实、使用工具完成实际工作并兼具短期和长期记忆的智能协作伙伴。借助 BlueField-4,NVIDIA 及其软硬件合作伙伴正在为 AI 新前沿重塑存储堆栈。”

NVIDIA 推理上下文记忆存储平台可提升键值 (KV) 缓存容量,并加速机架级 AI 系统集群之间的上下文共享,同时为多轮 AI 智能体的上下文持久地提高响应速度和 AI 工厂吞吐量,并支持长上下文、多智能体推理的高效扩展。

基于 NVIDIA BlueField-4 提供支持的平台,主要功能包括:

NVIDIA Rubin集群级键值 (KV) 缓存容量,可提供长上下文、多轮智能体推理所需的规模和效率。

与传统存储相比,能效提升高达 5 倍。

基于 NVIDIA DOCA™ 框架,实现了 AI 节点之间键值 (KV) 缓存的智能加速共享,并与 NVIDIA NIXL 库和 NVIDIA Dynamo 软件紧密集成,从而更大限度地提高每秒 token 处理数量,缩短首个 token 生成所需的时间,并提高多轮响应速度。

由 NVIDIA BlueField-4 管理的硬件加速键值 (KV) 缓存部署可消除元数据开销,减少数据传输,并确保从 GPU 节点进行安全隔离的访问。

NVIDIA Spectrum-X™ 以太网实现了高效的数据共享和检索,为基于 RDMA 访问的 AI 原生键值 (KV) 缓存提供了高性能网络架构。

包括 AIC、Cloudian、DDN、Dell Technologies、HPE、Hitachi Vantara、IBM、Nutanix、Pure Storage、Supermicro、VAST Data 和WEKA在内的存储领域创新者,已率先使用了 BlueField-4 构建新一代 AI 存储平台,并将于 2026 年下半年上市。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20325

    浏览量

    254693
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • AI
    AI
    +关注

    关注

    91

    文章

    40940

    浏览量

    302515

原文标题:CES 2026 | NVIDIA BlueField-4 助力新型 AI 原生存储基础设施,推动 AI 迈向新前沿

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大为创芯进军AI眼镜存储,端侧AI存储全面布局

    当前大模型应用持续渗透,AI 产业正迎来一轮关键的架构迁移,AI 存储正从以云端集中处理为主,逐步向终端与边缘侧下沉延伸。这一趋势让端侧存储
    的头像 发表于 04-03 10:20 4048次阅读
    大为创芯进军<b class='flag-5'>AI</b>眼镜<b class='flag-5'>存储</b>,端侧<b class='flag-5'>AI</b><b class='flag-5'>存储</b>全面布局

    Oracle和NVIDIA合作加速向量搜索和企业数据处理

    Oracle 和 NVIDIA 正在与客户合作,将 GPU 加速的向量索引构建应用于实际工作负载。Oracle Private AI Services Container 初期支持 CPU 执行,现
    的头像 发表于 03-23 15:26 400次阅读

    Supermicro率先发布NVIDIA BlueField-4 STX存储服务器,提升AI推理性能

      Supermicro凭借其基于NVIDIA STX AI存储参考架构打造的上下文内存(CMX)存储服务器,进一步彰显其行业领先地位。 BlueF
    的头像 发表于 03-19 15:46 165次阅读
    Supermicro率先发布<b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField-4</b> STX<b class='flag-5'>存储</b>服务器,提升<b class='flag-5'>AI</b>推理性能

    NVIDIA推出BlueField-4 STX存储架构

    NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、云计算及 AI 服务商轻松部署加速存储
    的头像 发表于 03-18 14:40 261次阅读

    DPU数据处理器的核心功能和应用领域

    DPU,全称数据处理器(Data Processing Unit),是一种专门用于处理数据中心中数据流动与基础设施任务的专用
    的头像 发表于 02-02 13:52 866次阅读
    DPU<b class='flag-5'>数据处理器</b>的核心功能和应用领域

    NVIDIA BlueField-4为推理上下文记忆存储平台提供强大支持

    随着代理式 AI 工作流将上下文窗口扩展到数百万个 token,并将模型规模扩展到数百万亿个参数,AI 原生企业正面临着越来越多的扩展挑战。这些系统目前依赖于智能体长期记忆来存储跨多轮
    的头像 发表于 02-02 10:29 1258次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField-4</b>为推理上下文记忆<b class='flag-5'>存储</b>平台提供强大支持

    NVIDIA在CES 2026发布新一代Rubin AI平台

    通过跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机的极致协同设计,大幅缩短训练时间,降低推理 token 生成成本。
    的头像 发表于 01-09 10:23 781次阅读

    NVIDIA在ISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示的加速系统突显了全球超级计算和 AI 的进展
    的头像 发表于 11-25 10:59 1072次阅读
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超级计算进展

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服务为
    的头像 发表于 11-03 14:48 1197次阅读

    GlobalData与华为探讨AI对网络基础设施的机遇与挑战

    GlobalData 研究总监Emir Halilovic 与华为数据通信产品线NCE数据通信领域总裁王辉共同探讨了人工智能(AI)对网络基础设施带来的机遇(高性能网络需求、
    的头像 发表于 10-14 14:24 752次阅读

    NVIDIA携手OpenAI构建AI基础设施

    NVIDIA 首席执行官黄仁勋、OpenAI 首席执行官 Sam Altman 和 OpenAI 总裁 Greg Brockman 宣布了一项新的合作伙伴关系,旨在推动 OpenAI 的发展,并支持几乎所有行业和用户大规模使用 AI
    的头像 发表于 09-23 14:38 1073次阅读

    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型及AI计算基础设施,为机器人领域开启新篇章

    NVIDIA 通过全新 Omniverse 库、Cosmos 物理 AI 模型及 AI 计算基础设施,为机器人领域开启新篇章   · 全新 NVID
    的头像 发表于 08-12 11:29 1966次阅读
    <b class='flag-5'>NVIDIA</b>通过全新 Omniverse库、Cosmos物理<b class='flag-5'>AI</b>模型及<b class='flag-5'>AI</b>计算<b class='flag-5'>基础设施</b>,为机器人领域开启新篇章

    NVIDIA DOCA 3.0版本的亮点解析

    NVIDIA DOCA 框架已发展成为新一代 AI 基础设施的重要组成部分。从初始版本到备受期待的 NVIDIA DOCA 3.0 发布,每个版本都扩展了
    的头像 发表于 07-04 14:27 1369次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 3.0版本的亮点解析

    欧洲联手NVIDIA打造AI基础设施

    NVIDIA 于近日宣布,其正在携手欧洲各国、科技和行业领导者,共同建造 NVIDIA Blackwell AI 基础设施,以强化数字主权、支撑经济增长,并推动欧洲大陆成为
    的头像 发表于 06-16 14:25 1632次阅读

    维谛加速推进人工智能基础设施演进,助力NVIDIA 800 VDC 电源架构发布

    :VRT)今日宣布与NVIDIA在人工智能发展路线图方面达成高度战略协同。NVIDIA发布全新规划,旨在为下一代AI数据中心部署800VDC电源基础
    的头像 发表于 05-22 14:18 1261次阅读
    维谛加速推进人工智能<b class='flag-5'>基础设施</b>演进,助力<b class='flag-5'>NVIDIA</b> 800 VDC 电源架构发布