0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Supermicro率先发布NVIDIA BlueField-4 STX存储服务器,提升AI推理性能

全球TMT 来源:全球TMT 作者:全球TMT 2026-03-19 15:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


wKgZO2m7qbyABlO2AACVs12feb8491.jpg

Supermicro凭借其基于NVIDIA STX AI存储参考架构打造的上下文内存(CMX)存储服务器,进一步彰显其行业领先地位。

BlueField-4 STX存储服务器结合了NVIDIA Vera CPU和NVIDIA ConnectX-9 SuperNIC。

Supermicro的这款存储服务器基于去年推出的、采用NVIDIA BlueField-3的Petascale JBOF全闪存阵列打造。

加利福尼亚州2026年3月19日 /美通社/ -- Supermicro, Inc. (NASDAQ:SMCI) 作为面向AI、云、存储及5G/Edge的整体IT解决方案提供商,今日发布了业内首批上下文内存(CMX)存储服务器之一。该产品是NVIDIA在NVIDIA GTC 2026上发布的STX参考架构的一部分。 STX是NVIDIA推出的一种全新模块化参考架构,旨在加速AI的完整生命周期。

wKgZPGm7qb2AU3IZAAC0aiF1t_I231.jpg


业内首款与NVIDIA STX机架级存储架构集成的CMX存储服务器

“Supermicro始终率先将新一代机架级架构推向市场,旨在超越快速演进的AI Factory客户群不断提升的需求。”Supermicro总裁兼首席执行官Charles Liang表示, “在去年推出Petascale JBOF(Just a Bunch of Flash,即全闪存阵列)的基础上,我们已验证基于NVIDIA BlueField-3 DPU的JBOF的可行性,并进一步开发出CMX存储服务器。 我们最新存储架构的原型展示了我们与NVIDIA合作的深度,以及我们致力于率先推出颠覆性技术的承诺。”

如需了解基于NVIDIA STX参考架构构建的全新Supermicro存储服务器的更多信息,请访问:

借助STX架构,CMX服务器旨在应对长时AI查询以及多阶段链式思维(multi-stage chain-of-thought)智能体工作负载所带来的挑战。这类工作负载需要频繁访问与用户查询相关的历史及中间Token。 该解决方案不仅能够加速结果生成,还可在本地Token存储容量不足、原本需要重复计算的情况下,显著降低额外功耗。 这种Token的存储机制称为键值(KV)缓存,由NVIDIA推理编排层NVIDIA Dynamo统一管理。

随着STX解决方案逐步推向市场,Supermicro将与相关软件合作伙伴及更多生态伙伴协同推进移植与验证工作。 此外,Supermicro与Micron、Samsung、Phison等领先SSD供应商建立的长期合作关系,将有力支持针对STX架构特定需求开展的测试工作。

在2026年GTC大会上,Supermicro还宣布推出七款基于RTX PRO 6000 Blackwell Server Edition GPU的AI数据平台解决方案,并携手NVIDIA及Cloudian、DDN、Everpure(原Pure Storage)、IBM、Nutanix、VAST Data和WEKA等存储合作伙伴共同打造。AI数据平台使企业能够处理其用于AI工作负载的数据。 CMX服务器正在于2026年3月16日至19日举行的NVIDIA GTC大会上,在Supermicro的#1113号展位以及NVIDIA展区进行展示。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110095
  • AI
    AI
    +关注

    关注

    91

    文章

    40940

    浏览量

    302515
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA推出BlueField-4 STX存储架构

    NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、云计算及 AI
    的头像 发表于 03-18 14:40 261次阅读

    每块GPU对应16TB SSD,英伟达KV缓存虹吸高性能TLC SSD

    作者:黄晶晶   不久前,英伟达宣布其Vera Rubin平台将采用搭载BlueField-4芯片的ICMS架构,通过卸载KV Cache突破内存瓶颈、提升AI推理性能。该架构单台
    的头像 发表于 02-10 11:12 1.4w次阅读

    NVIDIA BlueField-4推理上下文记忆存储平台提供强大支持

    随着代理式 AI 工作流将上下文窗口扩展到数百万个 token,并将模型规模扩展到数百万亿个参数,AI 原生企业正面临着越来越多的扩展挑战。这些系统目前依赖于智能体长期记忆来存储跨多轮、工具和会话持续保存的上下文,以便智能体能够
    的头像 发表于 02-02 10:29 1258次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField-4</b>为<b class='flag-5'>推理</b>上下文记忆<b class='flag-5'>存储</b>平台提供强大支持

    NVIDIA BlueField-4数据处理器重塑新型AI原生存储基础设施

    NVIDIA 宣布,NVIDIA BlueField®-4 数据处理作为全栈 NVIDIA
    的头像 发表于 01-09 10:33 618次阅读

    NVIDIA在CES 2026发布新一代Rubin AI平台

    通过跨 NVIDIA Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 和 Spectrum-6 以太网交换机的极致协同设计,大幅缩短训练时间,降低
    的头像 发表于 01-09 10:23 781次阅读

    NVIDIA 推出 Alpamayo 系列开源 AI 模型与工具,加速安全可靠的推理型辅助驾驶汽车开发

    新闻摘要 : l NVIDIA 率先发布为应对辅助驾驶长尾场景挑战而设计的开源视觉-语言-动作推理模型(Reasoning VLA);NVIDIA Alpamayo 系列还包含赋能辅助
    的头像 发表于 01-06 09:40 507次阅读
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列开源 <b class='flag-5'>AI</b> 模型与工具,加速安全可靠的<b class='flag-5'>推理</b>型辅助驾驶汽车开发

    NVIDIA在ISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。在 SC25 上展示的加速系统突显了全球超级计算和 AI 的进展
    的头像 发表于 11-25 10:59 1072次阅读
    <b class='flag-5'>NVIDIA</b>在ISC 2025分享最新超级计算进展

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微
    的头像 发表于 11-03 14:48 1197次阅读

    通过NVIDIA Jetson AGX Thor实现7倍生成式AI性能

    Jetson Thor 平台还支持多种主流量化格式,包括 NVIDIA Blackwell GPU 架构的新 NVFP4 格式,有助于进一步优化推理性能。该平台同时支持推测解码等新技术,为在边缘端加速生成式
    的头像 发表于 10-29 16:53 1615次阅读

    NVIDIA TensorRT LLM 1.0推理框架正式上线

    TensorRT LLM 作为 NVIDIA 为大规模 LLM 推理打造的推理框架,核心目标是突破 NVIDIA 平台上的推理性能瓶颈。为实
    的头像 发表于 10-21 11:04 1386次阅读

    利用NVIDIA DOCA GPUNetIO技术提升MoE模型推理性能

    在第三届 NVIDIA DPU 中国黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全
    的头像 发表于 09-23 15:25 1179次阅读

    使用NVIDIA NVLink Fusion技术提升AI推理性能

    本文详细阐述了 NVIDIA NVLink Fusion 如何借助高效可扩展的 NVIDIA NVLink scale-up 架构技术,满足日益复杂的 AI 模型不断增长的需求。
    的头像 发表于 09-23 14:45 1091次阅读
    使用<b class='flag-5'>NVIDIA</b> NVLink Fusion技术<b class='flag-5'>提升</b><b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    Lambda采用Supermicro NVIDIA Blackwell GPU服务器集群构建人工智能工厂

    大批量 Supermicro GPU 优化服务器(包括基于 NVIDIA Blackwell 的系统),以扩展其人工智能基础设施并向客户交付高性能计算系统。此次合作于今年 6 月
    的头像 发表于 08-30 16:55 920次阅读

    华为亮相2025金融AI推理应用落地与发展论坛

    创新技术——UCM推理记忆数据管理,旨在推动AI推理体验升级,提升推理性价比,加速
    的头像 发表于 08-15 09:45 1373次阅读

    ai服务器是什么?与普通服务器有什么区别

    AI服务器并非简单的硬件堆砌,而是专门为人工智能任务设计的高性能计算系统。其核心目标是高效处理海量数据并行计算(如矩阵乘法、模型推理),并针对AI
    的头像 发表于 06-24 16:39 4893次阅读