0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助美光9550高性能SSD提升AI工作负载

Micron美光科技 来源:Micron美光科技 2025-07-14 15:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

推理将成为数据中心最常见的工作负载,这一点毋庸置疑。随着数据中日益广泛采用NVIDIA H100,以及非NVL72系统开始部署NVIDIA DGX B200,计算能力正迎来爆炸式增长。

观察PCIe各代产品带宽扩展与计算能力增长的情况可以发现:从PCIe 3.0到6.0,带宽增长了8倍,而GPU FLOPS在同一时期增长了37.5倍。

我们还发现,过去四年间,训练集群的平均FLOPS增加了905倍,而训练数据集中的数据点数量在同一时期增加了2,500倍。

f729de94-5d3a-11f0-baa5-92fbcf53809c.jpg

f7334326-5d3a-11f0-baa5-92fbcf53809c.gif

虽然推理一直是且将继续是计算密集型工作负载,但其对快速存储的依赖正在迅速显现。推理模型将推动大语言模型 (LLM) 的实用性、准确性和资源需求大幅提升。序列长度的增加促使LLM系统设计不断创新,将KV缓存存储到磁盘而非刷新后重新计算正在成为效率更高的做法。这将对企业用于推理的GPU本地系统提出更高的性能要求。

我们关注这一趋势已有一段时间,并因此研发出了美光9550这款性能出色的SSD。其高IOP和卓越能效能够有效契合这些新兴工作负载的需求。

举例而言,我们使用微软的DeepSpeed ZeRO-Inference工具对美光9550与某前沿竞品进行了测试。结果显示,美光9550的读取速度快15%,平均功耗低27%,从而使SSD能耗低37%、系统总能耗低19%。

尽管写入操作只占推理工作负载的一小部分,但不同SSD在写入性能方面存在显著差异。美光9550的写入速度快78%,同时平均功耗低22%。这表明美光9550完成推理任务的能耗仅为其他产品的一半,且系统总能耗低43%。

随着计算能力的迅猛发展以及推理领域令人瞩目的实用性创新成果不断涌现,存储技术亟待跟上步伐。数据中心SSD的开发周期较长;NAND制造、ASIC设计、功耗、散热等环节均对AI系统中存储的最终性能起着关键作用。美光多年来一直在测试人工智能 (AI) 工作负载,并将其视为美光9550以及其他新一代数据中心SSD开发工作的重要组成部分。我们深知,要打造契合未来AI工作负载需求的存储解决方案,就必须在当下先人一步。

f74c648c-5d3a-11f0-baa5-92fbcf53809c.jpg

测试详情:

DeepSpeed ZeRO AIO读取——在GPU内部通过DeepSpeed库模拟合成工作负载。

测试系统:2颗Intel Xeon Platinum 8568Y+、768GB DDR5 DRAM、2块NVIDIA L40S GPU竞品是一款PCIe 5.0高性能数据中心SSD,其在规格和目标用例方面与美光9550相似。

相关数据通过850次测试运行产生,测试历时446小时。

本文作者

Ryan Meredith

美光存储解决方案架构总监

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SSD
    SSD
    +关注

    关注

    21

    文章

    3171

    浏览量

    122785
  • 数据中心
    +关注

    关注

    18

    文章

    5868

    浏览量

    75276
  • 美光
    +关注

    关注

    5

    文章

    744

    浏览量

    53393

原文标题:推理=IOPS:借助美光9550高性能SSD保持前沿地位

文章出处:【微信号:gh_195c6bf0b140,微信公众号:Micron美光科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    6600 ION SSD:以245TB容量重构数据中心存储密度新纪元

    近日,科技股份有限公司正式宣布出货全球首款商用245TB容量SSD——6600 ION系列,标志着数据中心存储密度实现跨越式突破。这
    的头像 发表于 05-08 09:45 1144次阅读

    业界领先的245TB 6600 ION数据中心SSD凭超越机械硬盘的突破性能效,重新定义机架级存储密度

    SSD,该产品标志着数据中心机架级存储密度实现重大飞跃。 245TB 6600 ION SSD  专为支持人工智能(AI)、云计算、
    的头像 发表于 05-07 09:43 1467次阅读
    <b class='flag-5'>美</b><b class='flag-5'>光</b>业界领先的245TB 6600 ION数据中心<b class='flag-5'>SSD</b>凭超越机械硬盘的突破<b class='flag-5'>性能</b>效,重新定义机架级存储密度

    AD9550:有线通信领域的高性能时钟转换器

    AD9550:有线通信领域的高性能时钟转换器 在有线通信和基站应用中,时钟信号的稳定性和准确性至关重要。AD9550作为一款基于锁相环(PLL)的时钟转换器,为这些应用提供了出色的解决方案。下面我们
    的头像 发表于 04-20 10:35 141次阅读

    展望2026存储产业趋势:SSD将成AI性能提升关键

    AI高性能计算的发展,正迎来关键转折点。业界仍在孜孜不倦地追求GPU的强大性能,在这种情况下,存储解决方案必须紧跟步伐,应对日益先进的计算工作负载
    的头像 发表于 02-26 16:48 816次阅读

    每块GPU对应16TB SSD,英伟达KV缓存虹吸高性能TLC SSD

    HBM4 内存量产交付之外,三星存储器业务计划全方面积极应对AI相关需求,重点提升面向 AI KV(键值)存储需求的高性能 TLC SSD
    的头像 发表于 02-10 11:12 1.4w次阅读

    科技揭示端侧AI未来发展的五大关键

    在当今技术驱动的世界中,AI 正在彻底改变各行各业。无论您关注手机、PC 还是汽车领域,都需要了解内存和存储对端侧设备上 AI 工作负载的关键作用。
    的头像 发表于 01-30 15:36 832次阅读

    科技实现单台服务器性能高达230M IOPS

    我们非常自豪地宣布,AI 基础设施性能达成了一项重大里程碑:通过使用 NVIDIA SCADA 编程模型、 9650 PCIe 6.0 SSD
    的头像 发表于 01-19 10:11 2666次阅读
    <b class='flag-5'>美</b><b class='flag-5'>光</b>科技实现单台服务器<b class='flag-5'>性能</b>高达230M IOPS

    国产高性能ONFI IP解决方案全解析

    1. 什么是ONFI IP?其在AI时代的作用是什么?ONFI (Open NAND Flash Interface) 是连接闪存控制器与NAND颗粒的关键高速接口协议。在AI高性能计算(HPC
    发表于 01-13 16:15

    科技全新3610 NVMe SSD重磅发布

    科技股份有限公司(纳斯达克股票代码:MU)今日宣布推出 3610 NVMe SSD,这是业界首款面向客户端计算的 PCIe 5.0
    的头像 发表于 01-08 17:20 2242次阅读

    高性能网络存储设计:NVMe-oF IP的实现探讨

    的 NVMeRAID0 横向扩展能力,通过多通道NVMe控制器并行访问多个SSD,实现以下技术特性: •多 SSD 带宽聚合,读写性能接近线性提升 •跨盘条带(Striping)调度优
    发表于 12-19 18:45

    【产品介绍】Altair PBS Professional HPC工作负载管理器和作业调度管理系统

    ,并简化集群、云和超级计算机的管理——从最大的高性能计算(HPC)工作负载到数百万个小型、高吞吐量作业。借助动态策略、AI
    的头像 发表于 09-19 17:03 907次阅读
    【产品介绍】Altair PBS Professional HPC<b class='flag-5'>工作</b><b class='flag-5'>负载</b>管理器和作业调度管理系统

    SGM260320:SSD 系统供电的高效低耗 PMIC

    本帖最后由 jf_48112271 于 2025-8-13 10:29 编辑 圣邦微电子近日发布了一款专为 SSD 系统供电设计的高性能电源管理集成电路(PMIC)——SGM260320。这款
    发表于 08-07 11:38

    采用第九代QLC NAND的2600 NVMe SSD介绍

    一直在QLC市场占有优势,采用G9 QLC NAND的2600
    的头像 发表于 08-05 11:09 2161次阅读

    推出自适应写入技术与G9 QLC NAND的2600 NVMe SSD 兼顾出众PCIe 4.0性能

        2025年7月1日,爱达荷州博伊西市 — SSD对于提升PC及客户端设备的用户体验和系统性能至关重要。Micron Technology Inc.(
    的头像 发表于 07-02 11:09 2101次阅读
    <b class='flag-5'>美</b><b class='flag-5'>光</b>推出自适应写入技术与G9 QLC NAND的2600 NVMe <b class='flag-5'>SSD</b> 兼顾出众PCIe 4.0<b class='flag-5'>性能</b>

    12层堆叠36GB HBM4内存已向主要客户出货

    随着数据中心对AI训练与推理工作负载需求的持续增长,高性能内存的重要性达到历史新高。Micron Technology Inc.(
    的头像 发表于 06-18 09:41 2027次阅读