0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何评估忆联Gen5 eSSD UH812a在AI场景中的性能表现

UnionMemory忆联 来源:UnionMemory忆联 2026-02-05 09:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着AI大模型进入万亿参数时代,传统存储性能测试已难以真实反映存储系统在实际训练场景中对成本与效率的核心影响。为此,全球权威AI基准测评组织MLCommons正式推出MLPerf Storage基准测试套件,为行业建立起一套贴合实际、具有指导意义的权威评估框架。

区别于传统存储性能测试,MLPerf Storage基准的核心价值在于直接评估存储系统能否支撑GPU集群达到并维持高利用率——这直接决定了整体训练耗时与算力资源成本。该基准在v2.0版本中进一步引入Checkpoint工作负载,精准模拟大模型训练中的容灾恢复环节,使评测更贴近前沿场景的实际需求。

为评估忆联Gen5 eSSD UH812a在AI场景中的性能表现,本次测试基于MLPerf Storage v2.0默认参数展开,并特别针对对数据供给要求更高的NVIDIA H100加速器进行模拟验证,以检验存储系统能否充分适配新一代算力平台的性能需求。此次测试覆盖了MLPerf Storage v2.0包含的全部训练负载,包括U-Net 3D、ResNet50、CosmoFlow和Checkpoint。

结果显示,在四项训练模型中,UH812a的 GPU利用率均超过基准要求,表现出强劲的性能;同时在可支持的加速器数量上亦领先于行业同类产品,有力验证了其在高负载AI训练场景下可提供稳定且高性能的存储支持。

01测试环境

部件 配置信息
CPU Intel(R) Xeon(R)
Gold 6430 CPU @ 2.1GHz*2
内存 512 GB
存储 系统盘:
Union Memory SATA 2*480 GB
数据盘:
Union Memory UH812a 7.68 TB
Linux内核版本 Linux 6.17.4-1.el8.elrepo.x86_64
性能测试软件 MLPerf Storage v2.0

02测试结果

U-Net 3D训练场景

该场景模拟医疗影像等大体积3D数据的训练过程,要求存储系统持续为多个并发GPU客户端提供大型数据文件,旨在测试存储的极限顺序读写带宽,确保GPU不会因数据供给不足而出现空闲等待。

在U-Net3D场景负载下,我们共使用了42000个文件进行训练,模拟了1到5颗GPU的训练过程。如图1所示,UH812a在模拟5颗H100 GPU的负载下,实现了14566.46 MB/s的最高吞吐量,接近标称读带宽(14900 MB/s),此时GPU利用率(AU)高达96%,远高于基准所要求的90%以上水平。通过图1也可看见,UH812a的性能随着GPU数量增加而线性提升,且GPU利用率仅出现微弱波动,证明其在多客户端高并发访问场景下仍能持续提供稳定、高带宽的数据流。

7b276e18-00e8-11f1-90a1-92fbcf53809c.jpg

◎图1:UH812a在不同数量H100环境下的性能测试结果

此外,在该场景测试中,UH812a可支持高达5颗H100加速器,优于对比竞品(仅支持4颗),凸显了其在大体积3D数据训练负载下更强的并发处理能力与性能优势。

7b826886-00e8-11f1-90a1-92fbcf53809c.png

◎图2:UH812a与竞品可支持的H100数量对比

ResNet50训练场景

此场景模拟常规图像分类模型的训练流程,要求存储系统能够应对海量GPU客户端的高并发、随机读取需求,处理大量小型图片文件,从而充分考验存储系统的高IOPS和低延迟元数据处理能力。

在ResNet-50场景测试中,我们使用了19163个文件进行训练,模拟了10至78颗GPU的训练过程。如图3所示,在模拟78颗H100 GPU的负载下,UH812a实现了14008.66 MB/s的最大吞吐量,GPU利用率稳定在92.2%,同样超过基准要求(AU>90%),体现出其能够为复杂训练任务持续提供充足的存储性能支持。

7bdb3b78-00e8-11f1-90a1-92fbcf53809c.jpg

◎图3:UH812a在不同数量H100环境下的性能测试结果

另外,在此场景测试中,UH812a可支持高达78颗H100加速器同时高效工作,显著领先于竞品(分别为65颗和64颗)。这一优势表明,UH812a具备支撑更大规模AI训练集群的潜力,能为极致扩展的模型训练任务提供稳定可靠的数据供给基础。

7c337612-00e8-11f1-90a1-92fbcf53809c.png

◎图4:UH812a与竞品可支持的H100数量对比

CosmoFlow训练场景

该场景主要模拟气候、宇宙学等科学计算中的大规模训练任务,要求存储系统能够支持从8个到数千个客户端的GPU集群扩展,同时高效读取海量中等尺寸文件。其核心挑战在于存储系统的可扩展性与延迟稳定性——任何局部的访问延迟都可能拖慢整个分布式训练作业,因此对存储系统的并发处理与响应一致性要求更高。

在CosmoFlow场景的实际验证中,我们累计使用了971819个文件进行训练,并模拟了1至26颗GPU的训练过程。如图5所示,当加速器数量达到23颗及以上时,UH812a的吞吐量稳定维持在约14000MB/s,同时GPU利用率始终高于基准要求(AU>70%),展现出卓越的系统可扩展性与持续稳定的高并发数据供给能力。

7c8e04e2-00e8-11f1-90a1-92fbcf53809c.jpg

◎图5:UH812a在不同数量H100环境下的性能测试结果

此外,在这一场景下,UH812a可支持26颗H100加速器,相比于竞品(支持21颗和16颗),支持GPU数量更多,可为高负载场景提供稳定可靠的存储。

7ce5a878-00e8-11f1-90a1-92fbcf53809c.png

◎图6:UH812a与竞品可支持的H100数量对比

Checkpoint训练场景

此场景模拟大模型训练中保存和恢复训练状态的关键操作,要求所有GPU同时将完整的模型状态(参数、优化器等,规模可达数TB)顺序写入存储,再快速读取。该过程是对存储系统高并发顺序读写带宽的终极考验,其性能直接决定了训练任务因中断而损失的时间。

在Checkpoint场景的实测中,受限于时间等因素,我们以Llama3-8b为模型进行了写入测试,图7实测结果显示,UH812a的带宽达到13053.4 MB/s,较竞品A提升24%,较竞品B提升11%,可为用户提供高性能的读写体验。

7d424fb0-00e8-11f1-90a1-92fbcf53809c.png

◎图7:Llama3-8b模型下UH812a与竞品表现对比

MLPerf Storage v2.0的测试结果表明,UH812a能够充分满足前沿AI场景对存储系统的严苛性能需求,尤其在数据供给能力和稳定性方面展现出显著优势,性能领先于业界同类产品。这不仅印证了其在加速AI工作负载方面的卓越能力,也体现了其作为智能算力底座关键一环的核心价值。

未来,忆联将继续聚焦AI存储技术创新与产品研发,致力于通过更高性能、更可靠的存储解决方案,持续赋能智能算力基础设施建设,与产业伙伴共同推动人工智能技术的规模化落地与持续演进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4934

    浏览量

    90386
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136206
  • 算力
    +关注

    关注

    2

    文章

    1772

    浏览量

    16857
  • 大模型
    +关注

    关注

    2

    文章

    3862

    浏览量

    5295

原文标题:忆联UH812a以MLPerf Storage标杆级验证,重塑AI存储效能,奠定智能算力基石

文章出处:【微信号:UnionMemory忆联,微信公众号:UnionMemory忆联】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    正面对决A19 Pro,骁龙8 Elite Gen5杀疯了,谁是2025手机真旗舰SoC?

    随着骁龙 8 Elite Gen5A19 Pro处理器的发布,高通与苹果(Apple)移动芯片领域的竞争正升级到新高度。 高通宣称要在CPU单核性能上超越苹果,而苹果
    的头像 发表于 09-29 09:03 2w次阅读
    正面对决<b class='flag-5'>A</b>19 Pro,骁龙8 Elite <b class='flag-5'>Gen5</b>杀疯了,谁是2025手机真旗舰SoC?

    铠侠发布XG10系列PCIe Gen5固态硬盘

    5月13日,存储厂商铠侠(KIOXIA)美国加州正式发布面向PC OEM的全新高性能固态硬盘系列—— **XG10** 。这是铠侠首款基于PCIe Gen5接口的消费级客户端SSD产
    的头像 发表于 05-14 11:08 1572次阅读

    QorvoeSSD电源管理领域的战略布局

    随着数据中心与AI服务器算力的狂飙突进,底层存储系统的稳定与效率正面临前所未有的考验。企业级SSD(eSSD)作为数据存取的核心枢纽,其电源管理不仅关乎单盘性能,更直接决定了整个AI
    的头像 发表于 04-10 14:53 1371次阅读

    慧荣科技推出SM8008:业界首款PCIe Gen5企业级启动与超低功耗主控芯片

    慧荣科技(NasdaqGS: SIMO)作为设计和推广固态存储设备NAND闪存主控芯片的全球领导者,今日宣布推出SM8008,这是一款PCIe Gen5 x4 NVMe企业级SSD主控芯片,其高性能
    的头像 发表于 03-14 14:11 1593次阅读

    UH812a以极致存力破局大模型载入瓶颈

    随着大模型技术规模化落地,AI应用的实时性正成为企业竞争力的核心。然而,算力持续升级的同时,模型从存储层加载至计算单元的环节却日渐成为制约系统效率与弹性的关键瓶颈。缓慢或波动的加载过程,不仅会导致
    的头像 发表于 03-04 16:22 1122次阅读
    <b class='flag-5'>忆</b><b class='flag-5'>联</b><b class='flag-5'>UH812a</b>以极致存力破局大模型载入瓶颈

    英特尔与重磅推出企业级网络存储解决方案

    白皮书,旨在充分发挥至强6处理器与UH812a企业级SSD的性能潜力,全面满足AI训练与推理场景
    的头像 发表于 02-02 09:14 1355次阅读
    英特尔与<b class='flag-5'>忆</b><b class='flag-5'>联</b>重磅推出企业级网络存储解决方案

    探索RC192xx:PCIe Gen5/6 2 - 输入时钟复用器家族的卓越性能

    RC19202、RC19204、RC19208和RC19216,凭借其对PCIe Gen5Gen6的支持,以及一系列出色的特性,成为了众多应用场景的理想选择。今天,我们就来深入了解
    的头像 发表于 12-30 09:55 1196次阅读

    深入解析RC190xx:PCIe Gen5/6高性能扇出缓冲器家族

    深入解析RC190xx:PCIe Gen5/6高性能扇出缓冲器家族 在当今高速发展的电子科技领域,PCIe Gen5/6技术的应用越来越广泛,对高性能扇出缓冲器的需求也愈发迫切。Ren
    的头像 发表于 12-30 09:55 1156次阅读

    【道生物TKB-623评估板试用】功能综合测试

    TKB-623 模组实际应用场景的通信性能、稳定性、易用性及其与我司目标产品的兼容性。 2. 评估板简介
    发表于 11-09 14:35

    【道生物TKB-623评估板试用】+ 初步认识道生物TKB-623评估

    串接电流表测试芯片功耗 配合工具,实现示例代码功能的编译下载和调试 产品框图 产品参数 道生物TKB-623评估板总体来说值得购买和去测试,道生物TKB-623评估板应用范围非
    发表于 11-07 22:51

    PCIe Gen5/Gen6 信号传输可以用极细同轴线束吗?

    极细同轴线束不仅能在结构空间上提供灵活性,还能在信号层面保持可控的损耗和低串扰,满足高速互联需求。极细同轴线束可在特定条件下用于 PCIe Gen5/Gen6 信号传输,但必须建立高质量线束、严格的阻抗控制、专业的连接器选型与
    的头像 发表于 10-27 18:27 2885次阅读
    PCIe <b class='flag-5'>Gen5</b>/<b class='flag-5'>Gen</b>6 信号传输可以用极细同轴线束吗?

    PCIe 5.0企业级固态硬盘UH812a评测

    近日,国内知名计算机硬件评测媒体PCEVA对PCIe 5.0企业级固态硬盘UH812a进行了全面评测,测试数据显示该产品不仅在性能上达到业界领先水平,更在Oracle数据库、VSI
    的头像 发表于 08-21 11:27 4913次阅读
    <b class='flag-5'>忆</b><b class='flag-5'>联</b>PCIe 5.0企业级固态硬盘<b class='flag-5'>UH812a</b>评测

    PCIe协议分析仪在数据中心中有何作用?

    升数据中心的整体可靠性。以下是其核心作用及具体应用场景的详细分析:一、性能优化:突破带宽瓶颈,提升计算效率 链路带宽利用率分析 场景AI
    发表于 07-29 15:02

    英特尔Benchmark验证!UH812a问鼎PCIe Gen5企业级存储性能巅峰

    达3538K,延迟改善43%,多盘扩展性能线性增长至230GB/s。通过全场景验证,UH812a展现了卓越的稳定性与扩展性,标志着与英特
    的头像 发表于 07-07 16:33 957次阅读
    英特尔Benchmark验证!<b class='flag-5'>忆</b><b class='flag-5'>联</b><b class='flag-5'>UH812a</b>问鼎PCIe <b class='flag-5'>Gen5</b>企业级存储<b class='flag-5'>性能</b>巅峰

    Docker+MySQL 流控方案:打造安全高效存储底座,释放 AI 极致性能

    探讨基于Docker部署的MySQL数据库AI应用的关键作用。通过PCIe5.0企业级SSD(U
    的头像 发表于 06-26 13:53 621次阅读
    <b class='flag-5'>忆</b><b class='flag-5'>联</b> Docker+MySQL 流控方案:打造安全高效存储底座,释放 <b class='flag-5'>AI</b> 极致<b class='flag-5'>性能</b>