0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列

浪潮存储 来源:浪潮存储 2024-05-08 09:38 次阅读

近日,浪潮信息发布为大模型专门优化的分布式全闪存储AS13000G7-N系列。该系列依托浪潮信息自研分布式文件系统,搭载新一代数据加速引擎DataTurbo,通过盘控协同、GPU直访存储、全局一致性缓存等技术为AI大模型数据归集、训练、数据归档与管理等阶段提供强大存储支撑能力,助力用户加速大模型系统的创新及应用落地。

化解大模型时代的存储挑战

构建坚实的数据存储底座

大模型已经成为驱动数字经济深度创新、引领企业业务变革、加速形成新质生产力的重要动能,随着大模型参数量和数据量的极速膨胀,多源异构数据的传、用、管、存,正在成为制约生成式AI落地的瓶颈之一,用户亟需构建更加高效的存储底座。在数据准备阶段,在规模大、来源广泛、格式多样的原始数据中,筛选和清洗出利用于训练的高质量数据常会耗费大量时间;在模型训练阶段,海量小文件数据加载、Checkpoint数据调用对IO处理效率提出严苛要求;模型训练之后,多个数据资源池无法互通、海量冷数据归档带来较高的数据管理复杂度。

作为率先在业界提出分布式融合存储的厂商,浪潮信息聚焦行业客户的大模型落地需求与核心痛点,基于NVMe SSD研发出高效适配和优化的分布式全闪存储AS13000G7-N系列。硬件方面,AS13000G7-N是一款2U24盘位的全闪存储机型,搭载英特尔至强第四、第五代可扩展处理器,支持400 Gb 网卡,同时每盘位可配置15.36TB 大容量NVMe SSD。软件方面,通过集群控制服务将N个节点联成一套具有高扩展性的文件系统;通过分布式元数据服务提升海量小文件读写性能;通过数控分离架构,实现东西向网络优化,降低IO访问时延,提升单节点带宽。在软硬件协同创新下,AS13000G7-N充分满足大模型应用在存储性能和存储容量方面的严苛需求。

1a34deda-0c6e-11ef-a297-92fbcf53809c.jpg

具体来说,在数据准备阶段,通过多协议融合互通技术,面对多份、多种协议的数据,存储底层仅保留一份数据,实现数据共享免搬迁;在模型训练阶段,通过大小IO智能识别和缓存预读技术快速保存和恢复checkpoint(检查点)文件,实现TB级训练数据Checkpoint读取耗时从10分钟缩短至10秒内,大幅提升训练过程中数据加载速度;RDMA/RoCE网络连接技术和数控分离架构的设计,实现东西向数据免转发,极限发挥大模型训练中硬件网络带宽性能;基于盘控协同架构,网络数据直通NVMe SSD,进一步提升单盘带宽;在数据归档与管理阶段,AS13000G7-N提供了多元异构存储的统一纳管能力,保障数据资产高效存储与管理,大幅提升存储资源的利用率且最大化数据基础设施投资回报比。

DataTurbo数据加速引擎

全力保障大模型高效训练

在大模型的数据应用全流程中,要想使训练效率达到极致,减少不必要的资源浪费,训练阶段的数据读写性能成为重中之重。而想要提升算力利用率、降低模型训练成本,必须要在数据存储性能上进行创新。

AS13000G7-N系列具备强大的端到端性能优化能力,这也是模型训练阶段最为核心的考量因素。浪潮信息基于计算和存储协同的理念,依托自研分布式文件系统构建了新一代数据加速引擎DataTurbo,在缓存优化、空间均衡、缩短GPU与存储读取路径等方面进行了全面升级。”

■ 智能缓存优化,保障大模型训练速度与质量

AS13000G7-N能够通过对大小IO的智能识别,进行分类治理,小文件采取聚合的操作,大文件采取切片的操作,所有数据以大小均衡的模式保存到全局缓存中,实现小文件性能提升5倍,大文件性能提升10倍。在模型训练中断后,从Checkpoint恢复数据过程中,AS13000G7-N通过缓存预读技术,提前识别数据的冷热程度,加速了重复样本数据的读取,训练加载速度提升10倍。无论是读操作还是写操作,AS13000G7-N采取了字节级(Byte)分布式锁机制,粒度是主流并行文件系统锁机制粒度的几十分之一,确保多个节点访问共享资源时能够安全、有序地进行操作,从而保持训练数据的强一致性和训练质量。

■ 智能空间均衡,高水位下性能无衰减

AS13000G7-N搭载了浪潮信息自主研发的分布式并行客户端技术,相比通用私有客户端,卸载了独立的元数据,实现了元数据和数据节点的高效统一部署,有效提升存储的并发能力,充分利用训练节点网卡的带宽,让GPU算力得到完全释放。同时在存储端,相较于业界主流的文件系统需要在磁盘之上构筑一层文件协议,AS13000G7-N能够直接对裸盘的空间进行均衡排布,并在管理层面设计了智能空间预分技术,能够结合用户前端算力节点数量、训练模型的数量,对存储空间分配进一步进行智能策略预埋。这套组合拳能够使AS13000G7-N在空间利用率达到95%高水位时,依然可以平稳输出强大的性能。在模型训练的空间损耗上,AS13000G7-N相较传统方案,将损耗率降低了85%左右,充分保护了客户在大模型存储上的投资。

■ GPU直通存储,服务万亿参数大模型

当大模型参数在百亿级别,GPU对存储资源的调用效率往往差别不大。但随着大模型从单模态走向多模态,数据量指数型增长,训练效率随之要求更高。从数据层面来看,AS13000G7-N具备和GPU直通的能力,数据流不经过客户端缓存,直接到达存储底层文件系统,缩短GPU与存储的读取路径,这项技术能够使存储读写带宽翻倍,大模型训练加载时间缩短50%。随着万卡万亿参数模型时代的到来,GPU直通存储高效提升数据读写访问的能力将是大模型训练的标配。

通过上述技术创新,分布式全闪存储AS13000G7-N凭借领先的性能和管理优势,能够帮助用户加速大模型的数据归集、提升模型训练效率、简化海量异构数据的管理,从而推动业务智能化变革。浪潮信息将借助AS13000G7-N等存储产品,与合作伙伴加快在场景化方案定制、市场拓展等方面的创新,助力用户构筑人工智能时代最佳数据存储底座。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18432

    浏览量

    222947
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4447

    浏览量

    126912
  • SSD
    SSD
    +关注

    关注

    20

    文章

    2708

    浏览量

    115666
  • 大模型
    +关注

    关注

    2

    文章

    1656

    浏览量

    1281

原文标题:为大模型专门优化!浪潮信息发布分布式全闪存储AS13000G7-N系列

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浪潮信息发布AS13000G7-N系列分布式闪存储

    浪潮信息近日推出了专为大型AI模型优化AS13000G7-N系列分布式
    的头像 发表于 05-14 10:03 163次阅读

    为大模型专门优化 浪潮信息发布分布式闪存储AS13000G7-N系列

    北京2024年5月10日 /美通社/ -- 近日,浪潮信息发布为大模型专门优化分布式
    的头像 发表于 05-10 16:37 196次阅读
    为大<b class='flag-5'>模型</b><b class='flag-5'>专门</b><b class='flag-5'>优化</b> <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b><b class='flag-5'>分布式</b>全<b class='flag-5'>闪存储</b><b class='flag-5'>AS13000G7-N</b><b class='flag-5'>系列</b>

    一图读懂浪潮信息新一代分布式闪存储AS13000G7-N系列

    一图读懂浪潮信息新一代分布式闪存储AS13000G7-N系列
    的头像 发表于 05-08 09:35 229次阅读
    一图读懂<b class='flag-5'>浪潮信息</b>新一代<b class='flag-5'>分布式</b>全<b class='flag-5'>闪存储</b><b class='flag-5'>AS13000G7-N</b><b class='flag-5'>系列</b>

    浪潮信息发布企业大模型开发平台&quot;元脑企智&quot;EPAI,加速AI创新落地

    北京2024年4月18日 /美通社/ -- 4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息发布企业大模型开发平台"元脑企智"EPAI(Enterprise P
    的头像 发表于 04-18 21:21 164次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台&quot;元脑企智&quot;EPAI,加速AI创新落地

    浪潮信息发布企业大模型开发平台“元脑企智”EPAI

    4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息重磅发布企业大模型开发平台“元脑企智”EPAI(Enterprise Platform of AI),为企业AI
    的头像 发表于 04-18 10:12 149次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>企业大<b class='flag-5'>模型</b>开发平台“元脑企智”EPAI

    浪潮信息与英特尔合作推出一种大模型效率工具“YuanChat”

    3月26日,浪潮信息与英特尔正式宣布,浪潮信息“源2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配,本地推理速度提升100%。
    的头像 发表于 03-27 13:50 231次阅读
    <b class='flag-5'>浪潮信息</b>与英特尔合作推出一种大<b class='flag-5'>模型</b>效率工具“YuanChat”

    浪潮信息澎湃认证:浪潮信息集中式存储携手仪电云i-stack云操作系统软件完成兼容性认证

    近日, 仪电云i-stack云操作系统软件与浪潮信息集中式存储AS/HF系列产品完成并通过浪潮信息澎湃技术相互兼容性测试认证, 测试结果显示,仪电云i-stack云操作系统软件与
    的头像 发表于 12-08 16:40 347次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存储</b>携手仪电云i-stack云操作系统软件完成兼容性认证

    数聚AI ∙ 智慧未来 | 浪潮信息存储助力企业基于大模型实现数字化创新

    ,更好地帮助企业实现数字化创新? 11月29日,由DOIT传媒举办的“数智创新 · AI未来”—2023中国数据与存储峰会在北京成功举办,浪潮信息存储产品线副总经理刘希猛和分布式
    的头像 发表于 11-30 16:25 231次阅读
    数聚AI ∙ 智慧未来 | <b class='flag-5'>浪潮信息</b><b class='flag-5'>存储</b>助力企业基于大<b class='flag-5'>模型</b>实现数字化创新

    浪潮信息发布源2.0基础大模型,千亿参数全面开源

    11月27日,浪潮信息发布"源2.0"基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在
    的头像 发表于 11-28 09:10 491次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>源2.0基础大<b class='flag-5'>模型</b>,千亿参数全面开源

    浪潮信息澎湃认证:浪潮信息集中式存储携手达梦数据库管理系统V8完成兼容性认证

    近日, 达梦数据库管理系统V8与浪潮信息集中式存储AS/HF系列产品完成并通过浪潮信息澎湃技术相互兼容性测试认证 ,测试结果显示,达梦数据库管理系统V8与
    的头像 发表于 09-27 17:10 389次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存储</b>携手达梦数据库管理系统V8完成兼容性认证

    浪潮信息发布模型智算软件栈OGAI,为大模型创新打造高效生产力

    浪潮信息正式发布模型智算软件栈 OGAI。OGAI (Open GenAI Infra)"元脑生智",是为大模型业务提供AI算力系统环境部署、算力调度保障及
    的头像 发表于 08-28 08:08 397次阅读

    浪潮信息稳居中国全闪存储市场前二

    15亿元,市场占比25%,混闪存储销售额38亿元,市场占比54%,相比全球全闪存储市场份额41.3%的局面,中国全闪存储市场还有很大发展空间。其中浪潮信息
    的头像 发表于 08-08 12:55 766次阅读

    浪潮信息稳居中国全闪存储市场前二

    亿元,市场占比54%,相比全球全闪存储市场份额41.3%的局面,中国全闪存储市场还有很大发展空间。其中浪潮信息闪存储一季度销售额和出货量,位居中国前二,出货量同比增长310%,领涨中
    的头像 发表于 08-07 11:10 367次阅读

    浪潮信息澎湃认证:浪潮分布式存储携手博雅云OneSRM SMP存储管理平台完成兼容性认证

    近日, 博雅云OneSRM SMP存储管理平台与浪潮分布式存储AS13000系列产品完成并通过
    的头像 发表于 07-12 09:15 400次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮</b><b class='flag-5'>分布式</b><b class='flag-5'>存储</b>携手博雅云OneSRM SMP<b class='flag-5'>存储</b>管理平台完成兼容性认证

    融合互通,浪潮分布式融合存储AS13000加速海量数据处理

    智慧时代,数据量激增且非结构化数据的占比逐渐增大,数据类型愈发复杂,处理数据的方式更加多样化,传统单一存储难以满足市场需求。基于此,浪潮推出了非结构化数据融合互通新平台分布式融合存储A
    的头像 发表于 06-07 10:57 424次阅读
    融合互通,<b class='flag-5'>浪潮</b><b class='flag-5'>分布式</b>融合<b class='flag-5'>存储</b>AS<b class='flag-5'>13000</b>加速海量数据处理