0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息分布式存储在人工智能领域的应用

浪潮存储 来源:浪潮存储 2024-11-26 13:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着AI技术机器学习演进至深度学习,并进一步迈向生成式AI的新阶段,算法、算力及数据需求呈现出爆炸式增长态势。大模型爆发初期,众多企业布局,要求存储提供高带宽、高IOPS和低时延,以确保模型能够快速有效地进行训练。而在模型的实际部署与应用过程中,又需要实现数据的跨域、跨介质灵活调度,以及高质量数据集的高效管理,这对存储系统的灵活性、安全性及数据的可持续访问能力构成了新的挑战。

在近期举办的中国数据与存储峰会AI+存储协同发展论坛上,分布式存储产品总监张业兴发表了题为“数聚存储,智慧未来”的演讲。演讲中,张业兴不仅回顾了过去一年人工智能领域的迅猛发展态势,还深入阐述了浪潮信息在这一背景下如何精心布局新产品、新技术和新方案。

AI时代:存储的转型与重塑

人工智能已被提升至国家战略的高度,成为驱动新质生产力发展的关键力量。张业兴指出,数据作为一种新型生产要素,不仅是劳动工具,还能创造经济价值。随着数据的迅猛增长和摩尔定律的持续推动,人工智能正步入一个爆发式增长的阶段,特别是在GPU市场规模及智能算力领域,展现出了惊人的增长潜力。据预测,至2028年,全球GPU市场规模有望达到2461.5亿美元,而中国市场的规模也将攀升至459亿美元,年复合增长率高达32.8%。这一趋势清晰地表明,人工智能正引领着第四次工业革命,对经济社会产生着广泛而深远的影响。

在人工智能时代的大背景下,存储系统的角色已悄然转变,它不再是单纯的数据存储容器,而是成为了推动人工智能发展的核心组件。随着大模型技术的蓬勃发展,存储系统正面临着前所未有的挑战。在大模型市场的初期布局中,已有超过400家厂商争相涌入,模型训练的“速度”成为了竞争的关键。为了提高GPU的利用效率,存储系统必须能够提供TB级的高带宽和百万级的高IOPS,以确保模型训练的高效运行。

此外,随着模型在各行业的落地,数据的跨域和跨介质调动变得至关重要,存储系统需要实现全局命名空间的管理,以支持大规模数据的高效汇集和利用。同时,在大模型的行业化落地过程中,为了提升通用模型的专业化能力,高质量且可重复利用的数据集成为了不可或缺的资源。数据的安全存储与可持续性访问能力成为了存储系统必须满足的重要要求。

AS13000G7:解锁存储潜能,赋能AI未来

针对上述挑战,浪潮信息推出了分布式融合存储平台AS13000G7,在性能优化、融合互通、韧性保障等多个维度进行了技术创新。

在性能优化方面,AS13000G7通过数控分离架构,减少了数据在转发和拷贝过程中的延迟,单流带宽可达15GB/s,单节点带宽超过100GB/s,相比传统数控一体架构性能提升60%以上。此外,AS13000G7能够智能识别大IO和小IO,通过切片处理和聚合处理,将不同规模的数据形成统一的数据团,并存入全局缓存中,实现小IO性能提升5倍。同时,数据缓存预读功能能够在训练过程中提前加载热点数据,进一步提升数据加载速度。另外,AS13000G7还设计了全用户态的轻量级IO站,利用多任务并行和无锁IO处理技术,实现了延迟降低40%,训练数据加载时间减少30%。

在近期发布的MLPerf Storage v1.0 AI存储基准测试中,AS13000G7参与了八项测试并获得了五项全球第一的成绩,如3D-UNet测试中,支持264个模拟加速器,GPU利用率超90%时提供360GB每秒带宽,单节点带宽超120GB每秒;在CosmoFlow模型测试中,样本读取时间极短,单客户端和多客户端分别提供了18GB/s和52GB/s的带宽。

在融合互通方面,AS13000G7支持多种接入协议,如NFS和S3等,并通过复原数据管理实现文件和对象数据的协议互通、语义无损以及性能一致,避免了数据格式转换和多份存储的问题,为用户节省了高达50%的存储空间。同时,AS13000G7还建立了全局统一命名空间,纳管所有数据,实现跨域、跨介质和跨协议的灵活调动,提供统一数据视图,并支持10亿级文件秒级检索,有效解决了数据孤岛问题,方便用户数据访问与管理。

在韧性保障方面,AS13000G7定期进行亚健康检测,并通过内部冗余保护机制实现免迁移快速重构,将TB级重构时间降至5分钟内,每次故障恢复时间降低90%。此外,AS13000G7运用AIOps算法预测磁盘故障、容量趋势、性能趋势和SSD寿命,其中磁盘故障预测准确率达98%以上,误报率仅0.007%。在数据安全层面,AS13000G7设置了五层系统防护,采用快筛机器学习和深筛深度学习算法来检测恶意软件,漏报率仅为0.029%,误报率为0.33%。

面向大模型应用,基于AS13000G7的AI存储解决方案,整合不同盘位存储设备形成统一资源池,提供高性能、高利用率和高韧性,满足数据全生命周期需求。结合AI资源调度平台,提升数据预读加载效率30%,已服务众多AIGC客户。

在上海某高校的应用案例中,由于该校拥有多个与AI相关的学科,数据导入呈现出多元多态的特点,业务需求也涵盖了数据的汇集、处理、训练和推理等多个环节。浪潮信息为其提供32节点GPU服务器作为计算支持,并配置20个节点的AS13000G7 24盘位全闪节点作为存储资源池,实现对象文件融合存储,降低总体拥有成本(TCO)达30%,大带宽高IOPS的特性支持了模型毫秒级读写,进一步缩短训练等待时间40%。

AS13000G7分布式融合存储平台以其高性能、高效率和高韧性,成为支持人工智能发展的理想选择。在人工智能蓬勃发展的时代,浪潮信息将凭借其卓越的产品和解决方案,积极应对挑战,抓住机遇,为构建智慧未来奠定了坚实的数据存储基础,成为行业发展的重要引领者。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    476

    浏览量

    25308
  • AI
    AI
    +关注

    关注

    89

    文章

    38171

    浏览量

    296888
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261625
  • 分布式存储
    +关注

    关注

    4

    文章

    182

    浏览量

    20107

原文标题:数聚存储,智慧未来:分布式存储在人工智能时代的创新与应用

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:23

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式存储系统应运而生,而Ceph作为开源分布
    的头像 发表于 07-14 11:15 727次阅读

    飞利信与浪潮信息达成战略合作

    近日,2025年浪潮信息北京ISP战略伙伴签约授牌仪式成功举办。浪潮信息与北京飞利信电子技术有限公司等22家战略合作伙伴达成签约,其中将面向北京人工智能应用大市场,在产品技术共创、行业场景深化及区域
    的头像 发表于 06-24 17:37 909次阅读

    曙光存储领跑中国分布式存储市场

    近日,赛迪顾问发布《中国分布式存储市场研究报告(2025)》,指出2024 年中国分布式存储市场首次超过集中式存储,规模达 198.2 亿元
    的头像 发表于 05-19 16:50 1011次阅读

    天瞳威视与浪潮信息达成战略合作,推进高阶智驾车载计算系统创新

    北京2025年3月22日 /美通社/ -- 近日,苏州天瞳威视电子科技有限公司与浪潮信息旗下苏州元脑智能科技有限公司达成战略合作协议。此次合作依托浪潮信息提供的车载算力平台硬件系统、底层软件环境
    的头像 发表于 03-27 16:55 551次阅读
    天瞳威视与<b class='flag-5'>浪潮信息</b>达成战略合作,推进高阶智驾车载计算系统创新

    分布式存储有哪几种类型?

    分布式存储有哪几种类型?分布式存储系统是一种将数据分散存储多台独立节点上的技术,根据数据模型可
    的头像 发表于 02-20 11:00 1127次阅读

    浪潮信息存储SATA SSD:技术创新引领数据存储新时代

    智慧时代,数据存储需求日益增长,对存储产品的性能和稳定性提出了更高要求。浪潮信息存储,作为行业内的佼佼者,积极响应市场需求,通过自主研发,
    的头像 发表于 02-07 13:41 1019次阅读

    浪潮信息存储SATA SSD:以技术创新,开启数据存储新篇章

    北京2025年1月23日 /美通社/ -- 全球数字化转型的浪潮中,数据已成为驱动社会进步和创新的核心动力。随着互联网、人工智能、大数据等技术的飞速发展,全球数据量呈现爆炸增长。企
    的头像 发表于 01-24 10:02 712次阅读

    浪潮信息SATA SSD推动数据存储技术发展

    全球数字化转型的浪潮中,数据已成为驱动社会进步和创新的核心动力。随着互联网、人工智能、大数据等技术的飞速发展,全球数据量呈现爆炸增长。企业数据中心、云计算平台以及个人用户的数字化需
    的头像 发表于 01-22 18:02 1120次阅读

    分布式云化数据库有哪些类型

    分布式云化数据库有哪些类型?分布式云化数据库主要类型包括:关系型分布式数据库、非关系型分布式数据库、新SQL分布式数据库、以列方式
    的头像 发表于 01-15 09:43 882次阅读

    浪潮信息与智源研究院携手共建大模型多元算力生态

    近日,浪潮信息与北京智源人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛,推动人工智能
    的头像 发表于 12-31 11:49 877次阅读

    浪潮信息剖析智能时代数据存储领域面临的挑战与机遇

    在当今数字化时代,算力与存力的协同增长已成为驱动各行各业发展的关键力量。特别是人工智能(AI)这一前沿领域,随着数据量的爆炸增长,对存储
    的头像 发表于 12-30 09:43 1199次阅读

    基于ptp的分布式系统设计

    现代分布式系统中,精确的时间同步对于确保数据一致性、系统稳定性和性能至关重要。PTP(Precision Time Protocol)是一种网络协议,用于分布式系统中实现高精度的时
    的头像 发表于 12-29 10:09 978次阅读

    浪潮信息与17家元脑伙伴共签亿级分销协议

    。 此次签约标志着浪潮信息与这些元脑伙伴将在产品技术创新、市场拓展及解决方案等多个领域展开深入合作。双方将充分发挥各自优势,共同推动技术革新,加速智能化转型的步伐,为千行百业的数字化转型注入强劲动力。
    的头像 发表于 12-25 15:46 1197次阅读