0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息分布式存储在人工智能领域的应用

浪潮存储 来源:浪潮存储 2024-11-26 13:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着AI技术机器学习演进至深度学习,并进一步迈向生成式AI的新阶段,算法、算力及数据需求呈现出爆炸式增长态势。大模型爆发初期,众多企业布局,要求存储提供高带宽、高IOPS和低时延,以确保模型能够快速有效地进行训练。而在模型的实际部署与应用过程中,又需要实现数据的跨域、跨介质灵活调度,以及高质量数据集的高效管理,这对存储系统的灵活性、安全性及数据的可持续访问能力构成了新的挑战。

在近期举办的中国数据与存储峰会AI+存储协同发展论坛上,分布式存储产品总监张业兴发表了题为“数聚存储,智慧未来”的演讲。演讲中,张业兴不仅回顾了过去一年人工智能领域的迅猛发展态势,还深入阐述了浪潮信息在这一背景下如何精心布局新产品、新技术和新方案。

AI时代:存储的转型与重塑

人工智能已被提升至国家战略的高度,成为驱动新质生产力发展的关键力量。张业兴指出,数据作为一种新型生产要素,不仅是劳动工具,还能创造经济价值。随着数据的迅猛增长和摩尔定律的持续推动,人工智能正步入一个爆发式增长的阶段,特别是在GPU市场规模及智能算力领域,展现出了惊人的增长潜力。据预测,至2028年,全球GPU市场规模有望达到2461.5亿美元,而中国市场的规模也将攀升至459亿美元,年复合增长率高达32.8%。这一趋势清晰地表明,人工智能正引领着第四次工业革命,对经济社会产生着广泛而深远的影响。

在人工智能时代的大背景下,存储系统的角色已悄然转变,它不再是单纯的数据存储容器,而是成为了推动人工智能发展的核心组件。随着大模型技术的蓬勃发展,存储系统正面临着前所未有的挑战。在大模型市场的初期布局中,已有超过400家厂商争相涌入,模型训练的“速度”成为了竞争的关键。为了提高GPU的利用效率,存储系统必须能够提供TB级的高带宽和百万级的高IOPS,以确保模型训练的高效运行。

此外,随着模型在各行业的落地,数据的跨域和跨介质调动变得至关重要,存储系统需要实现全局命名空间的管理,以支持大规模数据的高效汇集和利用。同时,在大模型的行业化落地过程中,为了提升通用模型的专业化能力,高质量且可重复利用的数据集成为了不可或缺的资源。数据的安全存储与可持续性访问能力成为了存储系统必须满足的重要要求。

AS13000G7:解锁存储潜能,赋能AI未来

针对上述挑战,浪潮信息推出了分布式融合存储平台AS13000G7,在性能优化、融合互通、韧性保障等多个维度进行了技术创新。

在性能优化方面,AS13000G7通过数控分离架构,减少了数据在转发和拷贝过程中的延迟,单流带宽可达15GB/s,单节点带宽超过100GB/s,相比传统数控一体架构性能提升60%以上。此外,AS13000G7能够智能识别大IO和小IO,通过切片处理和聚合处理,将不同规模的数据形成统一的数据团,并存入全局缓存中,实现小IO性能提升5倍。同时,数据缓存预读功能能够在训练过程中提前加载热点数据,进一步提升数据加载速度。另外,AS13000G7还设计了全用户态的轻量级IO站,利用多任务并行和无锁IO处理技术,实现了延迟降低40%,训练数据加载时间减少30%。

在近期发布的MLPerf Storage v1.0 AI存储基准测试中,AS13000G7参与了八项测试并获得了五项全球第一的成绩,如3D-UNet测试中,支持264个模拟加速器,GPU利用率超90%时提供360GB每秒带宽,单节点带宽超120GB每秒;在CosmoFlow模型测试中,样本读取时间极短,单客户端和多客户端分别提供了18GB/s和52GB/s的带宽。

在融合互通方面,AS13000G7支持多种接入协议,如NFS和S3等,并通过复原数据管理实现文件和对象数据的协议互通、语义无损以及性能一致,避免了数据格式转换和多份存储的问题,为用户节省了高达50%的存储空间。同时,AS13000G7还建立了全局统一命名空间,纳管所有数据,实现跨域、跨介质和跨协议的灵活调动,提供统一数据视图,并支持10亿级文件秒级检索,有效解决了数据孤岛问题,方便用户数据访问与管理。

在韧性保障方面,AS13000G7定期进行亚健康检测,并通过内部冗余保护机制实现免迁移快速重构,将TB级重构时间降至5分钟内,每次故障恢复时间降低90%。此外,AS13000G7运用AIOps算法预测磁盘故障、容量趋势、性能趋势和SSD寿命,其中磁盘故障预测准确率达98%以上,误报率仅0.007%。在数据安全层面,AS13000G7设置了五层系统防护,采用快筛机器学习和深筛深度学习算法来检测恶意软件,漏报率仅为0.029%,误报率为0.33%。

面向大模型应用,基于AS13000G7的AI存储解决方案,整合不同盘位存储设备形成统一资源池,提供高性能、高利用率和高韧性,满足数据全生命周期需求。结合AI资源调度平台,提升数据预读加载效率30%,已服务众多AIGC客户。

在上海某高校的应用案例中,由于该校拥有多个与AI相关的学科,数据导入呈现出多元多态的特点,业务需求也涵盖了数据的汇集、处理、训练和推理等多个环节。浪潮信息为其提供32节点GPU服务器作为计算支持,并配置20个节点的AS13000G7 24盘位全闪节点作为存储资源池,实现对象文件融合存储,降低总体拥有成本(TCO)达30%,大带宽高IOPS的特性支持了模型毫秒级读写,进一步缩短训练等待时间40%。

AS13000G7分布式融合存储平台以其高性能、高效率和高韧性,成为支持人工智能发展的理想选择。在人工智能蓬勃发展的时代,浪潮信息将凭借其卓越的产品和解决方案,积极应对挑战,抓住机遇,为构建智慧未来奠定了坚实的数据存储基础,成为行业发展的重要引领者。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    490

    浏览量

    25481
  • AI
    AI
    +关注

    关注

    91

    文章

    41059

    浏览量

    302561
  • 人工智能
    +关注

    关注

    1820

    文章

    50314

    浏览量

    266868
  • 分布式存储
    +关注

    关注

    4

    文章

    182

    浏览量

    20211

原文标题:数聚存储,智慧未来:分布式存储在人工智能时代的创新与应用

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入人工智能课程(华清远见)

    嵌入 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:
    发表于 04-16 18:47

    人工智能多模态与视觉大模型开发实战 - 2026必会

    视觉大模型特训:从原理到部署一站学会 科技飞速发展的当下,视觉大模型已成为人工智能领域的一颗璀璨明星,广泛应用于安防监控、自动驾驶、医疗影像分析等众多
    发表于 04-15 16:06

    Dante数字化会议系统、分布式视频系统、“AI”人工智能在会议运维中的应用

    Dante数字化会议系统、分布式视频系统、“AI”人工智能在会议运维中的应用
    的头像 发表于 02-08 14:19 1586次阅读

    分布式 IO 选型注意事项

    工业 4.0 浪潮推动下,分布式 IO 作为工业互联的核心底层设备,已成为制造业实现设备互联、数据采集、柔性生产的关键支撑。本文将助力企业避开选型误区,最大化发挥分布式 IO 的应用
    的头像 发表于 12-30 14:14 510次阅读
    <b class='flag-5'>分布式</b> IO 选型注意事项

    【节能学院】Acrel-1000DP分布式光伏监控系统奉贤平高食品 4.4MW 分布式光伏中应用

    摘要:“双碳”和新型电力系统建设背景下,分布式光伏接入比例不断提高,对配电网电压、调度运行及调峰等环节造成强烈冲击。本文设计包含平台层、设备层二层架构体系的分布式光伏管控平台,以及小容量工商业
    的头像 发表于 08-23 08:04 3654次阅读
    【节能学院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏监控系统<b class='flag-5'>在</b>奉贤平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中应用

    分布式光伏发电监测系统技术方案

    分布式光伏发电监测系统技术方案 柏峰【BF-GFQX】一、系统目标 :分布式光伏发电监测系统旨在通过智能化的监测手段,实现对分布式光伏电站的全方位、高精度、实时化管理。该系统能
    的头像 发表于 08-22 10:51 3462次阅读
    <b class='flag-5'>分布式</b>光伏发电监测系统技术方案

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:23

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储的性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时数据库、AI训练、高性能计算)的关键挑战。
    的头像 发表于 08-04 11:34 1815次阅读
    一键部署无损网络:EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>效能革命

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式存储系统应运而生,而Ceph作为开源分布
    的头像 发表于 07-14 11:15 1207次阅读

    飞利信与浪潮信息达成战略合作

    近日,2025年浪潮信息北京ISP战略伙伴签约授牌仪式成功举办。浪潮信息与北京飞利信电子技术有限公司等22家战略合作伙伴达成签约,其中将面向北京人工智能应用大市场,在产品技术共创、行业场景深化及区域
    的头像 发表于 06-24 17:37 1237次阅读

    分布式IO选型指南:2025年分布式无线远程IO品牌及采集控制方案详解

    近年来,随着工业物联网(IIoT)、智能制造和工业4.0的深入发展,分布式无线远程IO模块工业控制领域的应用愈发广泛。这种模块通过无线方式实现远程数据采集与控制,极大地提高了工业设施
    的头像 发表于 06-23 09:48 1467次阅读

    【RK3588】嵌入人工智能实验箱——智启高校产教融合新平台

    AIoT技术驱动产业变革的浪潮中,嵌入人工智能已成为工业物联网、智慧交通、智慧医疗等领域创新突破的关键引擎。飞凌嵌入
    的头像 发表于 06-11 14:29 1785次阅读
    【RK3588】嵌入<b class='flag-5'>式</b><b class='flag-5'>人工智能</b>实验箱——智启高校产教融合新平台

    曙光存储领跑中国分布式存储市场

    近日,赛迪顾问发布《中国分布式存储市场研究报告(2025)》,指出2024 年中国分布式存储市场首次超过集中式存储,规模达 198.2 亿元
    的头像 发表于 05-19 16:50 1451次阅读

    兆芯+图云创智—可信分布式存储系统解决方案

    图云创智分布式存储系统采用全分布式设计与先进的存储虚拟化技术相结合,由多个独立的兆芯 x86 服务器作为存储节点,联合道熵
    的头像 发表于 04-23 10:29 1197次阅读
    兆芯+图云创智—可信<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统解决方案