0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智慧有数 浪潮信息发布生成式AI存储解决方案

全球TMT 来源:全球TMT 作者:全球TMT 2023-07-11 09:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当前,生成式AI(AIGC)已经成为AI产业化发展的主战场,随着大模型参数量和数据量的爆发式增长,多源异构数据的传、用、管、存,正在成为制约生成式AI落地的瓶颈之一。为了化解生成式AI的数据存储与管理瓶颈,浪潮信息在"数智未来"AIGC数据应用创新论坛上,正式发布面向生成式AI的存储解决方案,该方案以极致融合、极致性能、极致节能,和热温冷冰四级数据全生命周期管理,助力开启生成式AI新局面,创造智慧时代新机遇。

生成式AI亟待突破多源异构和存储性能瓶颈

生产式AI是人工智能从1.0时代进入2.0时代的重要标志,其具备强大的认知智能,在搜索引擎、艺术创作、影音游戏,以及金融、教育、医疗、工业等领域有着广阔的应用前景。Gartner预测,到2023年将有20%的内容被AIGC所创建;到2025 年人工智能生成数据占比将达到10%。据分析师预测,到2032年,生成式人工智能市场规模将达到2,000亿美元,占据人工智能支出总额的约20%,显著高出当前的5%。换言之,未来十年市场规模可能每两年就会翻一番。

生成式AI主要应用场景涵盖文本生成、语音生成、图片生成、视频生成、代码生成、虚拟人生成等,在每种应用的背后是基于行业上下游对数据进行采集、标注、训练、推理、归档,其特征是数据量大、多元数据类型复杂、服务协议多样、性能要求苛刻、要求服务持续在线。生成式AI对数据存储提出如下挑战:

异构数据的融合:生成式AI训练模型的数据呈现来源多、格式多的多源异构现状,传统存储面向单一数据类型设计,需要以搬移数据的方式实现多协议访问,存储成为应用平台的关键瓶颈;

持续的低延迟与高带宽:模型训练过程中,频繁地从数据集取Token,每个Token一般4字节,实时高并发小IO性能需要极低的延迟;存储模型Checkpoint时,为Checkpoint数据可快速写入,需要高带宽;

EB级大容量存储需求:越多的数据投喂结果越精准的工作原理,决定了大模型训练存在深度学习网络层数多、连接多、参数和数据集种类复杂、数据量大的特征,随着模型参数和数据量的快速增长,对于存储的大容量和扩展需求也迫在眉睫。

数据存储产业需要进行全方位的技术升级,通过在多源异构融合、数据高速传输、海量数据管理等方面持续创新,打造专业的生成式AI存储产品与解决方案。

浪潮信息让生成式AI智慧有数

浪潮信息是最早布局大模型的企业之一,打造了算力、算法、数据全栈的解决方案能力。在数据存储领域,浪潮信息准确识别行业痛点、积极布局,经过持续攻关,在融合存储架构、系统性能设计、数据全生命周期管理算法等方面不断突破,打造出生成式AI存储解决方案。

浪潮信息生成式AI存储解决方案基于AS13000融合存储系统,可以支撑AIGC产业上中下游业务应用,并针对不同业务阶段的数据存储需求,提供热温冷冰四级存储,实现数据在各级存储间自动流转。用高性能节点形态来满足数据训练、数据推理两个阶段的高带宽、低延时、高并行读写性能存储需求,用大容量节点形态来满足数据采集、数据准备、数据归档三个阶段的海量多元数据存储需求,方案具备极致融合、极致性能、极致节能三大能力,以及热、温、冷、冰四级数据全生命周期存储管理能力,助力生成式AI突破海量数据存力瓶颈,加速释放数据的价值。

极致融合。为了应对不同模态的多样性需求,浪潮信息提出"协议互通、数据融合"设计理念,一个集群内支持多个存储池,一个存储池内支持文本、图片、音频、视频等多种类型数据存储,一份数据又可以被前端不同业务场景同时以文件、对象、大数据、视频四种存储协议进行并行访问。用一套存储实现支持多模态场景应用,免除了数据跨应用时的复制,实现真正意义上非结构化数据的协议互访互通,让数据融合。

极致性能。AIGC场景数据类型多样化,文件大小不一、数量多,且读写频繁,对存储系统的百GB级高带宽、百万级IOPS需求成了常态。浪潮信息在软件方面,通过数控分离架构减少东西向数据量的转发,通过GDS、RMDA技术缩短I/O路径,通过SPDK、缓存零拷贝技术减少I/O路径上的数据拷贝,以及基于自研NVMe SSD开发的盘控协同技术,减少I/O访问SSD盘的次数,使存储性能得到进一步释放。在硬件方面,优化IO路径通道,均衡IO路径,最大化发挥硬件性能,全闪单节点带宽超过50GB/s,IOPS超过50万;此外,创新性地引入双控全闪节点,带宽超100GB/s,IOPS超100万,真正使系统具备千万级IOPS、EB级带宽,充分满足AIGC场景对存储系统的苛刻要求。

极致节能。浪潮信息近期最新发布了G7硬件平台,存储专用的液冷服务器涵盖性能型和容量型,且均采用模块化冷板组件设计模式。在系统方案层面,浪潮信息具有风液式、液液式等完善的端到端解决方案,能够为用户全方位打造液冷数据中心交钥匙工程,并且完成了业界首次液冷整机柜批量交付,实现PUE<1.1。

端到端的数据全生命周期管理。除了三大"极致"能力之外,得益于"资源互通、管理融合"的设计理念,浪潮生成式AI存储方案基于闪存、磁盘、磁带、光盘四种介质提供热温冷冰四种存储资源,通过资源互通实现数据全生命周期管理。基于数据的热度识别,自动释放在线存储空间,可以将海量数据自动归档到光盘库,降低长期存储成本;实现冷数据的分钟级快速回调,满足0~4级应用的存储需求。四种介质、四类存储节点,提供热温冷冰自动流转,满足各类应用的灵活配置需求,通过性能型、均衡型、容量型、高密容量型四种机型的按需灵活配置,进一步降低整体投入。

目前,浪潮信息生成式AI存储解决方案已经在全球领先的中文语言大模型"源1.0"中成功落地,面对千亿级参数量和数据量带来的挑战,浪潮信息通过AS13000高吞吐并行存储系统实现了多存储协议互通、数据融合,利用全闪的极致性能,助力"源1.0"大模型实现了16天完成训练的超高效率。国内AI独角兽公司采用浪潮信息提供的并行文件存储,承载5000亿参数量的NLP语言类大模型的数据集Token和CheckPoint文件,轻松应对大/小文件的读写挑战,配置AS13000全闪存储集群,支持高性能RocE组网和GPU直通存储功能,带宽超过300GB、存储性能超过350万 IOPS,保证存储集群的高可用与敏捷扩容。

面对生成式AI掀起的变革热潮,谁能掌握数字化变革的先机,谁就能把握未来AI革命的致胜关键,而数据底座将成为千行百业创新变革的重要基石。浪潮信息存储秉承"存储即平台"的产品理念,精耕数据存储产品与解决方案,携手合作伙伴,助力生成式AI在金融虚拟客服、图片编辑设计、智能驾驶、跨模态检索等场景的落地,激活数据要素新潜能,驾驭智慧化转型新趋势,在机遇与挑战并存的新格局下,为行业转型注入新价值、新动能。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4693

    浏览量

    89569
  • 浪潮
    +关注

    关注

    1

    文章

    476

    浏览量

    25304
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296542
  • 生成式AI
    +关注

    关注

    0

    文章

    537

    浏览量

    1021
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    飞利信与浪潮信息达成战略合作

    近日,2025年浪潮信息北京ISP战略伙伴签约授牌仪式成功举办。浪潮信息与北京飞利信电子技术有限公司等22家战略合作伙伴达成签约,其中将面向北京人工智能应用大市场,在产品技术共创、行业场景深化及区域
    的头像 发表于 06-24 17:37 907次阅读

    筑基&quot;AI+人才&quot;培养,浪潮信息携手元脑伙伴拓尔思推出智慧教育新平台

    北京2025年3月22日 /美通社/ -- 近期,元脑生态伙伴拓尔思信息技术股份有限公司(以下简称:拓尔思)携手浪潮信息,联合为高校AI人才培养推出"AI创新培养综合服务平台",基于该
    的头像 发表于 03-27 16:56 630次阅读
    筑基&quot;<b class='flag-5'>AI</b>+人才&quot;培养,<b class='flag-5'>浪潮信息</b>携手元脑伙伴拓尔思推出<b class='flag-5'>智慧</b>教育新平台

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入开发

    助力 AI、智能制造和物联网行业的发展。未来,Banana Pi 将继续深化与Renesas的技术合作,推动更多高性能嵌入解决方案的落地。 ” BPI-AI2N开发板赋能多场景应用,
    发表于 03-19 17:54

    浪潮信息存储SATA SSD:技术创新引领数据存储新时代

    解决方案。 近期,浪潮信息推出了自研的SATA SSD新品——TS6000G1。这款SSD产品凭借出色的性能和稳定的品质,成为了浪潮信息存储产品线中的一颗璀璨明珠。 TS6000G1采
    的头像 发表于 02-07 13:41 1006次阅读

    浪潮信息存储SATA SSD:以技术创新,开启数据存储新篇章

    计算平台以及个人用户的数字化需求,迫切需要高效、可靠的存储解决方案浪潮信息存储积极响应市场需求,通过自主研发不断积累技术优势,推出了SATA、NVMe、双端口、ZNS等全系列
    的头像 发表于 01-24 10:02 698次阅读

    浪潮信息SATA SSD推动数据存储技术发展

    在全球数字化转型的浪潮中,数据已成为驱动社会进步和创新的核心动力。随着互联网、人工智能、大数据等技术的飞速发展,全球数据量呈现爆炸增长。企业数据中心、云计算平台以及个人用户的数字化需求,迫切需要高效、可靠的存储
    的头像 发表于 01-22 18:02 1112次阅读

    浪潮信息存储中标运营商备份一体机项目

    的安全防护手段已难以满足当前的需求,信息安全防护亟待革新。 在此背景下,零信任安全理念以其前瞻性和创新性,为运营商的信息安全防护提供了新的思路。近日,浪潮信息存储在国内某运营商的备份一
    的头像 发表于 01-08 11:17 1170次阅读

    博研智通携手浪潮信息打造香港智慧交通

    近日,为了将有限的物理空间发挥到极致,香港率先在多个繁华地段的十字路口升级为智慧路口。通过浪潮信息助力博研智通打造的「云边协同的全息智慧路口整体解决方案」,实现了灯随车变、灯候人行的智
    的头像 发表于 01-03 11:40 878次阅读

    浪潮信息与智源研究院携手共建大模型多元算力生态

    近日,浪潮信息与北京智源人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛,推动
    的头像 发表于 12-31 11:49 873次阅读

    浪潮信息剖析智能时代数据存储领域面临的挑战与机遇

    在当今数字化时代,算力与存力的协同增长已成为驱动各行各业发展的关键力量。特别是在人工智能(AI)这一前沿领域,随着数据量的爆炸增长,对存储系统的需求日益复杂和多样。近期,在首届CCF中国存储
    的头像 发表于 12-30 09:43 1194次阅读

    浪潮信息与智源研究院达成战略合作协议

    近日,浪潮信息与智源研究院达成战略合作协议,双方将紧密协作共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛。目前,智源Triton算子库FlagGems已
    的头像 发表于 12-26 10:25 896次阅读

    浪潮信息发布&quot;源&quot;Yuan-EB,刷新RAG检索最高成绩

    近日,浪潮信息AI领域取得了重大突破,成功发布了其嵌入模型"源"Yuan-EB(Yuan-embedding-1.0)。在备受瞩目的C-MTEB榜单中,"源"Yuan-EB凭借卓越的性能,一举夺得
    的头像 发表于 12-25 15:54 808次阅读

    浪潮信息与17家元脑伙伴共签亿级分销协议

    。 此次签约标志着浪潮信息与这些元脑伙伴将在产品技术创新、市场拓展及解决方案等多个领域展开深入合作。双方将充分发挥各自优势,共同推动技术革新,加速智能化转型的步伐,为千行百业的数字化转型注入强劲动力。 浪潮信息作为国内领先
    的头像 发表于 12-25 15:46 1191次阅读

    捷通达携手浪潮信息,ERP系统性能大幅提升

    的共同努力,捷通达成功将原有的SAP HANA系统升级为浪潮信息新一代SAP HANA数据库一体机解决方案。这一升级不仅大幅提升了系统的运行效率,更使得ERP系统的数据查询时间大幅缩短了约92%。 据统计,升级后的系统运行效率提升了70%,这一显著的提升
    的头像 发表于 12-24 14:36 896次阅读

    借助浪潮信息元脑企智EPAI高效创建大模型RAG

    能力,提高生成质量和可靠性。但企业构建知识检索系统并非易事,通常面临开发门槛高、生成内容差等难题。而借助浪潮信息元脑企智EPAI企业大模型开发平台,企业仅需三步即可高效创建大模型RAG,让企业内部积累的大量数据得到有效利用,唤醒
    的头像 发表于 12-19 14:32 1040次阅读
    借助<b class='flag-5'>浪潮信息</b>元脑企智EPAI高效创建大模型RAG