随着大模型参数规模迈向万亿级,智能体应用日益普及,企业AI落地正面临严峻考验:超长上下文导致首字延迟飙升,重复计算严重浪费宝贵算力,海量模型权重与数据集对存储性能提出极限要求。行业亟需能同时解决“存、算、用”瓶颈的一体化方案。
在此背景下,中科曙光与星环科技联合推出面向大模型时代的国产化智能体运营平台解决方案。该方案以中科曙光自主研发的ParaStor分布式存储系统与星环LLMOps大模型平台为核心,旨在破解当前智能应用面临的算力瓶颈、数据IO延迟与高昂成本等核心挑战,为企业提供全栈国产化、高性能、易运维的AI基础设施。

ParaStor:极致存力释放AI算力潜能
作为专为AI与高性能计算设计的数据加速引擎,ParaStor在此次合作中扮演了关键角色,其价值主要体现在三个层面:
打破数据IO瓶颈,为算力“铺就高速公路”。ParaStor单框可提供高达160GB/s的带宽与500万IOPS的极致性能,访问延迟低于1毫秒,这确保了在处理1M以上超长上下文时,海量数据能够被瞬间加载至计算单元,从根本上解决了因存储读写慢导致的算力等待与首字延迟过高的问题;其独有的XDS(X Direct Storage)技术,允许数据直接在GPU显存与后端存储间高速交互,将数据加载延迟降低50%以上,CPU占用率减少30%-70%,让算力得以全力投入模型计算。
创新KV Cache卸载,实现“降本增效”的革命性突破。ParaStor原生支持KV Cache offload功能,能将推理过程中产生的KV缓存数据从GPU显存智能卸载至后端高性能存储。此举显著降低对高端GPU显存的依赖,使单卡服务更多并发用户,单用户算力成本降低超40%;同时通过避免重复编码,生成速度提升2至10倍,极大优化用户体验与资源利用率。
构建高可靠、易扩展的AI数据湖。ParaStor采用全自研的分布式架构,支持从10TB到100PB的无缝平滑扩容,完全匹配大模型业务数据量指数级增长的趋势。通过多副本与纠删码冗余机制,数据可靠性高达99.9999%。其统一存储能力全面支持文件、对象、块、HDFS等多种协议,满足从原始语料加工、模型训练checkpoint保存到知识库向量检索等AI全流程数据存取需求。
存算用一体,打造国产化AI落地新范式
本次合作实现了“存”与“算”、“基础设施”与“运营平台”的深度耦合。中科曙光提供的包含高性能国产算力与ParaStor存力的完整底座,与星环LLMOps平台无缝集成,形成覆盖“数据存储-算力调度-模型训推-智能体运营-监控管理”的全生命周期闭环。
通过ParaStor的BurstBuffer智能缓存加速技术,热点数据可被主动预取至计算节点本地NVMe SSD,实现近存计算,有效应对训练任务爆发式IO压力。ParaStor的可视化运维管理与星环平台的集群管理功能联动,将运维效率提升超过50%。
该方案全栈采用国产化硬件与自主研发软件,符合国家关键信息基础设施安全可控要求,为政务、金融、科研、工业等对数据安全与合规性要求极高的领域,提供了可规模化部署的AI落地方案。
中科曙光始终致力于构建安全、可靠、先进的国产算力基础设施。未来,公司将继续携手星环科技这样的优秀生态伙伴,不断深化“存算用”一体化的技术内涵,共同推动国产AI软硬件生态的繁荣发展。
-
AI
+关注
关注
91文章
41972浏览量
303064 -
智能体
+关注
关注
1文章
617浏览量
11656 -
中科曙光
+关注
关注
5文章
529浏览量
19004 -
大模型
+关注
关注
2文章
3863浏览量
5296
原文标题:星环科技 × 中科曙光,破解大模型智能体存算瓶颈
文章出处:【微信号:sugoncn,微信公众号:中科曙光】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
2026北京车展|美格智能发布国产化5G舱联AI模组,打造国产化座舱智能体解决方案
海光信息携手麒麟软件与数码大方重磅推出全国产化工业设计一体机解决方案
中科曙光助力海南师范大学全栈国产超智融合计算平台正式上线
龙芯双平台信创底座,国产化工控机全功能拓展接口搭配星闪无线
强强联合|千视电子与 VINGLOOP 共建国产化 AV-over-IP 整体解决方案
曙光云携手Moltbot革新行业智能体
Neway微波产品的国产化替代方案
NVMe over Fabrics 国产 IP:高性能网络存储解决方案
OBOO鸥柏丨65寸立体式国产化KylinOS麒麟系统触摸屏别墅智能一体机展示智能
福州移动与华为联合推出国内首个端到端智能化体验经营系统
坤驰科技携国产化MTCA解决方案,亮相大科学装置控制系统研讨会
全国产化5G智能模组SRM928发布!
星环科技与中科曙光联合推出国产化智能体运营平台解决方案
评论