0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息智能业务生产创新平台提升大模型算力平台使用效率

浪潮AIHPC 来源:浪潮AIHPC 2023-07-03 11:15 次阅读

日前,2023全球人工智能产品应用博览会在苏州开幕。浪潮信息智能业务生产创新平台AIStation凭借领先的资源调度与平台管理能力,有效提升大模型算力平台使用效率,荣获智博会核心奖项“产品金奖”。此次获奖,不仅体现了AIStation在大模型算力与业务支撑方面的领先性,也体现了产业对大模型算力平台效率的高度关注。

提升大模型算力平台使用效率

当前,以大模型为代表的生成式AI技术正在加速发展并革新各行业智能转型路径。生成式AI创新需要基于海量数据集,在拥有成百上千加速卡的AI服务器集群上对千亿级参数的AI大模型进行分布式训练。如何发挥大模型算力平台效能、抑制性能损耗,以高效完成AI大模型的训练部署,已成为AIGC时代的新挑战。

作为专为人工智能开发和部署提供全流程支持的端到端平台,AIStation能够以强大的资源调度和管理能力助力客户加速AI大模型开发与部署,通过对计算资源、数据资源、深度学习软件栈资源进行统一管理,有效提升大模型AI算力集群的使用效率。

一站式管理、毫秒级调度,集群利用率达70%

大模型训练需要构建包含计算、网络、存储、框架等在内的系统性分布式训练环境,传统的分散化管理不仅门槛高、效率低,且缺少针对性优化的整体调度系统,导致大模型计算平台的整体协同性较差,训练算力效率低。

针对分布式训练计算规模大、系统性强的特点,AIStation实现了异构算力集群的统一池化管理,通过自研分布式任务自适应系统将训练底层的计算、存储、网络环境自动化配置,并提供自定义修改基本超参数功能。通过多种资源高效管理和调度策略,AIStation能实现万卡集群的毫秒级调度,提升整体资源利用率到70%以上。

同时,AIStation集成主流的大模型训练框架,依托容器化技术,能够将运行环境、框架适配过程标准化、模块化,支持秒级构建运行环境,保障AI开发和AI业务的高效运行。

瓶颈优化、稳健容错,全流程加速大模型训练

针对大规模分布式训练过程中遇到的算力网络搭建、数据加速、网络通信优化等瓶颈,AIStation通过镜像分发加速、数据缓存加速、网络拓扑调度、资源动态弹性伸缩等特性,在提高计算资源利用率的同时加速整个训练过程。其中,AIStation通过数据缓存机制可让模型训练效率获得200%-300%的提升,并能够根据节点的数据缓存情况自动调度训练任务,避免训练数据重复下载,节省数据加载时间,与自研调度系统配合后,分布式训练线性加速比能够高达0.9,有效抑制多节点协同的性能损耗。

健壮性与稳定性是目前高效完成大模型训练的强要求。对此,AIStation通过提供全生命周期管理、故障容错、集群监控运维等一体化能力,能够实现训练异常和故障的全面检测和自动处理,有效缩短断点续训时间,降低复杂度,以持续稳定的训练降低大模型训练成本和周期。

高效调用,释放大模型应用价值

针对大模型训练完成后的应用部署,AIStation实现训练和推理的全打通,加快模型应用落地。针对大模型实际应用中的调用突发性,AIStation可根据推理服务资源需求的变化及时调整资源配给,根据实时业务的请求量实现秒级服务扩缩容,可支持百万级高并发的大模型AI推理服务场景,服务响应平均延迟低于1ms,突发的访问高峰的响应效率提升50%。

目前,AIStation已经在2457亿参数的“源”大模型训练实践中得到有效验证,支撑 “源”大模型的训练算力效率达44.8%,高于GPT-3的21.3%。同时,某大型商业银行基于AIStation打造的并行运算集群,凭借领先的大规模分布式训练支撑能力,荣获2022IDC“未来数字基础架构领军者”奖项。未来, AIStation平台将持续为各行业的大模型开发与部署提供高效的算力平台管理能力,加速AIGC技术迭代革新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    404

    浏览量

    23574
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47685
  • 数据集
    +关注

    关注

    4

    文章

    1178

    浏览量

    24351

原文标题:【开放试用】AIStation,有效提升大模型算力平台使用效率

文章出处:【微信号:浪潮AIHPC,微信公众号:浪潮AIHPC】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浪潮信息发布企业大模型开发平台"元脑企智"EPAI,加速AI创新落地

    北京2024年4月18日 /美通社/ -- 4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息发布企业大模型开发平台"元脑企智"EPAI(Enterprise P
    的头像 发表于 04-18 21:21 145次阅读
    <b class='flag-5'>浪潮信息</b>发布企业大<b class='flag-5'>模型</b>开发<b class='flag-5'>平台</b>&quot;元脑企智&quot;EPAI,加速AI<b class='flag-5'>创新</b>落地

    浪潮信息发布企业大模型开发平台“元脑企智”EPAI

    4月17日,在2024浪潮信息生态伙伴大会(IPF2024)上,浪潮信息重磅发布企业大模型开发平台“元脑企智”EPAI(Enterprise Platform of AI),为企业AI
    的头像 发表于 04-18 10:12 109次阅读
    <b class='flag-5'>浪潮信息</b>发布企业大<b class='flag-5'>模型</b>开发<b class='flag-5'>平台</b>“元脑企智”EPAI

    浪潮信息与英特尔合作推出一种大模型效率工具“YuanChat”

    3月26日,浪潮信息与英特尔正式宣布,浪潮信息“源2.0系列基础大模型”已和最新的英特尔® 酷睿™ Ultra处理器平台完成适配,本地推理速度提升
    的头像 发表于 03-27 13:50 204次阅读
    <b class='flag-5'>浪潮信息</b>与英特尔合作推出一种大<b class='flag-5'>模型</b><b class='flag-5'>效率</b>工具“YuanChat”

    潞晨科技Colossal-AI与浪潮信息AIStation完成兼容性互认证

    近日,潞晨科技的Colossal-AI大模型开发工具和浪潮信息的AIStation智能业务创新生产平台
    的头像 发表于 03-06 10:18 265次阅读

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率提升10倍

    北京2024年2月29日 /美通社/ -- 近日,潞晨科技Colossal-AI大模型开发工具与浪潮信息AIStation智能业务创新生产
    的头像 发表于 03-01 09:43 238次阅读
    潞晨科技Colossal-AI + <b class='flag-5'>浪潮信息</b>AIStation,大<b class='flag-5'>模型</b>开发<b class='flag-5'>效率</b><b class='flag-5'>提升</b>10倍

    XEDP与KeyarchOS完成浪潮信息澎湃技术认证

    澎湃技术认证。 经联合测试, 双方产品功能兼容性良好,整体运行流畅,性能表现优异,满足用户在云计算、大数据、人工智能等领域对企业级数据存储的多种需求。   浪潮信息澎湃技术认证是基于多元、创新的通用计算
    的头像 发表于 02-27 17:56 261次阅读
    XEDP与KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证

    喜田宁波与华侨大学信息学院校企合作创新模式—智能力控创新平台启动

    2023年12月15日,喜田宁波与华侨大学信息科学与工程学院校企合作再传喜讯,双方在喜田宁波总部隆重举行了“校企合作-智能力控创新平台”的合作签约及揭牌仪式。宁波鄞州区经信局张亚平局长、科技局张志刚
    的头像 发表于 01-26 08:30 377次阅读
    喜田宁波与华侨大学<b class='flag-5'>信息</b>学院校企合作<b class='flag-5'>创新</b>模式—<b class='flag-5'>智能</b>力控<b class='flag-5'>创新平台</b>启动

    浪潮信息澎湃认证:浪潮信息集中式存储携手仪电云i-stack云操作系统软件完成兼容性认证

    AS/HF系列产品完全兼容,满足功能需求,系统运行可靠稳定,性能表现优异。 浪潮信息澎湃技术认证 是浪潮信息基于自身多元、创新的通用计算平台,与供应链及软件服务等生态合作伙伴共同构建的
    的头像 发表于 12-08 16:40 333次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮信息</b>集中式存储携手仪电云i-stack云操作系统软件完成兼容性认证

    浪潮信息发布源2.0基础大模型,千亿参数全面开源

    11月27日,浪潮信息发布"源2.0"基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。
    的头像 发表于 11-28 09:10 463次阅读
    <b class='flag-5'>浪潮信息</b>发布源2.0基础大<b class='flag-5'>模型</b>,千亿参数全面开源

    大普微与keyarchOS完成浪潮信息澎湃技术认证

    云峦服务器操作系统keyarchOS满足兼容认证要求,整体运行稳定,在功能、性能及兼容性方面表现良好。     浪潮信息澎湃技术认证是基于多元、创新的通用计算平台,与供应链及软件服务等生态合作伙伴共同构建的产品互兼容性认证体系,
    的头像 发表于 10-11 01:47 304次阅读
    大普微与keyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技术认证

    浪潮信息澎湃认证:浪潮信息集中式存储携手达梦数据库管理系统V8完成兼容性认证

    ,满足功能需求,系统运行可靠稳定,性能表现优异。 浪潮信息澎湃技术认证 是浪潮信息基于自身多元、创新的通用计算平台,与供应链及软件服务等生态合作伙伴共同构建的产品兼容性认证体系,包含“
    的头像 发表于 09-27 17:10 374次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮信息</b>集中式存储携手达梦数据库管理系统V8完成兼容性认证

    东芝 MG10系列企业级SATA HDD获得浪潮信息澎湃技术兼容性认证

    书。 关于浪潮信息澎湃技术认证 浪潮信息澎湃技术认证是浪潮信息基于自身多元、创新的通用计算平台,与供应链及软件服务等生态合作伙伴共同构建的产
    的头像 发表于 09-22 19:35 452次阅读
    东芝 MG10系列企业级SATA HDD获得<b class='flag-5'>浪潮信息</b>澎湃技术兼容性认证

    浪潮信息发布大模型智算软件栈OGAI,为大模型创新打造高效生产

    的全栈全流程的智算软件栈。OGAI由浪潮信息基于大模型自身实践与服务客户的专业经验而开发,旨在为大模型研发与应用创新全力打造高效生产力,加速
    的头像 发表于 08-28 08:08 376次阅读

    美能光伏正式加入异质结技术产业化协同创新平台

    全国首个异质结技术产业化协同创新平台由7月20日正式成立,「美能光伏」成为平台的首批成员。该平台共有58家企业成员组成,且技术链条涵盖光伏产业的所有阶段。同心齐力联袂前行,「美能光伏」将携手
    的头像 发表于 08-19 08:37 310次阅读
    美能光伏正式加入异质结技术产业化协同<b class='flag-5'>创新平台</b>

    浪潮信息澎湃认证:浪潮分布式存储携手博雅云OneSRM SMP存储管理平台完成兼容性认证

    融合存储AS13000系列产品完全兼容,满足功能需求,系统运行可靠稳定,性能表现优异。 浪潮信息澎湃技术认证 是浪潮信息基于自身多元、创新的通用计算平台,与供应链及软件服务等生态合作伙
    的头像 发表于 07-12 09:15 375次阅读
    <b class='flag-5'>浪潮信息</b>澎湃认证:<b class='flag-5'>浪潮</b>分布式存储携手博雅云OneSRM SMP存储管理<b class='flag-5'>平台</b>完成兼容性认证