0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮信息发布大模型智算软件栈OGAI,为大模型创新打造高效生产力

全球TMT 来源:全球TMT 作者:全球TMT 2023-08-28 08:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

浪潮信息正式发布大模型智算软件栈 OGAI。OGAI (Open GenAI Infra)"元脑生智",是为大模型业务提供AI算力系统环境部署、算力调度保障及模型开发管理能力的全栈全流程的智算软件栈。OGAI由浪潮信息基于大模型自身实践与服务客户的专业经验而开发,旨在为大模型研发与应用创新全力打造高效生产力,加速生成式AI产业创新步伐。

大模型是当前通用人工智能产业发展创新的核心技术。目前国内已发布的生成式AI模型超过了100个,"百模争秀"的格局初现。但大模型从研发到应用的各环节中,依然面临诸多挑战,如大模型算力的系统全栈问题、兼容适配问题、性能优化问题等。

OGAI是浪潮信息从当前大模型算力建设、模型开发和应用落地的实际需求出发,秉承全栈全流程、算力充分释放、实战验证提炼的设计原则打造而成。OGAI由5层架构组成,从L0到L4分别对应基础设施层的智算中心OS、系统环境层的PODsys、调度平台层的AIStation、模型工具层的YLink和多模纳管层的MModel。

L0层智算中心OS:面向大模型算力服务的智能算力运管平台,满足多租户以裸金属为主的弹性AI算力运管需求。其中,高效的裸金属服务支持分钟级部署上千规模裸金属节点并按需进行弹性扩展,实现异构计算芯片、IB、RoCE高速网络、高性能存储等环境一键获取,并实现计算、网络、数据隔离以保障业务安全。

L1层PODsys:开源、高效、兼容、易用的智算集群系统环境部署方案。聚焦智算集群部署场景,从OS、驱动到系统监控可视化、资源调度等集群系统环境要素全面覆盖,选用最稳定和广泛兼容的软件版本,通过一系列脚本工具简化部署过程,缩短算力上线周期,并可向企业用户提供实施安装服务和集群性能校准的专家服务。

L2层AIStation:面向大模型开发的商业化人工智能算力调度平台。针对大模型训练中常见的训练中断难题,可实现训练异常快速定位,断点自动续训:通过快速定位芯片、网卡、通讯设备异常或故障,实现全局训练暂停保持,热备算力自动弹性替换,健康节点快速CheckPoint读取,实现断点自动续训。

L3层YLink:面向大模型数据治理、预训练、微调的高效工具链。聚焦于大模型的数据治理、预训练、微调等开发过程,集成了浪潮信息在大模型研发中的自研工具和开源工具,如数据处理工具包(Y-DataKit)、大模型训练工具包(Y-TrainKit)和大模型微调工具包(Y-FTKit)等等,通过这些多样且完善的工程化、自动化工具,加速大模型的训练和开发效率。

L4层MModel:提供多模型接入、服务、评测等功能的纳管平台。核心组件包括数据集管理、模型纳管和评测,可以方便开发者和研究人员更好地管理多版本、多类型的基础大模型与任务模型,并通过多样化的评测数据集与评测任务,对多个模型进行生成准确率、推理延迟、推理稳定性等指标进行全面评估。

浪潮信息高级副总裁、AI&HPC总经理刘军表示:"OGAI提供完善的工程化、自动化工具软件堆栈,将帮助更多企业顺利跨越大模型研发应用门槛,充分释放大模型创新生产力。浪潮信息将通过智算系统软硬件高度协同进行持续创新,持续培育繁荣元脑生态,推动实现‘助百模,智千行',加速生成式AI产业创新。"

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 浪潮
    +关注

    关注

    1

    文章

    491

    浏览量

    25529
  • AI
    AI
    +关注

    关注

    91

    文章

    42612

    浏览量

    303527
  • 大模型
    +关注

    关注

    2

    文章

    3912

    浏览量

    5348
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI智网络:大模型时代的飞跃与高效部署

    模型时代AI智网络如何决定GPU训练效率?本文深度解析智网络四大平面、无损网络核心技术及万卡集群落地部署方案,助您释放极致
    的头像 发表于 06-08 16:36 222次阅读
    AI智<b class='flag-5'>算</b>网络:大<b class='flag-5'>模型</b>时代的<b class='flag-5'>算</b><b class='flag-5'>力</b>飞跃与<b class='flag-5'>高效</b>部署

    端侧AI新秀,RK182X系列卡如何让大模型落地更简单?

    瑞芯微推出了面向人工智能应用的高性能RK182X系列卡,依托RKNN3 SDKV1.0.4的发布端侧AI模型部署提供全
    的头像 发表于 06-05 14:10 4449次阅读
    端侧AI<b class='flag-5'>算</b><b class='flag-5'>力</b>新秀,RK182X系列<b class='flag-5'>算</b><b class='flag-5'>力</b>卡如何让大<b class='flag-5'>模型</b>落地更简单?

    阿里QoderWork中国版推出AI生产力计划

    近日,阿里桌面智能体工作台**QoderWork CN**正式推出"AI生产力计划",即日起面向用户 **免费发放百亿积分** ,同时整合多款国产顶级大模型打造面向办公场景的全AI
    的头像 发表于 06-05 10:58 692次阅读

    香港推出首个生产力级超级智能体Agent Workshop

    首个生产力级超级智能体—— **Agent Workshop** ,推动香港迈向Agentic AI(智能体化AI)时代。
    的头像 发表于 06-05 10:31 409次阅读

    中微电科技打造AI时代全服务生态

    随着大模型训练、高性能计算蓬勃发展,数据中心算供给、智能调度、场景化落地与高效散热已成为行业刚需,企业对自主可控、调度灵活、能效稳定、
    的头像 发表于 05-27 15:50 200次阅读

    直播预告|玄铁 x Canonical:从本地推理到 AI 工厂,基于 RISC-V 的 AI 基础设施创新路径探讨

    模型浪潮下,AI 正向“本地推理”与“AI 工厂”两极延伸,而传统架构在低延迟与规模化之间往往顾此失彼。RISC-V 的可定制特性,提供了一条新路径——端侧精简
    发表于 05-15 12:15

    海光信息3号DCU深度适配腾讯混元Hy3 preview大模型

    近日,海光信息自主研发的深3号DCU已完成与腾讯最新开源大模型 —— 混元Hy3 preview的全面深度适配与性能优化。这标志着国产高端
    的头像 发表于 05-12 17:49 1616次阅读

    重磅发布|赛思全品类晶振,赋能AI精准前行!

    在新质生产力加速构建的浪潮中,人工智能已成为引领未来的核心引擎。而AI跃升、大模型稳定运行,离不开一项关键底层支撑——高精度时频技术。赛
    的头像 发表于 04-09 14:40 1575次阅读
    重磅<b class='flag-5'>发布</b>|赛思全品类晶振,赋能AI<b class='flag-5'>算</b><b class='flag-5'>力</b>精准前行!

    海光主板,3450G强加快数智技术创新

    数字经济浪潮席卷全球,数智技术创新已成为驱动产业升级、推动社会进步的核心引擎,而力作为数智时代的“核心生产力”,直接决定了数智创新的速度、
    的头像 发表于 03-31 14:08 493次阅读
    海光主板,3450G强<b class='flag-5'>算</b><b class='flag-5'>力</b>加快数智技术<b class='flag-5'>创新</b>

    从关键词看新质生产力,瑞之辰践行创新驱动发展

    AI浪潮、极速连接、绿色转型、产业升级……这些关键词都透露出“引领发展新质生产力”“因地制宜发展新质生产力”,已成为未来五年产业发展的既定方向。无论是AI人工智能、“新三样”绿色转型和产业智能化方向
    的头像 发表于 12-11 13:23 1219次阅读
    从关键词看新质<b class='flag-5'>生产力</b>,瑞之辰践行<b class='flag-5'>创新</b>驱动发展

    湘军,让变成生产力

    脑极体
    发布于 :2025年11月25日 22:56:58

    商汤日日新大模型赋能紫光汉图打造激光多功能一体机

    商汤日日新大模型赋能紫光汉图,一线教师打造全新教学生产力
    的头像 发表于 08-19 15:51 1179次阅读
    商汤日日新大<b class='flag-5'>模型</b>赋能紫光汉图<b class='flag-5'>打造</b>激光多功能一体机

    浪潮信息发布&quot;元脑SD200&quot;超节点,面向万亿参数大模型创新设计

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器"元脑SD200"。该产品基于浪潮信息创新
    的头像 发表于 08-08 22:17 849次阅读
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>发布</b>&quot;元脑SD200&quot;超节点,面向万亿参数大<b class='flag-5'>模型</b><b class='flag-5'>创新</b>设计

    SuperX全新发布多种规格的多模型一体机:全新定义企业级智能生产力

    AI基础设施的多个模型相互协同的设备,该产品以"开箱即用、多模融合、场景穿透"核心,面向不同规模的企业推出的多种规格、安全、高效的全AI解决
    的头像 发表于 08-08 08:52 766次阅读
    SuperX全新<b class='flag-5'>发布</b>多种规格的多<b class='flag-5'>模型</b>一体机:全新定义企业级智能<b class='flag-5'>生产力</b>

    科技上线赤兔推理引擎服务,创新解锁FP8大模型

    北京2025年7月30日 /美通社/ -- 近日,北京积科技有限公司(以下简称"积科技")宣布其服务平台上线赤兔推理引擎。积科技P
    的头像 发表于 07-30 21:44 1175次阅读