0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

沐曦助力上海创智学院siiRL 2.0全面升级

沐曦MetaX 来源:沐曦MetaX 2025-09-29 11:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能加速迈向大模型与智能体时代的今天,强化学习(Reinforcement Learning,RL)已经成为推动智能系统演化的关键技术。随着强化学习训练规模不断扩大,对底层算力提出了前所未有的挑战。近日,上海创智学院 AI Infra 团队发布的 siiRL 2.0,以其卓越特性为强化学习的发展带来了新的突破,沐曦则凭借自身优势为 siiRL 2.0 的升级提供了坚实支撑,共同推动强化学习正式迈入 “千卡级”时代。

siiRL:全分布式架构的颠覆性突破

上海创智学院AI Infra团队发布siiRL 2.0,聚焦性能、生态与前沿探索全面升级:

卓越性能与扩展性

基于全分布式架构,实现千卡级近线性扩展与业界领先吞吐,性能在7B~235B(Dense/MoE)等大规模模型上稳定验证。

自主可控,拥抱国产算力

全面适配多家主流国产芯片并完成千卡级扩展验证,为AI基础设施夯实自主可控的算力底座。

灵活易用与生态兼容

独创DAG工作流支持无代码算法实验,兼容Megatron/FSDP等主流后端,极大提升研发效率。

面向前沿,支持多智能体研究

内建强大的多智能体协同训练框架,为探索“智能涌现”等前沿课题提供关键基础设施。

9b4e6c46-9829-11f0-8c8f-92fbcf53809c.png

图 1:siiRL架构概览

技术论文:https://arxiv.org/abs/2507.13833

开源代码仓库:https://github.com/sii-research/siiRL

在本次siiRL的升级适配工作中,沐曦做了一系列针对性优化:

siiRL框架高效适配

基于沐曦自研的MXMACA软件栈,已经完整适配了siiRL需要的所有后端引擎(Vllm/Pytorch fsdp/Megatron-LM/Ray)以及深度优化的mccl高性能通信库,不需要其他额外的适配工作,实现了siiRL框架的高效适配。

超节点scale up

沐曦Dragonfly超节点,提供了64卡的光互连高速通信带宽。在训练过程中,通过设置fsdp_size=64,可以充分利用超节点内的带宽,提升模型的训练效率。

显存优化

通过设置模型参数offload选项,在共置集群上,有效降低了rollout和training阶段的峰值显存,可以采用更优的切分方式,进一步提升计算效率。

分布式策略调整

结合实际负载与硬件拓扑,优化了不同模型的分布式训练参数切分方式,并调整了亲和性配置,以提升通信效率。

通过上述优化,siiRL框架在沐曦超节点集群上实现了从64卡到1024卡的稳定扩展,系统保持了超过92%的高线性度拓展效率。在模型精度上,与国际主流生态 GPU的训练结果相比,沐曦超节点集群在验证集上的平均绝对误差控制在0.5%以内,满足实际应用场景的精度要求。

9bc2af0c-9829-11f0-8c8f-92fbcf53809c.png

图 2:siiRL在沐曦超节点集群上的扩展性评估,

展示了64卡到1024GPU规模下的高线性扩展能力

随着 AI 技术逐渐成为国家科技竞争的核心,构建自主可控的算力基础设施已经成为产业发展的必然选择。沐曦与上海创智学院 AI Infra 团队的携手合作,不仅验证了国产 GPU 在前沿 AI 应用上的可行性与先进性,更为中国科研机构、产业界提供了面向未来的坚实算力底座。沐曦将持续与产学研伙伴深度协作,推动大模型框架与国产 GPU 的深度适配和生态完善,加速强化学习、大模型、智能体等关键领域的创新应用落地。

关于沐曦

沐曦致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136060
  • 沐曦
    +关注

    关注

    1

    文章

    100

    浏览量

    1876
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269

原文标题:强化学习进入“千卡级”时代,沐曦助力 siiRL 2.0 全面升级

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    股份与上海联通正式签署战略合作协议

    4月17日,股份与中国联合网络通信有限公司上海市分公司(简称“上海联通”)正式签署战略合作协议,此次签约标志着双方在算力基础设施建设、人工智能产业赋能等领域的合作迈入深度融合的新阶
    的头像 发表于 04-23 14:33 334次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份与<b class='flag-5'>上海</b>联通正式签署战略合作协议

    股份携手合作伙伴完成全栈产品兼容性互认证

    近日,股份携手粤港澳大湾区国家技术创新中心工业软件产业发展中心(以下简称“国工软”)、国产高性能服务器与操作系统合作伙伴,以及十沣科技、迈软件、适
    的头像 发表于 04-23 14:27 122次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份携手合作伙伴完成全栈产品兼容性互认证

    股份联合上海人工智能实验室发布高性能GPU算子生成系统Kernel-Smith

    近日,上海人工智能实验室和股份联合发布了高性能GPU算子生成系统—— Kernel-Smith。
    的头像 发表于 04-08 15:39 315次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份联合<b class='flag-5'>上海</b>人工智能实验室发布高性能GPU算子生成系统Kernel-Smith

    股份北京AI研究院暨企业开源中心正式揭牌启动

    3月20日,股份北京AI研究院暨“企业开源中心”正式揭牌启动。活动以“芯生,开源共创”为主题,标志着
    的头像 发表于 03-24 10:11 311次阅读

    股份CXO预科班2026冬令营圆满收官

    2月6日,由集成电路(上海)股份有限公司(股票代码:688802,简称“股份”)主办、之江实验室大力支持、
    的头像 发表于 02-25 16:29 1287次阅读

    云C500/C550 GPU产品适配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上线,云C500/C550 Day 0 适配PaddleOCR-VL-1.5模型,助力Padd
    的头像 发表于 01-30 10:19 1300次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 GPU产品适配PaddleOCR-VL-1.5模型

    股份与江南大学建立联合研究中心

    近日,教育部哲学社会科学实验室“食品安全与国家战略治理实验室”揭牌暨合作签约仪式、学术委员会会议在无锡隆重举行。活动现场,集成电路(上海)股份有限公司与江南大学签署共建协议,并同步揭牌“江南大学
    的头像 发表于 01-21 17:25 1602次阅读

    与Arm、熠知一同到访清华大学交流座谈

    助力顶尖学府清华大学在“AI+教科研”领域取得新突破,培养具备AI创新能力的人才,1月12日,集成电路(上海)股份有限公司(股票代码:688802)、半导体头部企业Arm控股有限
    的头像 发表于 01-14 13:52 489次阅读

    股份在上海证券交易所科板挂牌上市

    近日,股份正式在上海证券交易所科板挂牌上市,股票代码:688802.SH。作为国内高性
    的头像 发表于 12-24 09:03 3137次阅读

    DLInfer联手股份实现数据生成场景的实际落地

    近期,上海 AI 实验室 DeepLink 团队推出的 DLInfer 通过支持 LMDeploy 主流模型推理,助力股份云 C500
    的头像 发表于 12-09 14:55 861次阅读
    DLInfer联手<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份实现数据生成场景的实际落地

    股份与上海电信完成首期GPU生态专家认证培训

    近期,集成电路(上海)股份有限公司(以下简称“股份”)携手上海电信天翼云能力运营中心(以
    的头像 发表于 10-31 10:33 651次阅读

    首款全国产通用GPU芯片发布 集成推出云C600

    ,并支持MetaXLink超节点扩展技术,在硬件性能和软件兼容上完全满足下一代生成式AI的训练和推理需求。 而且,股份与中国科学院合作的国产千卡集群,已完成多个大模型全参数训练,证实国产算力已具备大模型预训练能力。 公开资料
    的头像 发表于 10-19 20:04 4.7w次阅读

    GPU与龙蜥操作系统完成适配

    集成电路(上海)股份有限公司(以下简称"")于 2020 年 9 月成立于上海,其拥有技
    的头像 发表于 10-17 15:06 1383次阅读

    书生大模型实战营魔乐专场MeetUP精彩回顾

    近日,由书生大模型社区、、魔乐社区、算丰和 DaoCloud 道客等联合打造的「书生大模型实战营魔乐专场 MeetUP 暨颁奖仪式」在上海
    的头像 发表于 08-20 11:33 1235次阅读

    硅基流动携手首发基于云的Kimi K2推理服务

    今天,硅基流动联合集成电路(上海)股份有限公司(简称“”),全球首发基于
    的头像 发表于 07-23 17:33 2144次阅读