0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

壁仞科技、中国移动等发布“芯合”异构混合并行训练系统1.0

壁仞科技Birentech 来源:壁仞科技Birentech 2024-12-03 09:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,备受瞩目的“2024中国信息通信大会暨中国通信学会学术年会”在四川成都顺利举行。此届大会以“科技领航创新,产业共筑未来”为主题,聚集了来自“政产学研用”各方代表,集中展示算力及网络通信领域的最新研究成果。

在“算力网络算网一体创新发展论坛”上,壁仞科技携手中国移动、中兴通讯等产业合作伙伴共同发布了通用异构混合并行训练系统——“芯合”异构混合并行训练系统1.0。该系统可解决大模型异构算力孤岛难题,实现同一训练任务在异构算力集群的任务拆解和协同训练,对推动我国智算产业生态融通发展,构建开放协同的新型智算基础设施具有积极意义。

当前,我国智算产业形成了软硬件绑定的竖井式生态,不同厂商、不同架构的智能算力之间无法兼容互通,限制了异构智能算力的有效整合和充分利用。大模型训练需要千卡集群甚至万卡集群资源,目前国产芯片厂家百花齐放,移动新型智算中心已经落地使用的算力资源类型多样,形成了一些算力孤岛。但由于目前Megatron等主流的分布式训练框架仅支持同构算力集群,导致无论是不同厂商的智算芯片之间,亦或是同一厂商不同代际芯片之间都无法形成“合力”,极大地限制了智算中心对现有异构算力资源使用的充分性和调度的灵活性,因此亟需面向异构算力混合训练需求进行技术研究。

为屏蔽异构硬件差异、融通智算竖井生态,中国移动充分发挥移动信息现代产业链“链长”职责,以异构混训技术为攻关要点,率先提出通用异构混合训练技术,并开展“芯合”异构混合并行训练系统1.0研发,开辟以智算软件带动智算产业融通发展的全新路径。

本次壁仞科技联合中国移动发布的“芯合”异构混合并行训练系统1.0依托基于 Inhomogeneous Task Distribution (ITD)算法的3D并行非均匀切分和基于GPUDirect RDMA(GDR)的异构芯片高速通信两大关键技术提供通用混合训练能力。其中,基于ITD算法的3D并行非均匀切分可通过通用混合训练框架实现异构数据并行、异构流水线并行,实现数据微批次大小、数量、流水线并行度等参数在异构算力上的自适应调整;基于GDR的异构芯片高速通信可在不改变芯片原有通信接口基础上,基于GDR芯片高速互联技术,通过定义数据传输架构、流程及接口标准约束,屏蔽底层硬件差异,实现顶层训练任务在异构算力集群上分布式通信的无感拆解。当前系统已实现百亿参数大模型在壁仞科技、英伟达等多家智算芯片上的交叉混合训练,异构混训效率达95%以上,未来将在提升智能算力资源利用率及促进国产算力发展等方面发挥重要作用。

此前壁仞科技的壁砺系列通用GPU算力产品已经在中国移动智算中心(呼和浩特)成功上线运营,为该智算中心提供强大算力。该项目成功上线运营,标志着双方在智能计算领域的深度合作迈出了坚实的步伐。国产GPU加快落地的过程中正在在逐步扩大算力规模,为破解这一过程中的“大模型算力孤岛”难题,壁仞科技一直在积极开展异构GPU协同训练技术攻关,已发布自主原创的异构GPU协同训练方案HGCT,业界首次支持3种及以上异构GPU混合训练同一个大模型,用一套统一方案支持多种不同厂商、不同型号的GPU,而且一行代码适配多种框架。此次壁仞科技携手中国移动强强联合,发挥双方在底层通信库和上层并行拆分策略的优势,联合打造“芯合”异构混合并行训练系统1.0,有利于帮助中国移动充分利用国产算力,加快国产GPU迁移落地,形成开放的国产智算生态。

大会同期举办了中国通信学会算力网络委员会闭门会议及委员聘用仪式,壁仞科技AI软件首席架构师丁云帆被评选为中国通信学会第一届算力网络委员会委员,其将发挥在大规模智算集群、AI平台、异构训练系统、大模型分布式并行加速等方面的经验和能力,为中国算力网络的发展贡献力量。

未来,壁仞将继续秉承开放与融合的理念,与中国移动等产业链的合作伙伴携手并进,共同推进智算异构混训系统的创新与建设,支撑更多业务场景、支持更大参数规模模型、支持更大规模异构集群、融通更多异构芯片,真正打造以基础软件栈引领的全新智算生态,为我国算力强国战略落地提供坚实的支撑。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 中国移动
    +关注

    关注

    22

    文章

    5700

    浏览量

    77211
  • 算力
    +关注

    关注

    2

    文章

    1385

    浏览量

    16566
  • 壁仞科技
    +关注

    关注

    1

    文章

    72

    浏览量

    3561

原文标题:破解“算力孤岛”|壁仞科技联合中国移动等生态伙伴共同发布“芯合”异构混合并行训练系统1.0

文章出处:【微信号:Birentech,微信公众号:壁仞科技Birentech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中星微技术与中国移动深化战略合作

    近日,2025中国移动全球合作伙伴大会“AI+视联网”分论坛在广州召开。论坛期间,中国移动AI+视联网能力焕新及生态焕新正式启动,中星微技术股份有限公司总裁张韵东博士、中国移动副总经理陈怀达
    的头像 发表于 10-16 11:13 566次阅读

    科技亮相2025中国移动全球合作伙伴大会

    10月10日至12日,以“碳硅共生,创AI+时代”为主题的2025中国移动全球合作伙伴大会在广州盛大举行。作为中国移动长期合作伙伴,
    的头像 发表于 10-13 18:27 793次阅读

    盛智能亮相2025中国移动全球合作伙伴大会

    10月10-12日,第十三届中国移动全球合作伙伴大会在广州顺利召开,大会以“碳硅共生 创AI+时代”为主题,吸引了数百家国内外合作伙伴,共绘智能时代新图景,共启数智未来新篇章。盛智能作为领先
    的头像 发表于 10-13 14:30 1222次阅读

    盛智能携手中国移动发布全国产DDR4内存产品

    10月10日,以“碳硅共生 创AI+时代”为主题的2025中国移动全球合作伙伴大会上,盛智能科技(湖南)有限公司携手中国移动通信集团终端有限公司联合
    的头像 发表于 10-13 14:28 1300次阅读

    海格通信与中国移动合作打造空天地一体生态“中国芯”引擎

    2025年10月10日至12日,以“碳硅共生 创AI+时代”为主题的第13届中国移动全球合作伙伴大会将在广州保利世贸博览馆举行。其中,海格通信(股票代码:002465)与战略合作伙伴中国移动终端
    的头像 发表于 10-12 09:17 987次阅读

    奇异摩尔携手中国移动发布OISA 2.0协议

    山西大同,在 2025中国算力大会主论坛上,中国移动携手包括奇异摩尔、燧原科技、韧科技、摩尔线程、昆仑、盛科通信、浪潮集团多家AI基础
    的头像 发表于 08-27 15:08 2873次阅读
    奇异摩尔携手<b class='flag-5'>中国移动</b><b class='flag-5'>发布</b>OISA 2.0协议

    盛智能亮相第二届中国移动产业投资生态合作大会

    此前,7月8日至9日,由中国移动主办的产业投资生态合作大会于成都隆重启幕。作为中国移动的参股企业和国内存储领域的核心力量,盛智能受邀携全栈自主创新存储产品及解决方案亮相先进算力展区。
    的头像 发表于 07-11 16:11 1271次阅读

    海格通信参加中国移动卫星物联产品发布仪式

    近日,中国移动在世界移动通信大会(2025MWC上海)期间举办了以“智无界,联万物,创未来”为主题的“AI+物联网”产品发布会。海格通信(股票代码:002465)作为中国移动卫星物联产
    的头像 发表于 06-19 17:23 1645次阅读

    科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,科技宣布完成旗舰版Qwen3-235B-A22B模型的训练适配和优化。由此,科技已实现Qw
    的头像 发表于 05-16 16:23 780次阅读

    科技亮相2025中国移动云智算大会

    此前,4月10日至11日,以“由云向智,共绘算网新生态”为主题的2025中国移动云智算大会在江苏苏州举行。大会期间,中国移动联合壁科技、中兴通讯合作伙伴正式
    的头像 发表于 04-15 16:57 1884次阅读

    软通动力与中国移动深化合作伙伴关系

    近日,软通动力成功中标中国移动旗下昇科技有限公司(简称“昇科技”)业务支撑服务项目,进一步深化了与中国移动的合作伙伴关系。此次项目旨在为
    的头像 发表于 03-17 17:49 1085次阅读

    科技支持DeepSeek-V3满血版训练推理

    DeepSeek在开源周开源了部分关键模块的代码及推理系统参考架构,再次引发行业震动,但目前尚未开源DeepSeek-V3 满血版完整训练代码。科技凭借八大自主创新技术,实现
    的头像 发表于 03-04 14:01 1921次阅读

    中移昇与中华煤气、中国移动香港、赛昉科技签署战略框架合作协议

    近日,昇科技有限公司(以下简称“中移昇”)与香港中华煤气有限公司(以下简称“香港中华煤气”)、中国移动香港有限公司(以下简称“中国移动香港”)、上海赛昉半导体科技有限公司(以下简称
    的头像 发表于 01-14 12:02 1015次阅读
    中移<b class='flag-5'>芯</b>昇与中华煤气、<b class='flag-5'>中国移动</b>香港、赛昉科技签署战略框架合作协议

    中国移动联合飞腾公司发布无线智算网络样机

    近日,由中国通信学会、电子科技大学单位共同主办的2024中国信息通信大会在四川成都顺利召开。期间,在中国移动研究院承办的第三届无线通算智融合共生技术专题研讨会上,
    的头像 发表于 12-27 14:16 904次阅读

    异构混合并行训练系统1.0发布

    近日,中国移动研究院副院长段晓东携手天数智科技、中兴、海光、瀚博一众产业合作伙伴,共同推出了“
    的头像 发表于 12-13 15:46 926次阅读