近日,中国移动研究院副院长段晓东携手天数智芯、壁仞科技、中兴、海光、瀚博等一众产业合作伙伴,共同推出了“芯合”异构混合并行训练系统1.0版本。
该系统具备两大核心能力,首先是基于非均匀计算任务切分ITD(Inhomogeneous Task Distribution)算法的3D并行策略。该策略利用通用混合训练框架,实现了异构数据并行和异构流水线并行,能够灵活应对各种复杂的计算任务。通过这一技术,系统能够根据异构算力的特点,自适应地调整数据微批次大小、数量以及流水线并行度等参数,从而充分发挥不同计算单元的性能优势。
其次,“芯合”系统还采用了基于GDR(GPU Direct RDMA)的异构芯片高速通信技术。这一技术为异构芯片之间的数据传输提供了高速通道,极大地提升了数据传输效率,从而进一步提升了系统的整体性能。
“芯合”异构混合并行训练系统1.0的发布,标志着中国移动及其合作伙伴在异构计算领域取得了重要突破,为未来的高性能计算和人工智能应用提供了更加高效和灵活的训练平台。
-
通信技术
+关注
关注
20文章
1170浏览量
94135 -
数据
+关注
关注
8文章
7315浏览量
93983 -
中国移动
+关注
关注
22文章
5700浏览量
77213 -
人工智能
+关注
关注
1813文章
49740浏览量
261549
发布评论请先 登录
一文看懂AI大模型的并行训练方式(DP、PP、TP、EP)
全新升级 | 匠芯创AiUIBuilder V2.0.0发布
G2发布最新报告,Splashtop 荣膺多区域领导者,IT 远程解决方案获全球认可
详解先进封装中的混合键合技术
摩尔线程发布大模型训练仿真工具SimuMax v1.0
商汤大装置发布基于DeepLink的异构混合调度方案
炬芯科技助力荣耀手环10发布
混合键合工艺介绍
米尔瑞芯微多核异构低功耗RK3506核心板重磅发布
摩尔线程GPU原生FP8计算助力AI训练

“芯合”异构混合并行训练系统1.0发布
评论