0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“芯合”异构混合并行训练系统1.0发布

科技绿洲 来源:网络整理 作者:网络整理 2024-12-13 15:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,中国移动研究院副院长段晓东携手天数智芯、壁仞科技、中兴、海光、瀚博等一众产业合作伙伴,共同推出了“芯合”异构混合并行训练系统1.0版本。

该系统具备两大核心能力,首先是基于非均匀计算任务切分ITD(Inhomogeneous Task Distribution)算法的3D并行策略。该策略利用通用混合训练框架,实现了异构数据并行和异构流水线并行,能够灵活应对各种复杂的计算任务。通过这一技术,系统能够根据异构算力的特点,自适应地调整数据微批次大小、数量以及流水线并行度等参数,从而充分发挥不同计算单元的性能优势。

其次,“芯合”系统还采用了基于GDR(GPU Direct RDMA)的异构芯片高速通信技术。这一技术为异构芯片之间的数据传输提供了高速通道,极大地提升了数据传输效率,从而进一步提升了系统的整体性能。

“芯合”异构混合并行训练系统1.0的发布,标志着中国移动及其合作伙伴在异构计算领域取得了重要突破,为未来的高性能计算和人工智能应用提供了更加高效和灵活的训练平台。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 通信技术
    +关注

    关注

    20

    文章

    1170

    浏览量

    94135
  • 数据
    +关注

    关注

    8

    文章

    7315

    浏览量

    93983
  • 中国移动
    +关注

    关注

    22

    文章

    5700

    浏览量

    77213
  • 人工智能
    +关注

    关注

    1813

    文章

    49740

    浏览量

    261549
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    一文看懂AI大模型的并行训练方式(DP、PP、TP、EP)

    大家都知道,AI计算(尤其是模型训练和推理),主要以并行计算为主。AI计算中涉及到的很多具体算法(例如矩阵相乘、卷积、循环层、梯度运算等),都需要基于成千上万的GPU,以并行任务的方式去完成。这样
    的头像 发表于 11-28 08:33 862次阅读
    一文看懂AI大模型的<b class='flag-5'>并行</b><b class='flag-5'>训练</b>方式(DP、PP、TP、EP)

    全新升级 | 匠创AiUIBuilder V2.0.0发布

    近日,匠创自主研发的GUI开发工具AiUIBuilderV2.0.0发布。作为一款基于LVGL的UI设计工具,AiUIBuilder致力于通过拖拽式操作,加速基于匠创嵌入式平台的图形应用开发
    的头像 发表于 10-29 10:03 589次阅读
    全新升级 | 匠<b class='flag-5'>芯</b>创AiUIBuilder V2.0.0<b class='flag-5'>发布</b>

    G2发布最新报告,Splashtop 荣膺多区域领导者,IT 远程解决方案获全球认可

    近日,全球权威软件评测平台G2发布了2025年秋季报告,Splashtop在端点管理、补丁管理、远程支持和远程桌面类别中表现亮眼,荣获多项荣誉。凭借在欧洲、中东和非洲(EMEA)、欧洲、英国和加
    的头像 发表于 10-20 17:02 1008次阅读
    G2<b class='flag-5'>发布</b>最新报告,Splashtop 荣膺多区域领导者,IT 远程解决方案获全球认可

    详解先进封装中的混合技术

    在先进封装中, Hybrid bonding( 混合)不仅可以增加I/O密度,提高信号完整性,还可以实现低功耗、高带宽的异构集成。它是主要3D封装平台(如台积电的SoIC、三星的X-Cube
    的头像 发表于 09-17 16:05 1137次阅读
    详解先进封装中的<b class='flag-5'>混合</b>键<b class='flag-5'>合</b>技术

    摩尔线程发布大模型训练仿真工具SimuMax v1.0

    近日,摩尔线程正式发布并开源大模型分布式训练仿真工具SimuMax 1.0版本。该版本在显存和性能仿真精度上实现突破性提升,同时引入多项关键功能,进一步增强了模型兼容性、灵活性与用户体验。
    的头像 发表于 09-11 18:19 3345次阅读
    摩尔线程<b class='flag-5'>发布</b>大模型<b class='flag-5'>训练</b>仿真工具SimuMax v<b class='flag-5'>1.0</b>

    商汤大装置发布基于DeepLink的异构混合调度方案

    日前,在2025世界人工智能大会(WAIC)期间,商汤大装置发布基于DeepLink的异构混合调度方案,将DeepLink深度融入商汤大装置核心能力体系。该方案针对当前国产算力资源碎片化、异构
    的头像 发表于 08-05 10:01 885次阅读

    科技助力荣耀手环10发布

    近日,荣耀举办全场景新品发布会,正式推出新一代智能穿戴产品——荣耀手环10。该产品搭载炬科技ATS3085L双模蓝牙智能手表SoC芯片。炬ATS3085L是一款双模蓝牙智能手表SoC芯片,采用
    的头像 发表于 06-06 15:33 1180次阅读

    混合工艺介绍

    所谓混合(hybrid bonding),指的是将两片以上不相同的Wafer或Die通过金属互连的混合工艺,来实现三维集成,在Hybrid Bonding前,2D,2.5D及3
    的头像 发表于 06-03 11:35 1795次阅读
    <b class='flag-5'>混合</b>键<b class='flag-5'>合</b>工艺介绍

    米尔瑞微多核异构低功耗RK3506核心板重磅发布

    近日,米尔电子发布MYC-YR3506核心板和开发板,基于国产新一代入门级工业处理器瑞微RK3506,这款芯片采用三核Cortex-A7+单核Cortex-M0多核异构设计,不仅拥有丰富的工业接口
    发表于 05-16 17:20

    重磅更新 | 先楫半导体HPM_APPS v1.9.0发布

    重磅更新 | 先楫半导体HPM_APPS v1.9.0发布
    的头像 发表于 05-13 11:29 1357次阅读
    重磅更新 | 先楫半导体HPM_APPS v1.9.0<b class='flag-5'>发布</b>

    摩尔线程GPU原生FP8计算助力AI训练

    近日,摩尔线程正式开源MT-MegatronLM与MT-TransformerEngine两大AI框架。通过深度融合FP8混合训练策略和高性能算子库,这两大框架在国产全功能GPU上实现了高效的混合并行
    的头像 发表于 03-17 17:05 1217次阅读
    摩尔线程GPU原生FP8计算助力AI<b class='flag-5'>训练</b>

    Cu-Cu混合的原理是什么

    本文介绍了Cu-Cu混合主要用在哪方面以及原理是什么。
    的头像 发表于 02-26 17:35 1426次阅读
    Cu-Cu<b class='flag-5'>混合</b>键<b class='flag-5'>合</b>的原理是什么

    先楫半导体HPM_SDK v1.7.0发布!这些更新你值得关注!

    先楫半导体HPM_SDK v1.7.0发布!这些更新你值得关注!
    的头像 发表于 02-08 13:42 1046次阅读
    先楫半导体HPM_SDK v1.7.0<b class='flag-5'>发布</b>!这些更新你值得关注!

    全国首个异构人形机器人训练场启用

    全国首个异构人形机器人训练场在上海浦东的张江模力社区正式启用。这一具有里程碑意义的事件,为我国人形机器人产业的发展注入了强大动力。 该训练场由国家地方共建人形机器人创新中心建设,面积超5000平
    的头像 发表于 01-22 18:13 895次阅读

    天数智与无问穹合作突破千卡集群训练优化

    近日,天数智与无问穹宣布达成深度合作,并在千卡集群训练优化领域取得了重大技术突破。这一合作基于天数智的天垓150卓越计算能力和无问
    的头像 发表于 01-21 14:31 1359次阅读