0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产GPU可替代!摩尔线程千卡集群点亮新成就

硬件世界 来源:硬件世界 2024-05-29 11:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摩尔线程、无问芯穹联合宣布,双方已经正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,基于摩尔线程国产全功能GPU MTT S4000组成的千卡集群,以及无问芯穹的AIStudio PaaS平台。

本次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算集群深度合作的新范式。

据悉,这次的MT-infini-3B模型训练总共用时13.2天,全程稳定无中断,集群训练稳定性达到100%,千卡训练和单机相比扩展效率超过90%。

目前,实训出来的MT-infini-3B性能在同规模模型中跻身前列,相比在国际主流硬件上(尤其是NVIDIA)训练而成的其他模型,在C-Eval、MMLU、CMMLU等3个测试集上均实现性能领先。

215849c8-1c21-11ef-b74b-92fbcf53809c.png

无问芯穹正在打造“M种模型”和“N种芯片”之间的“M x N”中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署,已与摩尔线程达成深度战略合作。

摩尔线程是第一家接入无问芯穹并进行千卡级别大模型训练的国产GPU公司,夸娥千卡集群已与无穹Infini-AI顺利完成系统级融合适配,完成LLama2 700亿参数大模型的训练测试。

T-infini-3B的训练,则是行业内首次实现基于国产GPU芯片从0到1的端到端大模型实训案例。

就在日前,基于摩尔线程的夸娥千卡集群,憨猴集团也成功完成了7B、34B、70B不同参数量级的大模型分布式训练,双方还达成战略合作。

经双方共同严苛测试,兼容适配程度高,训练效率达到预期,精度符合要求,整个训练过程持续稳定。


审核编辑:刘清
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6399
  • 摩尔线程
    +关注

    关注

    2

    文章

    256

    浏览量

    6215
  • 大模型
    +关注

    关注

    2

    文章

    3442

    浏览量

    4969

原文标题:国产GPU可替代!摩尔线程千卡集群点亮新成就

文章出处:【微信号:hdworld16,微信公众号:硬件世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程高开468% 中一签赚27万 国产GPU第一股摩尔线程高开468%

    国产GPU第一股”上市了!今天是万众瞩目的摩尔线程正式上市的日子;摩尔线程A股总股本47002
    的头像 发表于 12-05 11:03 1108次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>高开468% 中一签赚27万 <b class='flag-5'>国产</b><b class='flag-5'>GPU</b>第一股<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>高开468%

    摩尔线程副总裁王华:AI工厂全栈技术重构算力基建,开启国产 GPU 黄金时代

    摩尔线程在世界人工智能大会(WAIC 2025)前夕举办以“算力进化,精度革命”为主题的技术分享会,创新性提出“AI工厂” 理念。这一系统性工程通过全功能 GPU、自研架构、集群技术与
    的头像 发表于 08-02 14:21 4637次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>副总裁王华:AI工厂全栈技术重构算力基建,开启<b class='flag-5'>国产</b> <b class='flag-5'>GPU</b> 黄金时代

    摩尔线程吴庆详解 MUSA 软件栈:以技术创新释放 KUAE 集群潜能,引领 GPU 计算新高度​

    在 2025 年世界人工智能大会(WAIC 2025)期间,摩尔线程举办的技术分享日活动现场气氛热烈,众多业内人士齐聚一堂,翘首以盼这家即将IPO上市的国产全功能GPU原厂给业界首次带
    的头像 发表于 07-28 13:47 5514次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>吴庆详解 MUSA 软件栈:以技术创新释放 KUAE <b class='flag-5'>集群</b>潜能,引领 <b class='flag-5'>GPU</b> 计算新高度​

    摩尔线程亮相WAIC 2025:以“AI工厂”理念驱动算力进化,全栈AI应用赋能行百业

    模型的“超级工厂”。此次参会不仅彰显了摩尔线程在AI基础设施领域的系统性创新,更通过多行业案例展现了国产GPU技术的广泛应用前景。     首提“AI工厂”理念:系统性创新突破大模型训
    的头像 发表于 07-28 11:34 1435次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>亮相WAIC 2025:以“AI工厂”理念驱动算力进化,全栈AI应用赋能<b class='flag-5'>千</b>行百业

    摩尔线程与AI算力平台AutoDL达成深度合作

    近日,摩尔线程与国内领先的AI算力平台AutoDL宣布达成深度合作,双方联合推出面向个人开发者的“摩尔线程专区”,首次将国产
    的头像 发表于 05-23 16:10 1429次阅读

    摩尔线程GPU成功适配Deepseek-V3-0324大模型

    架构和全功能GPU的强大技术实力,摩尔线程迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署,充分展现了摩尔
    的头像 发表于 03-31 11:34 1104次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>GPU</b>成功适配Deepseek-V3-0324大模型

    摩尔线程与当虹科技达成深度合作

    近日,摩尔线程与当虹科技达成深度合作,基于国产GPU成功完成了与BlackEye多模态视听大模型的深度融合。双方联手打造专业级视听“引擎”,并在超高清
    的头像 发表于 03-20 15:22 1287次阅读

    摩尔线程发布云电脑驱动MT vGPU 2.7.0

    3月18日,摩尔线程正式发布云电脑驱动MT vGPU 2.7.0。新版本在国内首次实现了国产GPU云电脑对DirectX 12的支持,同时显著提升图形渲染性能与兼容性。通过全功能
    的头像 发表于 03-19 15:56 765次阅读

    摩尔线程GPU原生FP8计算助力AI训练

    近日,摩尔线程正式开源MT-MegatronLM与MT-TransformerEngine两大AI框架。通过深度融合FP8混合训练策略和高性能算子库,这两大框架在国产全功能GPU上实现
    的头像 发表于 03-17 17:05 1217次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>GPU</b>原生FP8计算助力AI训练

    千卡算力破局:科通技术以&quot;AI大模型+AI芯片&quot;重构智算底座

    “科通技术”)推出的“DeepSeek+AI芯片”全场景方案,在云AI领域取得重大突破。除了GPU的算力总量,云AI的一大挑战来源于GPU集群的数据互联效率。某大型互联网集团为解决云AI系统中
    的头像 发表于 03-17 11:14 708次阅读

    摩尔线程支持阿里云通义问QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义问QwQ-32B。摩尔线程在该模型发布后2小时内,迅速且高效完成了对问QwQ-32B的支持。
    的头像 发表于 03-07 17:48 1121次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>支持阿里云通义<b class='flag-5'>千</b>问QwQ-32B开源模型

    百度成功点亮国内首个昆仑芯三代万集群

    近日,百度智能云宣布了一项重大技术突破:成功点亮了国内首个自研的昆仑芯三代万集群。这一里程碑式的成就标志着百度在AI芯片领域取得了显著进展。
    的头像 发表于 02-06 17:52 1405次阅读

    昆仑芯P800万集群成功点亮,将进一步点亮3万集群

      近日,百度智能云成功点亮昆仑芯三代万集群,这也是国内首个正式点亮的自研万集群。百度智能云
    发表于 02-05 17:58 1091次阅读
    昆仑芯P800万<b class='flag-5'>卡</b><b class='flag-5'>集群</b>成功<b class='flag-5'>点亮</b>,将进一步<b class='flag-5'>点亮</b>3万<b class='flag-5'>卡</b><b class='flag-5'>集群</b>

    百度智能云点亮昆仑芯三代万集群

    近日,百度智能云宣布成功点亮昆仑芯三代万集群,这一成就不仅在国内尚属首次,也标志着百度在人工智能算力领域取得了重大突破。据了解,百度智能云计划进一步扩大规模,进一步
    的头像 发表于 02-05 14:58 993次阅读

    天数智芯与无问芯穹合作突破千卡集群训练优化

    近日,天数智芯与无问芯穹宣布达成深度合作,并在千卡集群训练优化领域取得了重大技术突破。这一合作基于天数智芯的天垓150卓越计算能力和无问芯穹自主研发的大模型训练框架,共同推动了LLaMA千卡
    的头像 发表于 01-21 14:31 1361次阅读