0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程与无问芯穹宣布完成基于GPU千卡集群的3B规模大模型实训

摩尔线程 来源:摩尔线程 2024-05-27 10:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摩尔线程联合无问芯穹宣布,双方已在本周正式完成基于国产全功能GPU千卡集群的3B规模大模型实训。该模型名为“MT-infini-3B”,在摩尔线程夸娥(KUAE)千卡智算集群与无问芯穹AIStudio PaaS平台上完成了高效稳定的训练。

本次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算集群深度合作的新范式。

MT-infini-3B模型训练总用时13.2天,经过精度调试,实现全程稳定训练不中断,集群训练稳定性达到100%,千卡训练和单机相比扩展效率超过90%。目前,实训出来的MT-infini-3B性能在同规模模型中跻身前列,相比在国际主流硬件上训练而成的其他模型,在C-Eval,MMLU,CMMLU等3个测试集上均实现性能领先。

0bb4d878-1a48-11ef-b74b-92fbcf53809c.png

MT-infini-3B性能表现

无问芯穹联合创始人兼CEO夏立雪表示:“国内大模型与国产芯片的软硬件协同发展,最终目标是构建一个成熟的生态系统。无问芯穹正在打造‘M种模型’和‘N种芯片’间的‘M×N’中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署。摩尔线程是第一家接入无问芯穹并进行千卡级别大模型训练的国产GPU公司,而‘MT-infini-3B’的训练是行业内首次实现基于国产GPU芯片从0到1的端到端大模型实训案例。”

摩尔线程创始人兼CEO张建中表示:“无问芯穹在夸娥千卡智算集群上实现的从零开始的大模型训练,不仅是对摩尔线程技术实力的有力认证,更是实现了国内大模型训练的国产化闭环。摩尔线程夸娥千卡智算集群以全功能GPU为底座,提供软硬一体化的全栈解决方案,具备高兼容性、高稳定性、高扩展性等综合优势,我们致力于成为AGI时代大模型训练坚实可靠的先进基础设施。”

此前,摩尔线程与无问芯穹已达成深度战略合作。无问芯穹大模型开发与服务平台“无穹Infini-AI”和摩尔线程大模型智算千卡集群夸娥已完成系统级融合适配,该平台可以灵活调用夸娥的集群能力以完成大模型的训练、微调与推理任务。未来,双方还将开展更多适配与测试,推动国产大模型技术的快速发展与应用普及,为中国人工智能产业的蓬勃发展贡献力量。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPU芯片
    +关注

    关注

    1

    文章

    306

    浏览量

    6394
  • 摩尔线程
    +关注

    关注

    2

    文章

    256

    浏览量

    6214
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964

原文标题:摩尔线程携手无问芯穹:基于夸娥千卡智算集群的“MT-infini-3B”大模型实训已完成

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程携手生态合作伙伴打造的AI教育基地启用

    近日,摩尔线程携手科大讯飞等生态合作伙伴打造的AI教育基地在江苏省锡山高级中学(以下简称“省锡中”)正式启用。作为无锡市惠山区首个落地的AI教育
    的头像 发表于 09-08 14:43 1130次阅读

    阿里通义发布小尺寸模型Qwen3-4B,手机也能跑

    电子发烧友网综合报道 8月7日,阿里通义宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen
    的头像 发表于 08-12 17:15 6295次阅读
    阿里通义<b class='flag-5'>千</b><b class='flag-5'>问</b>发布小尺寸<b class='flag-5'>模型</b>Qwen<b class='flag-5'>3-4B</b>,手机也能跑

    摩尔线程吴庆详解 MUSA 软件栈:以技术创新释放 KUAE 集群潜能,引领 GPU 计算新高度​

    的分享。GPU 计算软件开发总监吴庆登上讲台,发表了题为《摩尔线程 MUSA 软件栈助力 KUAE 集群释放无限潜能》的演讲。他从专业视角出发,为在场听众深入剖析了 MUSA 软件栈在
    的头像 发表于 07-28 13:47 5507次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>吴庆详解 MUSA 软件栈:以技术创新释放 KUAE <b class='flag-5'>集群</b>潜能,引领 <b class='flag-5'>GPU</b> 计算新高度​

    摩尔线程率先支持腾讯混元-A13B模型

    近日,腾讯正式开源基于专家混合(MoE)架构的大语言模型混元-A13B。同日,摩尔线程团队凭借技术前瞻性,率先完成
    的头像 发表于 07-04 14:10 680次阅读

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型摩尔线程团队在模型发布当天,率先完成
    的头像 发表于 05-07 15:24 838次阅读

    壁仞科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen
    的头像 发表于 04-30 15:19 1354次阅读

    摩尔线程GPU成功适配Deepseek-V3-0324大模型

    架构和全功能GPU的强大技术实力,摩尔线程迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署,充分展
    的头像 发表于 03-31 11:34 1104次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>GPU</b>成功适配Deepseek-V<b class='flag-5'>3</b>-0324大<b class='flag-5'>模型</b>

    摩尔线程与当虹科技达成深度合作

    近日,摩尔线程与当虹科技达成深度合作,基于国产GPU成功完成了与BlackEye多模态视听大模型的深度融合。双方联手打造专业级视听“引擎”,
    的头像 发表于 03-20 15:22 1286次阅读

    低至¥2.27/h!就能使用全球最强开元模型—— QwQ-32B

    ABSTRACT摘要捷智算平台上新全球最强开元模型——QwQ-32B。JAEALOT2025年3月18日
    的头像 发表于 03-19 12:34 881次阅读
    低至¥2.27/h!就能使用全球最强开元<b class='flag-5'>模型</b>——<b class='flag-5'>千</b><b class='flag-5'>问</b> QwQ-32<b class='flag-5'>B</b>

    摩尔线程支持阿里云通义QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义QwQ-32B摩尔线程在该
    的头像 发表于 03-07 17:48 1114次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>支持阿里云通义<b class='flag-5'>千</b><b class='flag-5'>问</b>QwQ-32<b class='flag-5'>B</b>开源<b class='flag-5'>模型</b>

    实现七家国产芯片DeepSeek适配

    近日,宣布了一个重大进展:其DeepSeek-R1、V3系列
    的头像 发表于 02-13 16:04 1207次阅读

    百度智能云发布昆仑三代万集群及DeepSeek-R1/V3上线

    01百度智能云点亮昆仑三代万集群 近日,百度智能云成功点亮昆仑三代万集群,这也是国内首个
    的头像 发表于 02-11 10:58 960次阅读

    摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务

    近日,摩尔线程智能科技(北京)有限责任公司在其官方渠道发布了一则重要消息,宣布公司已经成功实现了对DeepSeek蒸馏模型推理服务的部署。这一技术突破,标志着
    的头像 发表于 02-06 13:49 1184次阅读

    天数智合作突破千卡集群训练优化

    近日,天数智宣布达成深度合作,并在千卡
    的头像 发表于 01-21 14:31 1356次阅读

    小米加速布局AI大模型,搭建GPU集群

    近日,有消息称小米正在紧锣密鼓地搭建自己的GPU集群,旨在加大对AI大模型的投入力度。据悉,小米的大模型团队在成立之初就已经拥有了650
    的头像 发表于 12-28 14:25 789次阅读