0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程与无问芯穹宣布完成基于GPU千卡集群的3B规模大模型实训

摩尔线程 来源:摩尔线程 2024-05-27 10:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摩尔线程联合无问芯穹宣布,双方已在本周正式完成基于国产全功能GPU千卡集群的3B规模大模型实训。该模型名为“MT-infini-3B”,在摩尔线程夸娥(KUAE)千卡智算集群与无问芯穹AIStudio PaaS平台上完成了高效稳定的训练。

本次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算集群深度合作的新范式。

MT-infini-3B模型训练总用时13.2天,经过精度调试,实现全程稳定训练不中断,集群训练稳定性达到100%,千卡训练和单机相比扩展效率超过90%。目前,实训出来的MT-infini-3B性能在同规模模型中跻身前列,相比在国际主流硬件上训练而成的其他模型,在C-Eval,MMLU,CMMLU等3个测试集上均实现性能领先。

0bb4d878-1a48-11ef-b74b-92fbcf53809c.png

MT-infini-3B性能表现

无问芯穹联合创始人兼CEO夏立雪表示:“国内大模型与国产芯片的软硬件协同发展,最终目标是构建一个成熟的生态系统。无问芯穹正在打造‘M种模型’和‘N种芯片’间的‘M×N’中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署。摩尔线程是第一家接入无问芯穹并进行千卡级别大模型训练的国产GPU公司,而‘MT-infini-3B’的训练是行业内首次实现基于国产GPU芯片从0到1的端到端大模型实训案例。”

摩尔线程创始人兼CEO张建中表示:“无问芯穹在夸娥千卡智算集群上实现的从零开始的大模型训练,不仅是对摩尔线程技术实力的有力认证,更是实现了国内大模型训练的国产化闭环。摩尔线程夸娥千卡智算集群以全功能GPU为底座,提供软硬一体化的全栈解决方案,具备高兼容性、高稳定性、高扩展性等综合优势,我们致力于成为AGI时代大模型训练坚实可靠的先进基础设施。”

此前,摩尔线程与无问芯穹已达成深度战略合作。无问芯穹大模型开发与服务平台“无穹Infini-AI”和摩尔线程大模型智算千卡集群夸娥已完成系统级融合适配,该平台可以灵活调用夸娥的集群能力以完成大模型的训练、微调与推理任务。未来,双方还将开展更多适配与测试,推动国产大模型技术的快速发展与应用普及,为中国人工智能产业的蓬勃发展贡献力量。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPU芯片
    +关注

    关注

    1

    文章

    307

    浏览量

    6553
  • 摩尔线程
    +关注

    关注

    2

    文章

    285

    浏览量

    6656
  • 大模型
    +关注

    关注

    2

    文章

    3764

    浏览量

    5269

原文标题:摩尔线程携手无问芯穹:基于夸娥千卡智算集群的“MT-infini-3B”大模型实训已完成

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    沐曦股份Day 0适配阿里Qwen3.6-35B-A3B模型

    阿里巴巴模型团队最新宣布,开源旗下多模态“智能体小钢炮” Qwen3.6-35B-A3B模型
    的头像 发表于 04-22 11:13 451次阅读
    沐曦股份Day 0适配阿里<b class='flag-5'>千</b><b class='flag-5'>问</b>Qwen3.6-35<b class='flag-5'>B-A3B</b>大<b class='flag-5'>模型</b>

    Day-0支持|摩尔线程率先完成MiniMax M2.7大模型适配

    4月12日,摩尔线程旗舰级AI推一体全功能GPU MTT S5000已完成对新一代大模型Min
    发表于 04-13 07:57 1213次阅读
    Day-0支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>率先<b class='flag-5'>完成</b>MiniMax M2.7大<b class='flag-5'>模型</b>适配

    天数智完成阿里云通义Qwen3.5系列多模态模型全量适配

    近日,天数智携手众智FlagOS 社区完成阿里云通义 Qwen3.5 系列多模态模型全量适配,实现
    的头像 发表于 03-26 09:25 1566次阅读

    元智联合,即将上线AXClaw Box帝王虾盒

    近日,全球领先的AI推理SoC芯片供应商爱元智与通用人工智能基础设施服务商宣布,将共同
    的头像 发表于 03-17 09:13 530次阅读
    爱<b class='flag-5'>芯</b>元智联合<b class='flag-5'>无</b><b class='flag-5'>问</b><b class='flag-5'>芯</b><b class='flag-5'>穹</b>,即将上线AXClaw Box帝王虾盒

    沐曦股份曦云C系列GPU全面适配通义Qwen3.5三款新模型

    今日,通义团队正式开源发布Qwen3.5系列中等规模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122
    的头像 发表于 02-28 10:05 715次阅读
    沐曦股份曦云C系列<b class='flag-5'>GPU</b>全面适配通义<b class='flag-5'>千</b><b class='flag-5'>问</b>Qwen3.5三款新<b class='flag-5'>模型</b>

    摩尔线程MTT S5000全面适配Qwen3.5三款新模型

    继开源Qwen3.5-397B-A17B之后,阿里再次宣布开源3.5最新三款中等规模模型:Q
    的头像 发表于 02-26 16:23 751次阅读

    沐曦股份曦云C系列GPU深度适配通义Qwen3.5模型

    今天,通义今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的开放权重版本。沐曦股份曦云C系列
    的头像 发表于 02-26 14:26 778次阅读
    沐曦股份曦云C系列<b class='flag-5'>GPU</b>深度适配通义<b class='flag-5'>千</b><b class='flag-5'>问</b>Qwen3.5<b class='flag-5'>模型</b>

    摩尔线程快速完成对Qwen3.5模型全面适配

    2月17日,摩尔线程宣布已在旗舰级AI推一体全功能GPU MTT S5000上完成对阿里最新大
    发表于 02-18 08:32 1117次阅读

    国产算力首证具身大脑模型训练实力:摩尔线程联合智源研究院完成RoboBrain 2.5全流程训练

    随着具身智能成为人工智能的下一个战略高地,底层算力底座的自主可控显得尤为关键。近日,摩尔线程联合北京智源人工智能研究院(以下简称:智源)基于FlagOS-Robo框架,依托 MTT S5000 千卡
    的头像 发表于 01-14 09:05 755次阅读
    国产算力首证具身大脑<b class='flag-5'>模型</b>训练实力:<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>联合智源研究院<b class='flag-5'>完成</b>RoboBrain 2.5全流程训练

    人工智能千卡集群正式签约入驻新疆算力中心

    在“东数西算”国家工程全面推进的大背景下,新疆凭借其丰富的清洁能源和独特的区位优势,正迅速崛起为国家级算力网络的关键枢纽。近日,墨人工智能(以下简称“墨”)的千卡集群正式签约入驻新
    的头像 发表于 12-30 17:27 920次阅读

    摩尔线程携手生态合作伙伴打造的AI教育基地启用

    近日,摩尔线程携手科大讯飞等生态合作伙伴打造的AI教育基地在江苏省锡山高级中学(以下简称“省锡中”)正式启用。作为无锡市惠山区首个落地的AI教育
    的头像 发表于 09-08 14:43 1576次阅读

    阿里通义发布小尺寸模型Qwen3-4B,手机也能跑

    电子发烧友网综合报道 8月7日,阿里通义宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen
    的头像 发表于 08-12 17:15 7002次阅读
    阿里通义<b class='flag-5'>千</b><b class='flag-5'>问</b>发布小尺寸<b class='flag-5'>模型</b>Qwen<b class='flag-5'>3-4B</b>,手机也能跑

    摩尔线程吴庆详解 MUSA 软件栈:以技术创新释放 KUAE 集群潜能,引领 GPU 计算新高度​

    的分享。GPU 计算软件开发总监吴庆登上讲台,发表了题为《摩尔线程 MUSA 软件栈助力 KUAE 集群释放无限潜能》的演讲。他从专业视角出发,为在场听众深入剖析了 MUSA 软件栈在
    的头像 发表于 07-28 13:47 6407次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>吴庆详解 MUSA 软件栈:以技术创新释放 KUAE <b class='flag-5'>集群</b>潜能,引领 <b class='flag-5'>GPU</b> 计算新高度​

    摩尔线程GPU率先支持Qwen3全系列模型

    近日,阿里云正式发布Qwen3系列的8款开源混合推理模型摩尔线程团队在模型发布当天,率先完成
    的头像 发表于 05-07 15:24 1130次阅读

    壁仞科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen
    的头像 发表于 04-30 15:19 1710次阅读