0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程MTT S5000率先完成对GLM-5的适配

摩尔线程 来源:摩尔线程 2026-02-12 10:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2月11日,智谱正式发布新一代大模型GLM-5。摩尔线程基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,Day-0完成了全流程适配与验证。

凭借MUSA架构广泛的算子覆盖与强大的生态兼容能力,摩尔线程成功打通了模型推理全链路,并深度释放MTT S5000的原生FP8加速能力,在确保模型精度的同时显著降低了显存占用,实现了GLM-5的高性能推理。此次快速适配,不仅印证了MUSA软件栈的成熟度,更充分展现了国产全功能GPU对最新大模型即时、高效的支持能力。

GLM-5与MTT S5000的国产双强联合,将为开发者带来可对标国际顶尖模型的极致编程体验。无论是在函数补全、漏洞检测还是Debug场景中,该组合均表现卓越,以显著增强的逻辑规划能力,从容应对各类复杂的长程任务挑战。

GLM-5核心特性:

定义Agentic Engineering新高度

作为GLM系列的最新里程碑版本,GLM-5定位为当下顶尖的Coding模型,整体性能较上一代提升20%。其核心突破在于Agentic Engineering(代理工程)能力——不仅具备深厚的代码功底,更拥有处理复杂系统工程与长程Agent任务的实力,能够实现从需求到应用的端到端开发。

41c44388-07ac-11f1-90a1-92fbcf53809c.png

在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一。

4232556c-07ac-11f1-90a1-92fbcf53809c.png

GLM-5在编程能力上实现了对齐Claude Opus 4.5,在业内公认的主流基准测试中取得开源模型SOTA。在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数,性能超过 Gemini 3 Pro。

429e9e3e-07ac-11f1-90a1-92fbcf53809c.png

在内部Claude Code评估集合中,GLM-5在前端、后端、长程任务等编程开发任务上显著超越上一代的GLM-4.7(平均增幅超过20%),能够以极少的人工干预,自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近Opus 4.5。

摩尔线程核心优势:

软硬协同的全栈算力底座

MTT S5000是专为大模型训练、推理及高性能计算而设计的全功能GPU智算卡,基于第四代MUSA架构“平湖”打造。其单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达到1.6TB/s,卡间互联带宽为784GB/s,完整支持从FP8到FP64的全精度计算。

依托MUSA全栈平台,MTT S5000原生适配PyTorch、Megatron-LM、vLLM及SGLang等主流框架,助力用户实现“零成本”代码迁移。无论是构建万卡级大规模训练集群,还是部署高并发、低延迟的在线推理服务,MTT S5000均展现出对标国际主流旗舰产品的卓越性能与稳定性,旨在为行业筑牢坚实、易用的国产算力底座。

此次实现对GLM-5模型的快速支持,正是摩尔线程基于MTT S5000构建的软硬协同技术能力的集中体现:

▼底层架构与生态兼容:天生适配,极速迁移

针对GLM-5的长序列推理场景,MTT S5000凭借充沛的算力储备与高计算密度,结合对稀疏Attention的架构级支持,在大规模上下文处理中依然保持高吞吐与低延迟。同时,MUSA软件栈的敏捷性是实现Day-0适配的关键。基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%,使得绝大多数通用算子可直接复用,显著降低移植成本,并能快速跟进前沿模型结构与新特性演进。

▼原生FP8加速:SGLang 框架深度优化

基于高性能的SGLang-MUSA推理引擎及MTT S5000的硬件原生FP8计算单元,摩尔线程实现了推理效率的跃升。与传统BF16相比,原生FP8在保持GLM-5卓越的代码生成与逻辑推理能力(精度无损)的同时,大幅降低了显存占用,并显著提升了推理吞吐量,为大规模部署提供了更高性价比的方案。

▼独创ACE引擎:通信计算并行,释放极致吞吐

针对大模型分布式推理中的通信痛点,MTT S5000利用独创的异步通信引擎(ACE),将复杂的通信任务从计算核心中卸载,实现了物理级的“通信计算重叠”。这一机制有效释放15%的通信被占算力,配合首创的细粒度重计算技术(将开销降至原有的1/4),全方位提升计算效率与系统吞吐量。

▼超长上下文支持:专为AI Coding打造

通过高效算子融合及框架极致优化,MTT S5000在确保代码生成质量的同时显著降低了响应延迟。无论是处理复杂的代码库分析,还是运行长周期的智能体(Agent)任务,均能保持首字延迟(TTFT)低、生成速度快的流畅体验。MTT S5000与GLM-5的软硬双强组合,在函数补全、漏洞检测等核心场景的表现超越同级,充分释放模型的规划能力和Debug能力,是执行长程开发任务的理想选择。

从GLM-4.6、GLM-4.7到GLM-5,摩尔线程已将“发布即适配”化为常态,这种对主流软件栈的无缝兼容与敏捷响应,充分证明了国产全功能GPU及MUSA软件栈的成熟度与稳定性,确保开发者能第一时间触达最新模型能力,从而携手共建蓬勃发展的国产AI生态。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52339
  • MUSA
    +关注

    关注

    0

    文章

    8

    浏览量

    2186
  • 摩尔线程
    +关注

    关注

    2

    文章

    299

    浏览量

    6690

原文标题:Day-0支持|摩尔线程MTT S5000率先完成对GLM-5的适配

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程完成DeepSeek-V4全链路工程化适配S5000基于MUSA+SGLang实现复杂MoE模型快速落地

    近日,摩尔线程依托旗舰级AI训推一体智算卡MTT S5000与自研MUSA软件栈,基于SGLang 开源推理框架,成功完成DeepSeek-
    发表于 05-02 09:01 836次阅读

    摩尔线程携手上海AI实验室Day-0适配DeepSeek-V4核心算子

    MTT S5000完成了核心算子的Day-0适配。目前算子通过率已超80%,真正实现了模型发布与国产算力适配的同步落地。这一成果不仅为
    的头像 发表于 04-30 16:24 2102次阅读

    摩尔线程 x 中国移动|国产GPU率先支撑央企大模型,S5000完成九天35B大模型适配

    近日,中国移动自主研发的九天35B通用大模型即将正式发布。作为中国移动重要的生态合作伙伴及 “AI 能力联合舰队” 的核心算力成员,摩尔线程基于旗舰级AI训推一体全功能GPU MTT S500
    发表于 04-28 08:32 950次阅读

    摩尔线程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0适配DeepSeek-V4

    4月24日,摩尔线程携手智源众智FlagOS社区,在旗舰级AI训推一体全功能GPU MTT S5000上,率先实现对新一代大模型DeepSe
    发表于 04-24 16:30 1988次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>S5000</b> + 智源FlagOS:基于原生FP8引擎,Day-0<b class='flag-5'>适配</b>DeepSeek-V4

    Day-0支持|摩尔线程率先完成MiniMax M2.7大模型适配

    4月12日,摩尔线程旗舰级AI训推一体全功能GPU MTT S5000完成对新一代大模型MiniMax M2.7的Day-0极速
    发表于 04-13 07:57 1449次阅读
    Day-0支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>率先</b><b class='flag-5'>完成</b>MiniMax M2.7大模型<b class='flag-5'>适配</b>

    Day-0支持|摩尔线程完成智谱GLM-5.1极速适配,高效支撑长程任务与代码生成

      今日,摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对智谱新一代旗舰模型GLM-5.1的Day-0极速
    的头像 发表于 04-08 14:47 1221次阅读
    Day-0支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>完成</b>智谱<b class='flag-5'>GLM</b>-5.1极速<b class='flag-5'>适配</b>,高效支撑长程任务与代码生成

    摩尔线程S5000通过智源FlagOS训练验证,精度高出国际主流1.65个百分点

    之一,摩尔线程基于旗舰级AI训推一体全功能GPU智算卡MTT S5000,完整适配了FlagOS训练全要素软件栈——包括FlagScale系
    发表于 03-27 20:11 929次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>S5000</b>通过智源FlagOS训练验证,精度高出国际主流1.65个百分点

    摩尔线程业绩快报:2025年营收同比增长243.37%,S5000全栈适配SOTA大模型加速释放商业潜能

    S5000实现规模化量产,单卡AI稠密算力达1000 TFLOPS,居行业前列。 ·生态加速:率先完成GLM-5、MiniMax M2.5、Kimi K2.5、Qwen3.5等SOT
    发表于 02-27 19:47 1007次阅读

    摩尔线程MTT S5000全面适配Qwen3.5三款新模型

    第一时间做出极速响应,宣布已在旗舰级AI训推一体全功能GPU MTT S5000上,完成对这三款全新模型的全方位适配。   此次高效支持充分展示了
    的头像 发表于 02-26 16:23 939次阅读

    摩尔线程快速完成对Qwen3.5模型全面适配

    2月17日,摩尔线程宣布已在旗舰级AI训推一体全功能GPU MTT S5000完成对阿里最新大模型Qwen3.5的全方位
    发表于 02-18 08:32 1157次阅读

    Day-0支持|摩尔线程完成MiniMax M2.5模型极速适配

    2月14日,摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对MiniMax新一代大模型MiniMax M2.5的Day-0极速
    发表于 02-15 08:01 1625次阅读

    寒武纪实现对GLM-5的Day 0适配

    2026年2月11日,寒武纪已基于 vLLM 推理框架同步实现对智谱最新开源旗舰模型  GLM-5适配。寒武纪一直高度重视大模型软件生态建设,借助于成熟的自研 Neuware 软件生态和长期
    的头像 发表于 02-12 15:07 1028次阅读

    曦云C系列GPU Day 0 适配智谱全新一代大模型GLM-5

    智谱AI正式上线并开源全新一代大模型 GLM-5,沐曦股份实现 Day 0 深度适配GLM-5目前可于曦云 C 系列(C500/C550/C588)上稳定高效运行。 近期,智谱AI相继发布
    的头像 发表于 02-12 10:53 1241次阅读
    曦云C系列GPU Day 0 <b class='flag-5'>适配</b>智谱全新一代大模型<b class='flag-5'>GLM-5</b>

    Day-0支持|摩尔线程MTT S5000率先完成对GLM-5适配

    2月11日,智谱正式发布新一代大模型GLM-5摩尔线程基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,D
    发表于 02-12 09:15 1714次阅读
    Day-0支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>MTT</b> <b class='flag-5'>S5000</b><b class='flag-5'>率先</b><b class='flag-5'>完成对</b><b class='flag-5'>GLM-5</b>的<b class='flag-5'>适配</b>

    全栈国产AI Coding上线:摩尔线程+硅基流动+智谱,强强联合!

    摩尔线程今日正式推出AI Coding Plan 智能编程服务。作为首个基于国产全功能 GPU 算力底座构建的智能开发解决方案,该服务以 MTT S5000 强劲的全精度计算能力为核心
    的头像 发表于 02-03 17:07 2110次阅读
    全栈国产AI Coding上线:<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>+硅基流动+智谱,强强联合!