摩尔线程携手智源人工智能研究院Day-0适配DeepSeek-V4 Pro和Flash双模型-电子发烧友网

4月24日，摩尔线程联合北京智源人工智能研究院，基于旗舰级AI训推一体智算卡MTT S5000与FlagOS全栈软件体系，完成DeepSeek-V4系列两款模型推理“Day-0”适配，并在魔塔社区正式发布Pro和Flash两个版本的镜像，为开发者与行业用户带来开箱即用的国产化部署方案。

DeepSeek-V4-Pro镜像地址：

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Pro-mthreads-FlagOS

DeepSeek-V4-Flash镜像地址：

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-mthreads-FlagOS

此次镜像发布，标志着摩尔线程在前沿大模型适配、先进精度承载和国产算力生态建设上取得新进展，也体现出摩尔线程与智源研究院围绕FlagOS生态适配持续深化的战略合作正在加速落地。

当前，大模型快速迭代演进，模型能力竞争正加速向工程化落地能力延伸。面对DeepSeek-V4这类对底层精度能力、算子支持、编译优化与推理效率提出更高要求的先进模型，摩尔线程依托 MTT S5000原生FP8能力与完善的软件生态，率先实现Day0适配，进一步验证了国产GPU平台对前沿模型的快速承载能力。

原生FP8引擎，夯实先进模型高效推理底座

随着大模型进入先进混合精度时代，原生FP8支持正成为衡量AI基础设施能力的重要指标之一。相较于传统BF16、FP16路径，FP8在吞吐效率、显存占用和带宽利用方面具备更优平衡，更适合承接参数规模更大、推理链路更复杂的新一代模型。

作为国内率先原生支持FP8的全功能GPU，摩尔线程MTT S5000面向大模型训推场景打造，具备支撑先进精度计算的核心能力，能够更高效匹配DeepSeek-V4对性能与精度协同优化的要求。此次DeepSeek-V4 Day0适配，正是摩尔线程原生FP8引擎优势在前沿模型落地中的集中体现。

依托这一能力，摩尔线程不仅能够第一时间支持前沿模型运行，更能够以更贴合模型精度趋势的硬件能力，实现高质量、高效率的推理部署，为开发者和行业用户提供更具竞争力的国产算力选择。

三大技术亮点，

释放摩尔线程平台工程化适配能力

围绕DeepSeek-V4的部署需求，摩尔线程与FlagOS生态协同推进了多项关键技术能力落地，进一步展现了MTT S5000在先进模型推理场景下的工程化优势。

首先，依托统一高性能算子能力与统一编译支撑，DeepSeek-V4在摩尔线程平台上实现了从底层算子承接到运行部署的高效贯通，显著提升先进模型在国产GPU上的开箱可用性和适配效率。

其次，面向复杂模型结构带来的多卡部署挑战，双方围绕并行通信路径进行了针对性优化，进一步增强了 DeepSeek-V4 在多卡、多机场景下的部署灵活性，为更大规模的推理落地提供支撑。

再次，针对先进模型在精度路径和权重迁移上的复杂需求，双方打通了自动化权重转换与后续量化部署能力，使 DeepSeek-V4 在摩尔线程平台上的迁移、验证和持续优化更加高效，也为后续资源效率提升和规模化应用奠定基础。

从原生FP8承载，到算子、编译、并行、迁移与镜像化交付的完整链路贯通，摩尔线程展现出的不仅是单点硬件能力，更是面向先进模型持续演进的系统级支撑能力。

软硬协同优化，推动先进模型“发布即可用”

先进模型的价值，不仅在于模型本身，更在于能否快速完成适配、部署与应用验证。围绕大模型训练、推理与服务化落地需求，摩尔线程持续完善从驱动、编译器、运行时到推理引擎、开发工具链和镜像交付的全栈软件能力，形成了面向开发者友好的国产GPU软件生态。

在本次DeepSeek-V4适配中，摩尔线程软件生态与FlagOS技术体系实现深度协同。一方面，MTT S5000的原生FP8支持为先进精度路径提供直接承载；另一方面，FlagOS在统一算子、统一编译、多芯迁移和镜像化交付上的能力，则进一步缩短了模型适配周期，降低了部署复杂度。

最终，用户在魔塔社区即可获取DeepSeek-V4模型镜像，快速完成环境拉起、模型验证与部署实践，显著降低先进模型在国产平台上的使用门槛，推动大模型应用从“可运行”迈向“易部署、易验证、易落地”。

携手智源研究院，

共建国产算力全栈软件生态

此次成果发布的背后，是摩尔线程与智源研究院围绕FlagOS生态适配开展的深度协同。作为面向多种AI芯片的系统软件技术体系，FlagOS在统一算子、统一编译、模型迁移与镜像发布等方面提供了关键支撑，为先进模型在不同算力平台上的快速落地建立起高效路径。

围绕DeepSeek-V4推理适配需求，双方技术团队面向MTT S5000平台开展联合优化，打通了从底层算子适配、精度路径承接、编译执行优化到运行环境封装、镜像发布的关键链路，推动模型镜像在魔塔社区顺利上线。

这不仅是一项模型适配成果，更是摩尔线程与智源研究院在国产算力与基础软件协同创新方面长期战略合作的又一落地实践。双方正以芯片能力、系统软件与模型工程化交付的深度协同，共同构建自主可控、开放繁荣的国产算力全栈软件生态。

未来，摩尔线程将继续发挥MTT S5000与原生FP8引擎优势，联合智源研究院及更多生态伙伴，持续推进更多前沿模型在FlagOS生态中的高质量适配与高效率发布，加快国产AI基础设施体系完善，助力大模型在更多行业场景实现落地应用。

开发者可前往魔塔社区获取镜像：

DeepSeek-V4-Flash

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-mthreads-FlagOS

DeepSeek-V4-Pro

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Pro-mthreads-FlagOS

关于摩尔线程

摩尔线程以全功能GPU为核心，致力于向全球提供加速计算的基础设施和一站式解决方案，为各行各业的数智化转型提供强大的AI计算支持。

我们的目标是成为具备国际竞争力的GPU领军企业，为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
5282

浏览量
136085
人工智能

人工智能

+关注

关注
1820

文章
50364

浏览量
267015
摩尔线程

摩尔线程

+关注

关注
2

文章
289

浏览量
6665

原文标题：摩尔线程S5000 + 智源FlagOS｜Day-0适配DeepSeek-V4 Pro和Flash双模型，并发布镜像

文章出处：【微信号：moorethreads，微信公众号：摩尔线程】欢迎添加关注！文章转载请注明出处。

搜索历史

摩尔线程携手智源人工智能研究院Day-0适配DeepSeek-V4 Pro和Flash双模型

评论