0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程携手智源人工智能研究院Day-0适配DeepSeek-V4 Pro和Flash双模型

摩尔线程 来源:摩尔线程 2026-04-30 16:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月24日,摩尔线程联合北京智源人工智能研究院,基于旗舰级AI训推一体智算卡MTT S5000与FlagOS全栈软件体系,完成DeepSeek-V4系列两款模型推理“Day-0”适配,并在魔塔社区正式发布Pro和Flash两个版本的镜像,为开发者与行业用户带来开箱即用的国产化部署方案。

DeepSeek-V4-Pro镜像地址:

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Pro-mthreads-FlagOS

DeepSeek-V4-Flash镜像地址:

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-mthreads-FlagOS

此次镜像发布,标志着摩尔线程在前沿大模型适配、先进精度承载和国产算力生态建设上取得新进展,也体现出摩尔线程与智源研究院围绕FlagOS生态适配持续深化的战略合作正在加速落地。

当前,大模型快速迭代演进,模型能力竞争正加速向工程化落地能力延伸。面对DeepSeek-V4这类对底层精度能力、算子支持、编译优化与推理效率提出更高要求的先进模型,摩尔线程依托 MTT S5000原生FP8能力与完善的软件生态,率先实现Day0适配,进一步验证了国产GPU平台对前沿模型的快速承载能力。

原生FP8引擎,夯实先进模型高效推理底座

随着大模型进入先进混合精度时代,原生FP8支持正成为衡量AI基础设施能力的重要指标之一。相较于传统BF16、FP16路径,FP8在吞吐效率、显存占用和带宽利用方面具备更优平衡,更适合承接参数规模更大、推理链路更复杂的新一代模型。

作为国内率先原生支持FP8的全功能GPU,摩尔线程MTT S5000面向大模型训推场景打造,具备支撑先进精度计算的核心能力,能够更高效匹配DeepSeek-V4对性能与精度协同优化的要求。此次DeepSeek-V4 Day0适配,正是摩尔线程原生FP8引擎优势在前沿模型落地中的集中体现。

依托这一能力,摩尔线程不仅能够第一时间支持前沿模型运行,更能够以更贴合模型精度趋势的硬件能力,实现高质量、高效率的推理部署,为开发者和行业用户提供更具竞争力的国产算力选择。

三大技术亮点,

释放摩尔线程平台工程化适配能力

围绕DeepSeek-V4的部署需求,摩尔线程与FlagOS生态协同推进了多项关键技术能力落地,进一步展现了MTT S5000在先进模型推理场景下的工程化优势。

首先,依托统一高性能算子能力与统一编译支撑,DeepSeek-V4在摩尔线程平台上实现了从底层算子承接到运行部署的高效贯通,显著提升先进模型在国产GPU上的开箱可用性和适配效率。

其次,面向复杂模型结构带来的多卡部署挑战,双方围绕并行通信路径进行了针对性优化,进一步增强了 DeepSeek-V4 在多卡、多机场景下的部署灵活性,为更大规模的推理落地提供支撑。

再次,针对先进模型在精度路径和权重迁移上的复杂需求,双方打通了自动化权重转换与后续量化部署能力,使 DeepSeek-V4 在摩尔线程平台上的迁移、验证和持续优化更加高效,也为后续资源效率提升和规模化应用奠定基础。

从原生FP8承载,到算子、编译、并行、迁移与镜像化交付的完整链路贯通,摩尔线程展现出的不仅是单点硬件能力,更是面向先进模型持续演进的系统级支撑能力。

软硬协同优化,推动先进模型“发布即可用”

先进模型的价值,不仅在于模型本身,更在于能否快速完成适配、部署与应用验证。围绕大模型训练、推理与服务化落地需求,摩尔线程持续完善从驱动、编译器、运行时到推理引擎、开发工具链和镜像交付的全栈软件能力,形成了面向开发者友好的国产GPU软件生态。

在本次DeepSeek-V4适配中,摩尔线程软件生态与FlagOS技术体系实现深度协同。一方面,MTT S5000的原生FP8支持为先进精度路径提供直接承载;另一方面,FlagOS在统一算子、统一编译、多芯迁移和镜像化交付上的能力,则进一步缩短了模型适配周期,降低了部署复杂度。

最终,用户在魔塔社区即可获取DeepSeek-V4模型镜像,快速完成环境拉起、模型验证与部署实践,显著降低先进模型在国产平台上的使用门槛,推动大模型应用从“可运行”迈向“易部署、易验证、易落地”。

携手智源研究院,

共建国产算力全栈软件生态

此次成果发布的背后,是摩尔线程与智源研究院围绕FlagOS生态适配开展的深度协同。作为面向多种AI芯片的系统软件技术体系,FlagOS在统一算子、统一编译、模型迁移与镜像发布等方面提供了关键支撑,为先进模型在不同算力平台上的快速落地建立起高效路径。

围绕DeepSeek-V4推理适配需求,双方技术团队面向MTT S5000平台开展联合优化,打通了从底层算子适配、精度路径承接、编译执行优化到运行环境封装、镜像发布的关键链路,推动模型镜像在 魔塔社区顺利上线。

这不仅是一项模型适配成果,更是摩尔线程与智源研究院在国产算力与基础软件协同创新方面长期战略合作的又一落地实践。双方正以芯片能力、系统软件与模型工程化交付的深度协同,共同构建自主可控、开放繁荣的国产算力全栈软件生态。

未来,摩尔线程将继续发挥MTT S5000与原生FP8引擎优势,联合智源研究院及更多生态伙伴,持续推进更多前沿模型在FlagOS生态中的高质量适配与高效率发布,加快国产AI基础设施体系完善,助力大模型在更多行业场景实现落地应用。

开发者可前往魔塔社区获取镜像:

DeepSeek-V4-Flash

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-mthreads-FlagOS

DeepSeek-V4-Pro

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Pro-mthreads-FlagOS

关于摩尔线程

摩尔线程以全功能GPU为核心,致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。

我们的目标是成为具备国际竞争力的GPU领军企业,为融合人工智能和数字孪生的数智世界打造先进的加速计算平台。我们的愿景是为美好世界加速。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5282

    浏览量

    136085
  • 人工智能
    +关注

    关注

    1820

    文章

    50364

    浏览量

    267015
  • 摩尔线程
    +关注

    关注

    2

    文章

    289

    浏览量

    6665

原文标题:摩尔线程S5000 + 智源FlagOS|Day-0适配DeepSeek-V4 Pro和Flash双模型,并发布镜像

文章出处:【微信号:moorethreads,微信公众号:摩尔线程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    云天励飞完成DeepSeek-V4系列模型关键机制适配验证

    4月24日,DeepSeek-V4 系列模型发布。围绕该模型 CSA/HCA 混合注意力机制带来的新型计算需求,云天励飞依托自研 GPNPU 架构及 IFWA
    的头像 发表于 04-30 17:09 197次阅读

    摩尔线程携手上海AI实验室Day-0适配DeepSeek-V4核心算子

    今日,DeepSeek-V4预览版正式发布并开源。摩尔线程携手上海 AI 实验室 DeepLink 团队,通过大模型驱动的
    的头像 发表于 04-30 16:24 169次阅读

    摩尔线程TileLang-MUSA率先支持DeepSeek-V4全新TileKernels

    4月24日,摩尔线程宣布,其基于TileLang 0.1.8版本深度优化并已成为TileLang官方主线版本的TileLang-MUSA,已率先在国产全功能GPU上,实现对DeepSeek-V
    的头像 发表于 04-30 16:17 87次阅读

    开放原子AtomGit平台首发适配DeepSeek-V4系列模型

    2026年4月24日,DeepSeek-V4系列模型正式发布并同步开源。AtomGit平台为DeepSeek-V4昇腾适配版本首发平台,为开
    的头像 发表于 04-29 16:12 591次阅读

    登临科技GPU+架构深度适配DeepSeek-V4模型

    DeepSeek-V4-Flash,全系标配百万token长上下文能力,开启大模型长文本普惠新时代。同日,开源社区已提交适配DeepSeek-V4的代码。 作为国产高性能通用GPU的
    的头像 发表于 04-29 16:07 837次阅读

    寒武纪Day 0适配DeepSeek-V4模型

    2026年4月24日,寒武纪已基于 vLLM 推理框架完成对深度求索公司最新开源模型285B DeepSeek-V4-flash 和1.6T DeepSeek-V4-pro
    的头像 发表于 04-29 10:14 249次阅读

    华为云首发适配DeepSeek-V4模型

    4月24日,DeepSeek-V4模型正式发布并开源,华为云首发适配DeepSeek-V4拥有百万Token超长上下文,在Agent能力、
    的头像 发表于 04-28 17:01 432次阅读

    沐曦股份Day 0适配DeepSeek-V4-Flash模型

    4月24日,沐曦股份携手FlagOS,已完对DeepSeek最新开源的DeepSeek-V4-Flash模型
    的头像 发表于 04-28 15:53 229次阅读

    燧原科技L600 FP8原生适配DeepSeek-V4-Pro/Flash模型

    2026年4月24日,深度求索(DeepSeek)正式发布并开源新一代旗舰大模型DeepSeekV4,同步推出1.6T
    的头像 发表于 04-28 15:19 346次阅读

    壁仞科技壁砺166系列GPU产品率先支持DeepSeek-V4模型

    4月24日,深度求索团队宣布全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。依托成熟的BIRENSUPA软件栈与自研GPU全栈智能体“AIModelMaster”,
    的头像 发表于 04-28 14:04 420次阅读
    壁仞科技壁砺166系列GPU产品率先支持<b class='flag-5'>DeepSeek-V4</b><b class='flag-5'>模型</b>

    OpenClaw 全面接入DeepSeek-V4系列模型

    近期,OpenClaw 2026.4.24版本全面接入DeepSeek-V4系列模型,以V4-Flash为默认大脑,V4-Pro同步上线,构建百万级Token上下文处理能力。
    的头像 发表于 04-28 09:29 542次阅读

    摩尔线程S5000 + 智FlagOS:基于原生FP8引擎,Day-0适配DeepSeek-V4

    4月24日,摩尔线程携手众智FlagOS社区,在旗舰级AI训推一体全功能GPU MTT S5000上,率先实现对新一代大
    发表于 04-24 16:30 1075次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>S5000 + 智<b class='flag-5'>源</b>FlagOS:基于原生FP8引擎,<b class='flag-5'>Day-0</b><b class='flag-5'>适配</b><b class='flag-5'>DeepSeek-V4</b>

    Day-0支持|摩尔线程率先完成MiniMax M2.7大模型适配

    4月12日,摩尔线程旗舰级AI训推一体全功能GPU MTT S5000已完成对新一代大模型MiniMax M2.7的Day-0极速
    发表于 04-13 07:57 1370次阅读
    <b class='flag-5'>Day-0</b>支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>率先完成MiniMax M2.7大<b class='flag-5'>模型</b><b class='flag-5'>适配</b>

    Day-0支持|摩尔线程完成MiniMax M2.5模型极速适配

    2月14日,摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对MiniMax新一代大模型MiniMax M2.5的Day-0极速
    发表于 02-15 08:01 1588次阅读

    Day-0支持|摩尔线程MTT S5000率先完成对GLM-5的适配

    2月11日,智谱正式发布新一代大模型GLM-5。摩尔线程基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,Day-0完成了全流程
    发表于 02-12 09:15 1633次阅读
    <b class='flag-5'>Day-0</b>支持|<b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>MTT S5000率先完成对GLM-5的<b class='flag-5'>适配</b>