0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

沐曦股份Day 0适配阿里千问Qwen3.6-35B-A3B大模型

沐曦MetaX 来源:沐曦MetaX 2026-04-22 11:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

阿里巴巴千问模型团队最新宣布,开源旗下多模态“智能体小钢炮” Qwen3.6-35B-A3B模型。沐曦股份与FlagOS合作,完成了该模型的Day0 适配。经测试,基于沐曦芯片,实现了“零代码修改”完成 Qwen3.6-35B-A3B 的推理部署及充分验证。这充分展示出了沐曦股份软硬件协同的兼容优势与生态合作的协同作用。

Qwen3.6-35B-A3B是一个完全开源的稀疏 MoE(混合专家)模型,主打轻量高效。模型总参数量为350亿, 激活参数只有30亿。据模型研发团队介绍,Qwen3.6-35B-A3B在智能体编程方面表现卓越,大幅超越前代Qwen3.5-35B-A3B,并可与Qwen3.5-27B、Gemma4-31B等稠密模型一较高下。主要特性包括:

卓越的智能体编程能力,可与大得多的模型相媲美

强大的多模态感知与推理能力

739ecb72-3a46-11f1-90a1-92fbcf53809c.png

沐曦股份此次与FlagOS合作实现Day0适配,主要依靠四项关键技术支撑:

FlagOS 为 vLLM 推理框架打造的专属插件vLLM-plugin-FL。插件可以在完全不改变 vLLM 原生接口与用户使用习惯的前提下,实现Qwen3.6-35B-A3B的多芯片推理部署。

高性能通用大模型算子库FlagGems,核心算子深度适配,释放硬件算力。

统一的AI 编译器 FlagTree,实现一次编写,多芯编译。

模型跨芯迁移发布工具 FlagRelease:半自动实现模型跨芯迁移与版本发布。

目前,FlagOS已经完成针对Qwen3.6-35B-A3B开源模型的多芯适配、精度对齐与部署验证,开发者可直接获取对应芯片的开箱即用方案。

依托“自研GPU硬件+MXMACA软件栈”的软硬一体核心优势,沐曦股份快速响应大模型迭代节奏,高效完成了多款主流模型的适配工作。近一段时间来,公司已累计完成Day 0适配模型超16个,全面覆盖MiniMax、智谱、阿里千问、阶跃星辰、百度飞桨等头部厂商的最新旗舰模型,涵盖语言、多模态、OCR等全品类,在国产GPU Day 0适配赛道持续保持行业领先地位,以全栈技术实力为大模型快速落地筑牢算力支撑。

沐曦股份未来将继续与FlagOS深度合作,以Day 0适配为标准,实现大模型“发布即落地”,共同打造从底层算力到上层应用的无缝衔接生态,加速AI技术在千行百业的规模化部署,共建自主可控的智能计算新底座。

双方合作的模型适配版本链接见下,欢迎体验!

魔搭平台:

https://modelscope.cn/models/FlagRelease/Qwen3.6-35B-A3B-nomtp-metax-FlagOS

HuggingFace:

https://huggingface.co/FlagRelease/Qwen3.6-35B-A3B-nomtp-metax-FlagOS

关于沐曦股份

沐曦股份致力于自主研发全栈高性能GPU芯片及计算平台,为智算、通用计算、云渲染等前沿领域提供高能效、高通用性的算力支撑,助力数字经济发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里
    +关注

    关注

    6

    文章

    468

    浏览量

    34236
  • 沐曦
    +关注

    关注

    1

    文章

    100

    浏览量

    1876
  • 大模型
    +关注

    关注

    2

    文章

    3765

    浏览量

    5269

原文标题:沐曦股份Day0适配阿里千问Qwen3.6-35B-A3B,与FlagOS合作实现模型多芯部署

文章出处:【微信号:沐曦MetaX,微信公众号:沐曦MetaX】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    海光信息DCU平台适配阿里通义Qwen3.6-35B-A3B模型

      近日,阿里通义正式开源多模态智能体大模型Qwen3.6-35B-A3B,发布不到24小时,海光信息联合众智FlagOS社区完成该模型在海光DCU平台的全流程
    的头像 发表于 04-21 17:40 1472次阅读

    登临科技KS系列GPU产品深度适配阿里Qwen3.6模型

    2026年4月,继Qwen3.5系列之后,阿里正式推出了Qwen3.6的首个开源权重版本。该版本基于社区直接反馈打造,更注重稳定性与实际
    的头像 发表于 04-21 16:50 686次阅读
    登临科技KS系列GPU产品深度<b class='flag-5'>适配</b><b class='flag-5'>阿里</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen3.6</b>大<b class='flag-5'>模型</b>

    壁仞科技光速支持阿里Qwen3.6-35B-A3B模型

    4月16日晚,阿里巴巴通义实验室正式宣布全量开源Qwen3.6-35B-A3B模型。该模型为混合专家(MoE)模型,总参数量为350亿,激
    的头像 发表于 04-20 17:50 1477次阅读

    股份云C系列GPU产品Day 0适配百度文心ERNIE-Image文生图模型

    4月15日,百度文心大模型团队重磅推出ERNIE‑Image文生图模型股份云 C 系列
    的头像 发表于 04-15 17:39 442次阅读

    股份云C系列GPU产品Day 0适配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗舰大模型M2.7开源。股份云C系列GPU已完成对 M2.7的
    的头像 发表于 04-13 17:08 456次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU产品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>适配</b>MiniMax M2.7<b class='flag-5'>模型</b>

    股份云C系列GPU产品Day 0适配智谱GLM-5.1旗舰模型

    4月8日,智谱新一代旗舰模型GLM-5.1实现开源。目前,股份云 C 系列 GPU已完成该系列模型
    的头像 发表于 04-09 11:25 351次阅读

    股份云C系列GPU全面适配通义Qwen3.5三款新模型

    今日,通义团队正式开源发布Qwen3.5系列中等规模模型,推出包括Qwen3.5-35B-A3BQ
    的头像 发表于 02-28 10:05 715次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU全面<b class='flag-5'>适配</b>通义<b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.5三款新<b class='flag-5'>模型</b>

    股份云C系列GPU深度适配通义Qwen3.5模型

    今天,通义今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397
    的头像 发表于 02-26 14:26 778次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU深度<b class='flag-5'>适配</b>通义<b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.5<b class='flag-5'>模型</b>

    云C600 GPU产品适配阶跃星辰基座模型Step 3.5 Flash

    今天,阶跃星辰技术团队发布并开源最新旗舰基座模型 Step 3.5 Flash。股份已实现云C600与该
    的头像 发表于 02-02 14:44 535次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C600 GPU产品<b class='flag-5'>适配</b>阶跃星辰基座<b class='flag-5'>模型</b>Step 3.5 Flash

    股份云C系列GPU Day 0适配智谱GLM-4.6V多模态大模型

    12月8日智谱AI发布并开源 GLM-4.6V 系列多模态大模型股份云C系列GPU完成Day
    的头像 发表于 12-17 14:28 821次阅读
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU <b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>适配</b>智谱GLM-4.6V多模态大<b class='flag-5'>模型</b>

    阿里通义发布小尺寸模型Qwen3-4B,手机也能跑

    电子发烧友网综合报道 8月7日,阿里通义宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和
    的头像 发表于 08-12 17:15 7002次阅读
    <b class='flag-5'>阿里</b>通义<b class='flag-5'>千</b><b class='flag-5'>问</b>发布小尺寸<b class='flag-5'>模型</b><b class='flag-5'>Qwen3-4B</b>,手机也能跑

    Arm CPU适配通义Qwen3系列模型

    近日,阿里巴巴开源了新一代通义模型 Qwen3,Arm 率先成为首批成功适配
    的头像 发表于 05-12 16:37 1589次阅读

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义 Qwen3,此次 Qwen3
    的头像 发表于 05-08 11:45 3212次阅读
    NVIDIA使用<b class='flag-5'>Qwen3</b>系列<b class='flag-5'>模型</b>的最佳实践

    后摩智能NPU适配通义Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列开源混合推理模型。用时不到1天,后摩智能自研NPU迅速实现Qwen3 系列模型
    的头像 发表于 05-07 16:46 1543次阅读

    壁仞科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3
    的头像 发表于 04-30 15:19 1710次阅读