0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

海光DCU完成Qwen3.5多模态MoE模型全量适配

CHANBAEK 来源:海光信息 2026-03-26 09:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,海光DCU完成Qwen3.5-397B MoE旗舰多模态模型、Qwen3.5-35B-A3B MoE多模态模型全量适配、精度对齐与推理部署验证。本次适配依托FlagOS专属vLLM-plugin-FL多芯片插件实现落地。

FlagOS是一款专为异构AI芯片打造的开源、统一系统软件栈,支持AI模型一次开发即可无缝移植至各类硬件平台,大幅降低迁移与适配成本。FlagOS专属vLLM-plugin-FL多芯片插件完美兼容海光DCU芯片,全程无需修改模型接口、推理引擎逻辑与开发者调用代码,通过底层插件和算子替换实现无缝适配,大幅降低迁移成本,真正做到开箱即用。

目前两大版本模型在海光DCU算力平台实现无缝稳定运行,进一步夯实国产算力支撑大模型落地的核心能力,为行业提供开箱即用的国产化部署方案。

高效攻克适配瓶颈,多模态能力完整落地

Qwen3.5-35B-A3B参数350亿、激活参数30亿,原生支持262144 tokens超长上下文,采用门控Delta网络融合MoE架构,具备统一视觉/语言理解能力,覆盖图像、视频多模态输入,在推理、编码、Agent及视觉理解等核心场景实现全面跃升。

面对如此复杂的模型架构与多模态能力,精度对齐等技术挑战尤为突出。海光DCU依托底层软硬件优化实力,基于众智FlagOS全栈技术支撑,高效攻克适配瓶颈。经验证,Qwen3.5模型在海光DCU上推理稳定。

零改造部署,降低落地门槛

FlagOS将核心算子、编译器等组件内置模型框架,加载时自动生效,配合标准化Docker镜像与一键命令,彻底解决环境配置、性能优化等痛点。

开发者可通过官方文档获取部署源码,也可直接拉取魔搭、HuggingFace等社区的海光专属模型镜像、文件,无需额外迁移即可快速启用。迁移版Qwen3.5-FlagOS模型文件、代码和镜像,可一键直达部署资源:

HuggingFace平台:

https://huggingface.co/FlagRelease/Qwen3.5-35B-A3B-hygon-FlagOS

魔搭平台:

https://modelscope.cn/models/FlagRelease/Qwen3.5-35B-A3B-hygon-FlagOS

全栈技术协同,精度性能双达标

众智FlagOS构建的统一AI系统软件栈,为海光DCU提供全链路支撑,FlagRelease工具可半自动支撑实现适配、评测、打包全流程,极速推进适配落地,将传统数周周期压缩至数天。

经ERQA、AIME、GPQA Diamond等权威评测集验证,海光DCU适配后的Qwen3.5系列模型,在视觉理解、复杂推理、语言编码等核心能力上,与原生版本精度完全对齐,无业务效果折损,适配质量达到行业顶尖水平。

此次适配实现“一次开发、多芯复用”,凸显出国产算力承接高端大模型任务的常态化。海光DCU将持续深耕AI算力软硬件优化,联合FlagOS等生态伙伴,拓展更多主流大模型适配场景,打造稳定高效的国产算力底座,助力AI技术规模化、普惠化落地。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52253
  • DCU
    DCU
    +关注

    关注

    0

    文章

    20

    浏览量

    3193
  • 海光信息
    +关注

    关注

    0

    文章

    49

    浏览量

    2733
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    壁仞科技光速支持阿里Qwen3.6-35B-A3B大模型

    强大的通用性以及自研BIRENSUPA软件栈的成熟度,旗下壁砺 166系列产品完成Qwen3.6-35B-A3B模型的光速适配。壁仞科技致
    的头像 发表于 04-20 17:50 126次阅读

    拒绝手写代码!Openclaw+Skill一键部署Qwen3.5到算能边缘盒子

    通义千问最新一代模态模型Qwen3.5已成功适配能BM1684X和BM1688系列TPU芯片,2B、4B、9B三个版本均已
    的头像 发表于 04-18 17:32 160次阅读
    拒绝手写代码!Openclaw+Skill一键部署<b class='flag-5'>Qwen3.5</b>到算能边缘盒子

    DCU Day0适配百度文心ERNIE-Image文生图模型

      今天,百度文心大模型团队发布ERNIE-Image文生图模型DCU同步完成Day0
    的头像 发表于 04-15 15:47 145次阅读

    DCU完成阶跃星辰基座模型Step 3.5 Flash推理适配

    近日,DCU正式完成对阶跃星辰旗舰开源基座模型Step 3.5 Flash的
    的头像 发表于 03-26 09:48 606次阅读

    天数智芯完成阿里云通义千问Qwen3.5系列模态模型适配

    近日,天数智芯携手众智FlagOS 社区完成阿里云通义千问 Qwen3.5 系列模态模型
    的头像 发表于 03-26 09:25 1395次阅读

    沐曦股份曦云C系列GPU全面适配通义千问Qwen3.5三款新模型

    今日,通义千问团队正式开源发布Qwen3.5系列中等规模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3
    的头像 发表于 02-28 10:05 677次阅读
    沐曦股份曦云C系列GPU全面<b class='flag-5'>适配</b>通义千问<b class='flag-5'>Qwen3.5</b>三款新<b class='flag-5'>模型</b>

    美格智能高算力AI模组+Qwen3.5,打造端侧最强AI智能体

    在人工智能技术飞速迭代的今天,大模型的“云端争霸”已渐入深水区,而一场关于“端侧智能”的静默革命正悄然兴起。随着Qwen3.5等高性能开源模型的问世,模型能力已进一步跨越,而如何为这些
    的头像 发表于 02-27 08:33 561次阅读
    美格智能高算力AI模组+<b class='flag-5'>Qwen3.5</b>,打造端侧最强AI智能体

    摩尔线程MTT S5000全面适配Qwen3.5三款新模型

    第一时间做出极速响应,宣布已在旗舰级AI训推一体全功能GPU MTT S5000上,完成对这三款全新模型的全方位适配。   此次高效支持充分展示了摩尔线程MUSA生态的成熟度与完备性。在本次Q
    的头像 发表于 02-26 16:23 716次阅读

    沐曦股份曦云C系列GPU深度适配通义千问Qwen3.5模型

    今天,通义千问今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的开放权重版本。沐曦股份曦云C系列GPU
    的头像 发表于 02-26 14:26 759次阅读
    沐曦股份曦云C系列GPU深度<b class='flag-5'>适配</b>通义千问<b class='flag-5'>Qwen3.5</b><b class='flag-5'>模型</b>

    太初元碁:40+AI大模型覆盖,新版本即发即适配、上线即可用,实现国产“芯”速度

    日前,国产AI芯片企业太初(无锡)电子科技有限公司(又称“太初元碁”)完成智谱GLM-5.0、阿里千问Qwen3.5-397B-A17B等大模型的深度适配,截至目前,其已
    的头像 发表于 02-25 09:21 1989次阅读

    摩尔线程快速完成Qwen3.5模型全面适配

    2月17日,摩尔线程宣布已在旗舰级AI训推一体全功能GPU MTT S5000上完成对阿里最新大模型Qwen3.5的全方位适配。此次支持充分展示了摩尔线程MUSA生态的成熟度与完备性,
    发表于 02-18 08:32 1116次阅读

    基于米尔瑞芯微RK3576开发板的Qwen2-VL-3B模型NPU模态部署评测

    模型(如 Qwen2-VL-2B)进行专项优化,token 生成速度达 10+每秒,适配本地化模态交互需求; 算力分配:RK3576 的
    发表于 08-29 18:08

    DCU率先展开文心系列模型的深度技术合作 FLOPs利用率(MFU)达47%

    模型的深度技术适配,预训练模型FLOPs利用率(MFU)达到47%,在多个文本与模态基准测试中取得SOTA水平。此次合作标志着国产算力基
    的头像 发表于 07-01 14:35 2513次阅读

    壁仞科技完成Qwen3旗舰模型适配

    近日,在高效适配Qwen3系列模型推理后,壁仞科技宣布完成旗舰版Qwen3-235B-A22B模型
    的头像 发表于 05-16 16:23 1143次阅读

    爱芯通元NPU适配Qwen2.5-VL-3B视觉模态模型

    熟悉爱芯通元NPU的网友很清楚,从去年开始我们在端侧模态模型适配上一直处于主动紧跟的节奏。先后适配了国内最早开源的
    的头像 发表于 04-21 10:56 3663次阅读
    爱芯通元NPU<b class='flag-5'>适配</b><b class='flag-5'>Qwen</b>2.5-VL-3B视觉<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>