0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm CPU适配通义千问Qwen3系列模型

Arm社区 来源:Arm社区 2025-05-12 16:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,阿里巴巴开源了新一代通义千问模型 Qwen3,Arm 率先成为首批成功适配该模型的计算平台厂商。与此同时,Arm 面向人工智能 (AI) 框架开发者的开源计算内核 Arm KleidiAI 与阿里巴巴开源的轻量级深度学习框架 MNN 已深度集成。得益于此,Qwen3-0.6B、Qwen3-1.7B 及 Qwen3-4B 三款模型能够在搭载 Arm 架构 CPU 的移动设备上无缝运行,为用户提供卓越的端侧 AI 推理能力。

作为阿里巴巴最新开源的混合推理模型,Qwen3 在 AIME、LiveCodeBench 等权威评测集上斩获了同尺寸开源模型 SOTA。其中,Qwen3-0.6B、Qwen3-1.7B、Qwen3-4B 等三款模型兼具低功耗和高性能等优势,非常适合在移动端进行部署。

在 AI 模型快速迭代、日新月异的当下,开发者亟需一个具备可扩展性的通用技术底座,以便高效利用每一个新模型的优势。作为业界性能最强、能效最高的计算平台,Arm 为开发者提供了无缝优化其 AI 工作负载所需的卓越性能、能效、灵活性和可扩展性。Arm CPU 能满足不断发展的 AI 工作负载需求,是开发者的理想之选,它不仅能在模型推出时迅速实现适配与支持,还能随着模型的演进,通过 Arm 异构计算策略与 GPU、加速器及网络技术的共生协作,实现 AI 系统的最佳优化。在此次阿里 Qwen3 模型推出后,运行结果显示,Qwen3-0.6B、Qwen3-1.7B 及 Qwen3-4B 三款模型在基于 Arm 架构 CPU 的移动设备上,运行和响应速度大幅提升,为终端用户带来了极致的 AI 推理能力。

双方围绕千问大模型持续紧密合作,今年三月,Arm 与阿里巴巴淘天集团在搭载基于 Arm Cortex-X925 的旗舰移动系统级芯片 (SoC) 的智能设备上,通过 KleidiAI 与 MNN 的集成,模型预填充(指 AI 模型在生成响应之前先对提示词输入进行处理)性能提升了 57%,以及解码(指处理提示词后从 AI 模型生成文本的过程)性能提升了 28%。这一性能提升,使得运行在搭载 Arm CPU 上的通义千问 Qwen2-VL-2B-Instruct,其端侧多模态 AI 工作负载的性能显著增进,带来全新的用户体验!

展望未来,Arm 也将一如既往助力开发者在端侧设备上提供更加复杂的多模态体验,为新一轮智能计算浪潮奠定坚实基础,在 AI 的不断演进中,实现体验的持续跃升!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9611

    浏览量

    394338
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11370

    浏览量

    226394
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1653

    浏览量

    49378
  • 模型
    +关注

    关注

    1

    文章

    3873

    浏览量

    52337

原文标题:Arm CPU 精准适配阿里 Qwen3 开源模型,实现卓越端侧 AI 推理能力

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    澎峰科技DF35 AI大模型推理一体机完成Qwen3.6系列模型全面适配

    今日,澎峰科技 DF35 AI大模型推理一体机 已完成对阿里云通义2026年4月最新开源的Qwen3.6
    的头像 发表于 04-28 16:16 244次阅读
    澎峰科技DF35 AI大<b class='flag-5'>模型</b>推理一体机完成<b class='flag-5'>Qwen</b>3.6<b class='flag-5'>系列</b><b class='flag-5'>模型</b>全面<b class='flag-5'>适配</b>

    沐曦股份Day 0适配阿里Qwen3.6-35B-A3B大模型

    阿里巴巴模型团队最新宣布,开源旗下多模态“智能体小钢炮” Qwen3.6-35B-A3B模型。沐曦股份与FlagOS合作,完成了该
    的头像 发表于 04-22 11:13 952次阅读
    沐曦股份Day 0<b class='flag-5'>适配</b>阿里<b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen3.6-35B-A3</b>B大<b class='flag-5'>模型</b>

    海光信息DCU平台适配阿里通义Qwen3.6-35B-A3B大模型

      近日,阿里通义正式开源多模态智能体大模型Qwen3.6-35B-A3B,发布不到24小时,海光信息联合众智FlagOS社区完成该模型在海光DCU平台的全流程
    的头像 发表于 04-21 17:40 1994次阅读

    登临科技KS系列GPU产品深度适配阿里Qwen3.6大模型

    2026年4月,继Qwen3.5系列之后,阿里正式推出了Qwen3.6的首个开源权重版本。该版本基于社区直接反馈打造,更注重稳定性与实际
    的头像 发表于 04-21 16:50 2457次阅读
    登临科技KS<b class='flag-5'>系列</b>GPU产品深度<b class='flag-5'>适配</b>阿里<b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.6大<b class='flag-5'>模型</b>

    天数智芯完成阿里云通义Qwen3.5系列多模态模型全量适配

    近日,天数智芯携手众智FlagOS 社区完成阿里云通义 Qwen3.5 系列多模态模型全量
    的头像 发表于 03-26 09:25 2427次阅读

    沐曦股份曦云C系列GPU全面适配通义Qwen3.5三款新模型

    今日,通义团队正式开源发布Qwen3.5系列中等规模模型,推出包括
    的头像 发表于 02-28 10:05 843次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b>GPU全面<b class='flag-5'>适配</b><b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.5三款新<b class='flag-5'>模型</b>

    摩尔线程MTT S5000全面适配Qwen3.5三款新模型

    继开源Qwen3.5-397B-A17B之后,阿里再次宣布开源3.5最新三款中等规模模型Qwen3.5-35B-A3B、
    的头像 发表于 02-26 16:23 938次阅读

    阿里巴巴开源全新一代大模型Qwen3.5-Plus

    3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwe
    的头像 发表于 02-26 15:40 1424次阅读
    阿里巴巴开源全新一代大<b class='flag-5'>模型</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.5-Plus

    沐曦股份曦云C系列GPU深度适配通义Qwen3.5模型

    今天,通义今天正式发布 Qwen3.5,并推出Qwen3.5系列的第一款
    的头像 发表于 02-26 14:26 939次阅读
    沐曦股份曦云C<b class='flag-5'>系列</b>GPU深度<b class='flag-5'>适配</b><b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b><b class='flag-5'>Qwen</b>3.5<b class='flag-5'>模型</b>

    阿里巴巴发布通义旗舰推理模型Qwen3-Max-Thinking

    今天,我们正式发布旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录。
    的头像 发表于 01-27 15:47 777次阅读
    阿里巴巴发布<b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>旗舰推理<b class='flag-5'>模型</b><b class='flag-5'>Qwen3</b>-Max-Thinking

    APP与通义系列模型,才是智能汽车的“黄金组合”

    座舱的正确打开方式;单点智能撬动的价值有限,完整的场景化体验是用户的最终选择。 在这种市场趋势下,阿里巴巴APP与通义系列模型,具备成
    的头像 发表于 12-30 17:25 755次阅读

    亚马逊云科技宣布推出Qwen3与DeepSeek-V3.1模型的完全托管服务

    亚马逊云科技致力于成为运行开放权重模型的最佳平台,在Amazon Bedrock上新增五个模型选项,持续丰富模型选择,进一步满足客户需求。 主要亮点: · Qwen3
    的头像 发表于 09-19 10:11 1126次阅读

    DFRobot亮相贸泽电子elexcon 2025展台,展示与Qwen3模型融合的AI应用

    8月26日,elexcon2025深圳国际电子展在深圳会展中心隆重开幕。在全球知名新品引入(NPI)代理商贸泽电子(Mouser Electronics) 展台(1号馆1Q30),DFRobot展示了其LattePanda Sigma单板计算机与Qwen3大语言模型的融合
    的头像 发表于 08-30 10:51 1222次阅读

    阿里通义发布小尺寸模型Qwen3-4B,手机也能跑

    电子发烧友网综合报道 8月7日,阿里通义宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和
    的头像 发表于 08-12 17:15 7142次阅读
    阿里<b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>发布小尺寸<b class='flag-5'>模型</b><b class='flag-5'>Qwen3</b>-4B,手机也能跑

    广和通加速通义Qwen3在端侧全面落地

    6月,广和通宣布:率先完成通义Qwen3系列混合推理模型在高通QCS8550平台端侧的
    的头像 发表于 06-25 15:35 1463次阅读