0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm与阿里巴巴合作加速端侧多模态AI体验

Arm社区 来源:Arm社区 2025-03-10 09:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)近日发布与阿里巴巴淘天集团轻量级深度学习框架 MNN 的又一新合作。双方经由 Arm KleidiAI 的集成,成功让多模态人工智能 (AI) 工作负载通过阿里巴巴经指令调整的通义千问 Qwen2-VL-2B-Instruct 模型运行在搭载 Arm CPU 的移动设备上。该版本的通义千问模型专为端侧设备的图像理解、文本到图像的推理,以及跨多种语言的多模态生成而设计。此次的合作显著提升了端侧多模态 AI 工作负载的性能,带来全新的用户体验。

Arm 终端事业部产品管理高级总监 Stefan Rosinger 表示:我们正身处 AI 革命的浪潮之中,亲眼见证了多模态 AI 模型的兴起。这些模型能够处理并理解多种数据类型,涵盖文本、图像、音频、视频及传感器数据。然而,由于硬件本身的电力限制和内存约束,加之同时处理多种数据类型带来的复杂性,在端侧设备上部署这些先进的多模态模型正面临着不小的挑战。

Arm Kleidi 成为解决这些挑战的理想方案,它能够为运行在 Arm CPU 上的所有 AI 推理工作负载提供无缝的性能优化。KleidiAI 是一套轻量级且高性能开源的 Arm 例程,专为 AI 加速而设计,目前已被集成到最新版本的主流端侧 AI 框架中,包括 ExecuTorch、Llama.cpp、LiteRT (通过XNNPACK)和 MediaPipe,能让数百万名开发者无需进行额外操作,即可自动获取 AI 性能的显著提升。

加速端侧多模态 AI 用例的响应时间

通过 KleidiAI 与 MNN 的集成,Arm 和 MNN 团队测量了 Qwen2-VL-2B-Instruct 模型的加速性能,结果显示在端侧的关键 AI 多模态应用场景中,其运行和响应速度均有所提升。这一提升可为阿里巴巴旗下众多以客户为中心的应用程序带来更加出色的用户体验。

Qwen2-VL-2B-Instruct 模型:

https://modelscope.cn/models/Qwen/Qwen2-VL-2B-Instruct

这些用例响应速度的提升,得益于模型预填充(指 AI 模型在生成响应之前先对提示词输入进行处理)性能提升了 57%,以及解码(指处理提示词后从 AI 模型生成文本的过程)性能提升了 28%。此外,KleidiAI 集成还可以通过降低多模态工作负载的总体计算成本,进一步促进端侧设备上 AI 工作负载的高效处理。数百万使用包括 MNN 框架在内的热门 AI 框架运行应用程序与工作负载的开发者,可以在针对边缘侧设备的应用和工作负载中享受到这些性能和效率的提升。

阿里云通义大模型业务总经理徐栋表示:我们非常高兴看到通义千问大模型与 Arm KleidiAI 及 MNN 团队展开深度技术合作,通过 MNN 端侧推理框架和 Arm KleidiAI 的集成加速优化,成功实现了大模型推理延迟的显著降低与能效比的大幅提升。此次开创性的合作不仅充分验证了大模型在移动终端的实用潜力,更使用户能够在指尖体验到下一代 AI 的普惠价值。我们期待三方能够持续携手,以技术创新突破算力边界,共同开启端侧智能新篇章。

阿里巴巴淘天集团业务技术 MNN 负责人姜霄棠表示:此次 MNN 推理框架与 Arm KleidiAI 做深度技术融合,在端侧大模型加速方面取得了全新突破。通过我们对底层架构的联合优化,通义大模型的端侧推理效率实现大幅提升,成功跨越了受限算力与复杂 AI 能力的技术鸿沟。这一成果既是 MNN 团队技术攻坚的结晶,更是跨界协作力量的生动诠释。我们期待未来能持续携手深耕端侧计算生态,让每个移动终端都能承载更流畅、更高效、更自然的 AI 体验。

在 MWC 上进行 KleidiAI 集成演示

在本周举行的 2025 年世界移动通信大会 (MWC) 上,Arm 展示了此次的合作成果,该演示突出了模型如何理解视觉和文本输入的多种组合,并对图像中的内容进行提炼说明。这项演示在搭载 MediaTek 天玑 9400 系统级芯片 (SoC)的智能手机上完成,包括 vivo X200 系列。

实现多模态 AI 体验的飞跃

KleidiAI 和为阿里巴巴通义千问模型支持的 MNN 框架进行集成,成功地为运行在搭载 Arm CPU 端侧的多模态 AI 工作负载带来显著的用户体验提升。这些卓越的体验现已应用于移动设备,许多的面向客户的应用程序也已受惠于 KleidiAI 带来的种种优势。展望未来,KleidiAI 针对 AI 工作负载的无缝优化将继续赋能开发者,助力其在端侧设备上提供更加复杂的多模态体验。这将为下一波智能计算浪潮奠定基础,并在 AI 的持续演进中迈出令人振奋的一大步。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9624

    浏览量

    394863
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1655

    浏览量

    49416
  • 模型
    +关注

    关注

    1

    文章

    3888

    浏览量

    52396

原文标题:Arm 与阿里巴巴合作,通过 KleidiAI 与通义千问模型的集成,加速端侧多模态 AI 体验

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    北京大学与阿里巴巴达摩院合作研究成果荣登国际顶级学术期刊自然

    昨天,国际顶级学术期刊《自然》(Nature)发表了北京大学与阿里巴巴达摩院的合作研究成果,利用AI和开源卫星影像绘制出首张全国尺度高精度风光设施分布图。
    的头像 发表于 05-22 16:12 662次阅读

    阿里巴巴发布2026财年Q4及全年财报

    近日,阿里巴巴集团正式发布2026财年第四季度及全年财报,交出了一份"基本盘稳健、AI引擎加速"的年度答卷。
    的头像 发表于 05-14 10:21 715次阅读

    基于NVIDIA GPU加速端点使用千问3.5 VLM开发原生模态智能体

    阿里巴巴推出了全新开源 千问3.5 系列,专为构建原生模态智能体而设计。该系列的首个模型是一款总参数为 397B、具备推理能力的原生视觉语言模型 (VLM),基于由混合专家模型 (MoE) 和门控
    的头像 发表于 03-04 16:37 1360次阅读

    瑞芯微RK182X全面适配主流模态大模型

    在全球人工智能加速渗透的今天, “生态适配广度”与“场景落地深度”正成为衡量AI平台核心
    的头像 发表于 01-27 16:16 1296次阅读

    海外电商平台阿里巴巴国际站获取商品详情的API接口

    ​ 在跨境电商领域,阿里巴巴国际站(Alibaba.com)是一个领先的平台,为企业提供全球贸易服务。其API接口允许开发者通过编程方式获取商品详情,便于构建自动化工具或集成到第三方系统。本文将
    的头像 发表于 11-14 15:36 762次阅读
    海外电商平台<b class='flag-5'>阿里巴巴</b>国际站获取商品详情的API接口

    万豪国际集团与阿里巴巴达成AI时代战略合作 升级宾客旅行体验

    杭州2025年11月11日 /美通社/ -- 万豪国际集团日近日宣布与阿里巴巴集团达成AI时代战略合作伙伴关系,双方将在中国市场围绕云基础设施、AI应用创新等领域深度
    的头像 发表于 11-11 22:47 413次阅读
    万豪国际集团与<b class='flag-5'>阿里巴巴</b>达成<b class='flag-5'>AI</b>时代战略<b class='flag-5'>合作</b> 升级宾客旅行体验

    集成AI的可穿戴模态生理参数采集设备是脑机接口家用的未来?

    HUIYING集成AI的可穿戴模态生理参数采集设备系统概述随着对实时生理监测与人机交互需求的增长,传统可穿戴设备在
    的头像 发表于 11-05 18:03 2247次阅读
    集成<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>的可穿戴<b class='flag-5'>多</b><b class='flag-5'>模态</b>生理参数采集设备是脑机接口家用的未来?

    阿里巴巴宣布与英伟达开展Physical AI合作

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年09月25日 11:32:26

    此芯科技发布“合一”AI加速计划,赋能边缘与AI创新

    此芯科技正式发布“合一”AI加速计划,旨在为边缘计算和AI场景提供高能效的全栈算力解决方案。该计划由此芯科技联合多家行业
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>计划,赋能边缘与<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新

    米尔RK3576部署模态轮对话,6TOPS算力驱动30亿参数LLM

    “看图说话+语音问答”的融合交互。 五、结论与未来发展方向如果说 “大模型上云” 是 AI 的 “星辰大海”,那么 “模态落地” 就
    发表于 09-05 17:25

    博世与阿里巴巴集团深化战略合作

    9月2日,全球领先的汽车技术与服务商博世与阿里巴巴集团宣布深化战略合作伙伴关系,以先进的云计算与人工智能技术加速推动企业数字化转型。双方将重点聚焦云端驱动的企业运营、AI赋能的业务创新
    的头像 发表于 09-02 16:09 916次阅读

    中国电信与阿里签署战略合作协议 发力云和AI基础设施

    煌妹代表双方签订协议。 据悉,中国电信与阿里巴巴将在云和AI基础设施、新型服务业电商、社会价值创新等领域展开深入合作。  
    的头像 发表于 08-31 20:16 1489次阅读

    云+模态”新范式:《移远通信AI大模型技术方案白皮书》正式发布

    7月28日,移远通信联合智次方研究院正式发布《AI大模型技术方案白皮书》(以下简称“白皮书”)。这份白皮书系统梳理了AI大模型的技术特点、产业发展态势与多元应用场景,以及移远通信“云+
    的头像 发表于 07-28 13:08 1536次阅读
    “<b class='flag-5'>端</b>云+<b class='flag-5'>多</b><b class='flag-5'>模态</b>”新范式:《移远通信<b class='flag-5'>AI</b>大模型技术方案白皮书》正式发布

    探访阿里巴巴展厅合作的无人超市:如何让结账速度提升300%

    在传统超市里,排队结账往往是一场“耐力考验”——高峰期平均等待时间超过15分钟,收银员扫码失误引发的纠纷屡见不鲜。但在阿里巴巴展厅合作的远景达无人超市,这个数字被彻底改写:消费者从选品到离店仅需15
    的头像 发表于 07-13 00:00 1151次阅读
    探访<b class='flag-5'>阿里巴巴</b>展厅<b class='flag-5'>合作</b>的无人超市:如何让结账速度提升300%

    AI大模型加速上车,联手高通,阿里有哪些策略?

    (电子发烧友网报道 文/章鹰)2025年6月26日至27日,“2025高通汽车技术与合作峰会”在苏州举行,阿里云副总裁徐栋带来通义大模型在发展方向的最新思考,以及汽车领域的落地的
    的头像 发表于 07-03 01:10 9393次阅读
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>加速</b>上车,联手高通,<b class='flag-5'>阿里</b>有哪些策略?