0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm SME2技术赋能端侧AI加速实现卓越移动端体验

Arm社区 来源:Arm社区 2026-01-22 14:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

试想这样的场景:当你正在发消息时,手机能在你输入过程中实时翻译文字,还能即时总结整段对话内容;或是在拍照时,手机能在你按下快门之前,迅速解析复杂场景画面,并自动对关键主体进行聚焦。换言之,以往需要停顿处理的手机应用,如今已能实时预判并满足你的需求。

这种转变正是对当前世界的直接回应:每一次点击、每一次滑动、每一秒的关注都至关重要。现在的用户希望应用能够快速思考、即时响应,并妥善保护用户的隐私信息。这些需求最终落到了开发者肩上,开发者因而承受着越来越大的压力:不仅要让应用运行起来,更需要在设备端完整实现先进的实时体验,而无需依赖云端,同时还不能牺牲电池续航或减缓响应。

令人欣慰的是,第二代 Arm 可伸缩矩阵扩展 (SME2)为全球数百万移动端开发者带来了端侧人工智能 (AI) 加速的功能,有助于实现更迅捷、更智能的端侧体验。

随时随地高效加速

得益于 Arm KleidiAI 与主流框架(包括 Google LiteRT、PyTorchExecuTorch、ONNX Runtime和阿里巴巴 MNN)的深度集成,SME2 可实现自动启用,将 AI 计算迁移至 Arm CPU 上 。当今约 99% 的智能手机均运行于 Arm CPU 计算平台之上。此举不仅为开发者在处理其工作负载时提供了更大的灵活性,还能释放 GPU 的带宽资源。

由于 Arm CPU 能在安全且一致的架构上处理混合计算管线,开发者无需为不同设备层级重新构建方案。只需优化一次,即可在整个生态系统中复用。SME2 通过为 Armv9 架构添加专用矩阵处理指令,使 CPU 能够处理支撑着当今大语言模型和视觉模型的密集数学运算,同时显著降低功耗与延迟。

由此打造出可在数十亿台移动设备上运行的更具吸引力、更智能、更直观的应用,并带来切实可量化的提升表现,其中包括:

AI 响应速度提升高达 5 倍;

语音工作负载延迟降低 4.7 倍;

音频生成速度提升 2.8 倍;

在常见的移动端 AI 应用场景中显著节省电量。

得益于此,支付宝可支持在设备上即时生成旅行视频,谷歌也能在其各类应用中提供实时摘要与翻译服务。

对用户而言,应用体验变得更加迅捷、本地化且安全可信。对开发者而言,鉴于实时推理不再导致电量快速耗尽或手机过热,他们能够在相同的散热与功耗限制下挖掘更多可能性。开发者还可无拘束地进行创新实验,灵活适配多代硬件,并在 CPU 上实现以前只有服务器端才能实现的 AI 性能。

一次构建,随处运行

每个开发者都深知碎片化带来的挑战,包括各异的芯片组、不同的性能特性,以及无休止的调优工作。SME2 通过 CPU 实现 AI 加速的标准化,为开发者提供了统一、可移植的移动端 AI 基础。

基于 SME2 构建的应用在 iOS 和安卓系统上都能实现一致的性能表现,从 vivo X300 系列和 OPPO Find X9 系列等旗舰手机,到搭载 Arm CPU 的中端和入门款智能手机,都能流畅运行。无论是要为创意类应用优化视觉模型,还是面向全球市场部署语音助手,代码的运行效果都可精准预判。这不仅简化了测试流程,减少了性能倒退问题,还能加快产品上市进程。

随着 Arm 架构的持续演进,KleidiAI 会自动实现性能提升,无需开发者重构代码 —— 这正是打造一个能与开发者共同成长的平台的价值所在。开发者只需更新其框架、启用 SME2,就能直观感受到应用运行速度的大幅提升。

端侧智能的下一个前沿领域

归根结底,端侧 AI 的核心并非为设备堆砌更多智能功能,而是让智能更贴近用户的日常应用场景。与此同时,用户不愿等待技术追赶需求,开发者也无需等待。借助 SME2 和 KleidiAI,开发者将能够弥合这一差距,将 CPU 变成现成可用的 AI 引擎,实时响应用户的每一次点击与交互。

因此,作为开发者的你,如果要打造新一代卓越的移动端体验,不妨聚焦于最重要的层面,从核心入手。更新你的框架,启用 SME2,然后见证当智能响应跟上用户操作速度时,你的应用力所能及的表现也将达到新高度。

* 本文为 Arm 原创文章,转载请留言联系获得授权并注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9611

    浏览量

    394333
  • AI
    AI
    +关注

    关注

    91

    文章

    41964

    浏览量

    303057
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267726

原文标题:端侧 AI 加速,轻松升级日常应用体验

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm SME2技术加速腾讯翻译大模型推理

    腾讯混元将翻译大模型 Hy-MT1.5 压缩至最小 440MB(1.25-bit 模型),轻轻松松装进手机。不仅如此,依托第二代 Arm 可伸缩矩阵扩展 (Arm SME2) 技术加持
    的头像 发表于 05-06 10:07 406次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>SME2</b><b class='flag-5'>技术</b><b class='flag-5'>加速</b>腾讯翻译大模型推理

    Arm与Google携手共筑AI未来

    如今,全球数十亿智能手机用户已将实时辅助、流畅沟通与高度个性化视为基础体验。在智能手机的功耗限制下实现高性能人工智能 (AI),对规模化提供即时智能体验、释放
    的头像 发表于 04-21 14:39 419次阅读

    TECNO与Arm携手推动移动实时生成式AI

    Arm 始终坚信,人工智能 (AI) 及其所带来的价值,理应惠及更广泛的人群。这一理念正引领 AI 迈入全新发展阶段 —— 更具个性化、即时可用,并越来越多地在
    的头像 发表于 03-11 10:31 537次阅读

    利用ExecuTorch和Arm SME2加速机器学习推理

    贴纸、分离主体以替换背景,或是对图像局部进行选择性增强。这些效果背后,是轻量级分割模型在运行,这些模型通过 ExecuTorch(PyTorch 的开源推理运行时)以及第二代 Arm 可伸缩矩阵扩展
    的头像 发表于 03-03 10:27 801次阅读
    利用ExecuTorch和<b class='flag-5'>Arm</b> <b class='flag-5'>SME2</b><b class='flag-5'>加速</b><b class='flag-5'>端</b><b class='flag-5'>侧</b>机器学习推理

    应对AI算力、内存、功耗“三堵墙”困境,安谋科技Arm China “周易”X3给出技术锦囊

    AI大模型正加速从云端向边缘与渗透,然而,算力、内存、功耗等却成了制约其规模化落地的“高墙”。专为AI计算而生的神经网络处理器(NPU)
    的头像 发表于 12-18 13:45 606次阅读
    应对<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>算力、内存、功耗“三堵墙”困境,安谋科技<b class='flag-5'>Arm</b> China “周易”X3给出<b class='flag-5'>技术</b>锦囊

    Arm Lumex平台新一代旗舰智能手机体验升级

    可伸缩矩阵扩展 (SME2) 技术的全新 Arm C1 CPU 集群与Arm Mali G1-Ultra GPU,Lumex 将先进智能计算带到全球数十亿手机用户的手中,并依托各大旗
    的头像 发表于 12-15 14:27 982次阅读

    Arm助力MediaTek天玑9500重塑旗舰体验

    Arm 合作伙伴产品上“芯”!近日,MediaTek 发布了天玑 9500 旗舰 5G 智能体 AI 芯片,该芯片基于启用 SME2 的全新 Arm C1 CPU 集群打造,并搭载
    的头像 发表于 10-10 11:28 1468次阅读

    全新Arm C1 CPU集群推动移动AI转型

    随着用户期待在不连接云端服务的情况下,能在移动设备上享有更好的即时响应、更智能的个性化服务,更加实时处理的体验,使其正迅速成为人工智能 (AI) 的强大载体。与此同时,随着移动
    的头像 发表于 09-15 14:27 2411次阅读
    全新<b class='flag-5'>Arm</b> C1 CPU集群推动<b class='flag-5'>移动</b><b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>转型

    此芯科技发布“合一”AI加速计划,边缘与AI创新

    产品组合,覆盖从1.5B至32B参数规模的AI模型推理需求,满足工业、消费电子、智能终端等多样化场景的部署需求,推动AI技术从云端向边缘
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>计划,<b class='flag-5'>赋</b><b class='flag-5'>能</b>边缘与<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新

    AI推理效率革命,美格智能多领域落地打造行业范本

    产业进阶:AI推理助手成为应用刚需作为人工智能技术最普遍的产品形式之一,“AI助手”已成为各类软件、终端的重要组成部分,成为AIAgen
    的头像 发表于 08-25 17:06 4259次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>推理<b class='flag-5'>赋</b><b class='flag-5'>能</b>效率革命,美格智能多领域落地打造行业范本

    Arm神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术移动设备上实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,首次在移动设备上
    的头像 发表于 08-14 17:59 2997次阅读

    Arm率先适配腾讯混元开源模型,助力AI创新开发

    共同人工智能 (AI) 部署,助力本土开发者实现 A
    的头像 发表于 08-08 09:16 1642次阅读
    <b class='flag-5'>Arm</b>率先适配腾讯混元开源模型,助力<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新开发

    Arm SME2 技术加速安卓 AI 升级,驱动移动应用下一代功能革新

    从按下快门前就对照片进行即时锐化,到通话过程中实时消除背景噪音,再到离线状态下与人工智能 (AI) 助手互动, AI 正在重塑移动体验。
    的头像 发表于 07-18 20:28 2025次阅读

    AI需求大爆发!安谋科技发布新一代NPU IP,AI终端应用

    (电子发烧友网报道 文/章鹰) 2025年是AI爆发元年,以AI眼镜为例,Meta的Ray-Ban系列价格已降至299美元,2025年预计出货200万副,此外,混合
    的头像 发表于 07-11 01:16 9207次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>需求大爆发!安谋科技发布新一代NPU IP,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>终端应用

    Arm 公司面向移动市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 在移动的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能、效比与开发效率上的挑战
    的头像 发表于 05-29 09:54 4674次阅读