0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm SME2 技术加速安卓 AI 升级,驱动移动应用下一代功能革新

A面面观 来源:厂商供稿 作者:Arm 2025-07-18 20:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从按下快门前就对照片进行即时锐化,到通话过程中实时消除背景噪音,再到离线状态下与人工智能 (AI) 助手互动,端侧 AI 正在重塑移动体验。而 Arm 计算平台正是实现这些无缝交互体验的强劲驱动力。

随着 AI 工作负载变得日益复杂且广泛渗透至各个领域,移动开发者面临的需求也与日俱增:他们需要在内存、电力和热预算等严格且多样化的限制下,实现实时且高效的性能表现,同时确保不会给应用及其工作负载增加额外的复杂性。

为了应对这些挑战,Arm 推出了可伸缩矩阵扩展 2 (SME2) 技术,以直接在移动 CPU 上加速高强度的矩阵计算工作负载——这些工作负载对计算机视觉和生成式 AI 应用至关重要。SME2 是 Armv9 架构中的一组高级 CPU 指令,它基于 SME 升级、能够在 AI 异构计算框架下,高效支持图像处理、自然语言处理、语音生成等实时移动端推理任务。

开发者如何获取 SME2 的优势

移动开发者无需改动现有代码、模型或应用程序,即可直接获取 SME2 带来的性能提升。这得益于 Arm 的软件加速层——Arm KleidiAI,它能够无缝集成到主流运行时库和 AI 框架中,为开发者提供开箱即用的性能体验。

得益于 KleidiAI 深入且广泛的集成,SME2 已在 Google 专为安卓系统优化的神经网络推理库 XNNPACK 中实现支持。此外,SME2 也被集成至多个框架中,包括阿里巴巴 MNN、Google LiteRT 和MediaPipe、微软 ONNX Runtime,以及 llama.cpp。这些集成意味着 SME2 已深度嵌入到软件栈中。当设备支持并启用 SME2 时,XNNPACK 会自动通过 KleidiAI 将矩阵计算密集型任务路由至 SME2,从而让开发者在无需改动任何应用逻辑或基础架构的情况下,直接实现性能提升。

与此同时,KleidiAI 不仅着眼于当下的性能加速,更是为满足未来需求而设计。随着 Arm 不断推出新特性与架构升级,KleidiAI 将持续为所支持的 AI 框架和运行时库带来自动的性能提升,而无需开发者投入额外精力。

大规模 AI 性能与能效优化

搭载 SME2 增强硬件的安卓新机即将上市,开发者可率先通过硬件加速解锁 AI 性能跃升。与此同时,SME2 已支持最新的 iOS 设备[1],只要应用中使用了集成 SME2 的 AI 框架,便可自动享受这些性能提升。

在搭载 SME2 增强硬件的设备上运行 Google Gemma 3 模型时,其聊天交互中的 AI 响应速度比未启用 SME2 的同款设备快六倍。此外,仅用单个 CPU 核心,Gemma 3 便可在不到一秒的时间内启动多达 800 字的文本摘要任务。目前,一家领先的独立软件供应商 (ISV) 已承诺将其应用中的大部分词元 (token) 生成工作负载从云端迁移到移动端,这在一定程度上得益于端侧 AI 能力的持续突破。

Google 安卓杰出软件工程师 Iliyan Malchev 表示:借助 SME2 增强的硬件,更先进的 AI 模型(如 Gemma 3)能够直接在各类设备上运行。随着 SME2 的持续扩展,移动开发者能够在不同生态系统中无缝部署下一代 AI 功能,从而为终端用户带来低延迟、广泛可用的智能手机体验。

除了性能的提升,SME2 还为 Arm 生态系统(如 iOS 与安卓)提供了可移植的解决方案。目前,已有 900 万款应用在 Arm 计算平台上运行,超过 2,200 万名软件开发者基于 Arm 平台构建他们的应用和工作负载。

助力开发者构建 AI 的未来

对安卓开发者而言,他们只要将应用构建在集成了 KleidiAI 的 AI 框架和运行时库之上,就能自动获得 SME2 带来的性能提升,并可在各类设备上无缝部署下一代 AI 功能。

开发者若提前布局,即可确保其应用在 SME2 增强硬件推向市场时实现优化,无需改动任何一行代码,便可为用户带来更快的性能、更低的延迟以及更高的能效。

此外,Arm 还发布了开发者启动平台,帮助移动开发者充分利用 SME2 的技术优势,通过丰富案例展示如何针对 KleidiAI 增强框架进行开发,从而默认激活硬件层面的最新加速能力。

作者:Arm 人工智能平台和开发者平台与服务高级副总裁 Alex Spinelli

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388555
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296319
  • 安卓
    +关注

    关注

    5

    文章

    2178

    浏览量

    59848

原文标题:Arm SME2 技术加速安卓 AI 升级,驱动移动应用下一代功能革新

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    开源鸿蒙技术大会2025丨IDE分论坛:聚焦AI驱动的开发工具革新,探索下一代IDE前沿技术

    、企业界专家做精彩分享。论坛聚焦AI驱动的开发工具革新,围绕产业界AI深度融合的开源鸿蒙应用开发实践,探讨在Agentic IDE、自然语言交互等
    的头像 发表于 11-20 17:21 451次阅读
    开源鸿蒙<b class='flag-5'>技术</b>大会2025丨IDE分论坛:聚焦<b class='flag-5'>AI</b><b class='flag-5'>驱动</b>的开发工具<b class='flag-5'>革新</b>,探索<b class='flag-5'>下一代</b>IDE前沿<b class='flag-5'>技术</b>

    AI眼镜或成为下一代手机?谷歌、苹果等巨头扎堆布局

    近年来,AI智能眼镜赛道迎来爆发式增长。谷歌、苹果、Meta、亚马逊等科技巨头纷纷加快布局,将AI眼镜视为下一代人机交互的关键入口。从消费级产品到行业专用设备,多样化的AI眼镜正逐步走
    的头像 发表于 11-05 17:44 470次阅读

    安森美SiC器件赋能下一代AI数据中心变革

    电源解决方案。特别是近期,安森美携手英伟达,共推下一代AI数据中心加速向800V直流供电方案转型,这种技术能力的广度和深度使安森美成为少数能以可扩展、可实际落地的设计满足现代
    的头像 发表于 10-31 13:47 377次阅读

    Telechips与Arm合作开发下一代IVI芯片Dolphin7

    Telechips宣布,将在与 Arm的战略合作框架下,正式开发下一代车载信息娱乐系统(IVI)系统级芯片(SoC)“Dolphin7”。
    的头像 发表于 10-13 16:11 754次阅读

    Arm助力MediaTek天玑9500重塑旗舰体验

    Arm 合作伙伴产品上“芯”!近日,MediaTek 发布了天玑 9500 旗舰 5G 智能体 AI 芯片,该芯片基于启用 SME2 的全新 Arm C1 CPU 集群打造,并搭载
    的头像 发表于 10-10 11:28 891次阅读

    Arm正式取消Cortex命名!CPU向着高算力进发,Lumex CSS平台加持!

    电子发烧友网报道(文/黄晶晶)日前,在Arm Unlocked上海站技术论坛上,Arm重磅推出智能终端专属 Lumex CSS平台。Lumex CSS是套专为旗舰级智能手机及
    的头像 发表于 09-17 08:25 2722次阅读
    <b class='flag-5'>Arm</b>正式取消Cortex命名!CPU向着高算力进发,Lumex CSS平台加持!

    全新Arm Lumex CSS平台实现两位数性能提升

    下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二可伸缩矩阵扩展 (SME2)
    的头像 发表于 09-10 16:14 736次阅读
    全新<b class='flag-5'>Arm</b> Lumex CSS平台实现两位数性能提升

    Arm神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术移动设备上实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,首次在移动设备上实现
    的头像 发表于 08-14 17:59 2515次阅读

    主流厂商揭秘下一代无线SoC:AI加速、内存加量、新电源架构等

    标准等方面进行升级。   下一代物联网产品的新需求   芯科科技无线产品营销高级总监Dhiraj Sogani在接受采访时表示,我们的第一代、第二和第三
    的头像 发表于 07-23 09:23 5961次阅读

    驱动下一代E/E架构的神经脉络进化—10BASE-T1S

    随着“中央+区域”架构的演进,10BASE-T1S凭借其独特优势,将成为驱动下一代汽车电子电气(E/E)架构“神经系统”进化的关键技术
    的头像 发表于 07-08 18:17 797次阅读
    <b class='flag-5'>驱动</b><b class='flag-5'>下一代</b>E/E架构的神经脉络进化—10BASE-T1S

    下一代高速芯片晶体管解制造问题解决了!

    ,10埃)开始直使用到A7。 从这些外壁叉片晶体管的量产中获得的知识可能有助于下一代互补场效应晶体管(CFET)的生产。 目前,领先的芯片制造商——英特尔、台积电和三星——正在利用其 18A、N
    发表于 06-20 10:40

    下一代PX5 RTOS具有哪些优势

    许多古老的RTOS设计至今仍在使用,包括Zephyr(1980年)、Nucleus(1990年)和FreeRTOS(2003年)。所有这些旧设计都有专有的API,通常更大、更慢,并且缺乏下一代RTOS的必要安全认证和
    的头像 发表于 06-19 15:06 871次阅读

    Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验

    ArmKleidiAI与ONNXRuntime的集成,为Windows和操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而
    的头像 发表于 06-03 16:47 717次阅读
    <b class='flag-5'>Arm</b> 与微软合作,为基于 <b class='flag-5'>Arm</b> 架构的 PC 和<b class='flag-5'>移动</b>设备应用提供超强 <b class='flag-5'>AI</b> 体验

    NVIDIA 采用纳微半导体开发新一代数据中心电源架构 800V HVDC 方案,赋能下一代AI兆瓦级算力需求

    全球 AI 算力基础设施革新迎来关键进展。近日,纳微半导体(Navitas Semiconductor, 纳斯达克代码:NVTS)宣布参与NVIDIA 英伟达(纳斯达克股票代码: NVDA) 下一代
    发表于 05-23 14:59 2580次阅读
    NVIDIA 采用纳微半导体开发新<b class='flag-5'>一代</b>数据中心电源架构 800V HVDC 方案,赋能<b class='flag-5'>下一代</b><b class='flag-5'>AI</b>兆瓦级算力需求

    下一代高速铜缆铁氟龙发泡技术

    为什么下一代高速铜缆需要铁氟龙发泡技术在人工智能与万物互联的双重驱动下,全球数据传输速率正经历场“超速进化”。AI大模型的参数规模突破万亿
    的头像 发表于 03-13 09:00 1033次阅读
    <b class='flag-5'>下一代</b>高速铜缆铁氟龙发泡<b class='flag-5'>技术</b>