0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm SME2 技术加速安卓 AI 升级,驱动移动应用下一代功能革新

A面面观 来源:厂商供稿 作者:Arm 2025-07-18 20:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从按下快门前就对照片进行即时锐化,到通话过程中实时消除背景噪音,再到离线状态下与人工智能 (AI) 助手互动,端侧 AI 正在重塑移动体验。而 Arm 计算平台正是实现这些无缝交互体验的强劲驱动力。

随着 AI 工作负载变得日益复杂且广泛渗透至各个领域,移动开发者面临的需求也与日俱增:他们需要在内存、电力和热预算等严格且多样化的限制下,实现实时且高效的性能表现,同时确保不会给应用及其工作负载增加额外的复杂性。

为了应对这些挑战,Arm 推出了可伸缩矩阵扩展 2 (SME2) 技术,以直接在移动 CPU 上加速高强度的矩阵计算工作负载——这些工作负载对计算机视觉和生成式 AI 应用至关重要。SME2 是 Armv9 架构中的一组高级 CPU 指令,它基于 SME 升级、能够在 AI 异构计算框架下,高效支持图像处理、自然语言处理、语音生成等实时移动端推理任务。

开发者如何获取 SME2 的优势

移动开发者无需改动现有代码、模型或应用程序,即可直接获取 SME2 带来的性能提升。这得益于 Arm 的软件加速层——Arm KleidiAI,它能够无缝集成到主流运行时库和 AI 框架中,为开发者提供开箱即用的性能体验。

得益于 KleidiAI 深入且广泛的集成,SME2 已在 Google 专为安卓系统优化的神经网络推理库 XNNPACK 中实现支持。此外,SME2 也被集成至多个框架中,包括阿里巴巴 MNN、Google LiteRT 和MediaPipe、微软 ONNX Runtime,以及 llama.cpp。这些集成意味着 SME2 已深度嵌入到软件栈中。当设备支持并启用 SME2 时,XNNPACK 会自动通过 KleidiAI 将矩阵计算密集型任务路由至 SME2,从而让开发者在无需改动任何应用逻辑或基础架构的情况下,直接实现性能提升。

与此同时,KleidiAI 不仅着眼于当下的性能加速,更是为满足未来需求而设计。随着 Arm 不断推出新特性与架构升级,KleidiAI 将持续为所支持的 AI 框架和运行时库带来自动的性能提升,而无需开发者投入额外精力。

大规模 AI 性能与能效优化

搭载 SME2 增强硬件的安卓新机即将上市,开发者可率先通过硬件加速解锁 AI 性能跃升。与此同时,SME2 已支持最新的 iOS 设备[1],只要应用中使用了集成 SME2 的 AI 框架,便可自动享受这些性能提升。

在搭载 SME2 增强硬件的设备上运行 Google Gemma 3 模型时,其聊天交互中的 AI 响应速度比未启用 SME2 的同款设备快六倍。此外,仅用单个 CPU 核心,Gemma 3 便可在不到一秒的时间内启动多达 800 字的文本摘要任务。目前,一家领先的独立软件供应商 (ISV) 已承诺将其应用中的大部分词元 (token) 生成工作负载从云端迁移到移动端,这在一定程度上得益于端侧 AI 能力的持续突破。

Google 安卓杰出软件工程师 Iliyan Malchev 表示:借助 SME2 增强的硬件,更先进的 AI 模型(如 Gemma 3)能够直接在各类设备上运行。随着 SME2 的持续扩展,移动开发者能够在不同生态系统中无缝部署下一代 AI 功能,从而为终端用户带来低延迟、广泛可用的智能手机体验。

除了性能的提升,SME2 还为 Arm 生态系统(如 iOS 与安卓)提供了可移植的解决方案。目前,已有 900 万款应用在 Arm 计算平台上运行,超过 2,200 万名软件开发者基于 Arm 平台构建他们的应用和工作负载。

助力开发者构建 AI 的未来

对安卓开发者而言,他们只要将应用构建在集成了 KleidiAI 的 AI 框架和运行时库之上,就能自动获得 SME2 带来的性能提升,并可在各类设备上无缝部署下一代 AI 功能。

开发者若提前布局,即可确保其应用在 SME2 增强硬件推向市场时实现优化,无需改动任何一行代码,便可为用户带来更快的性能、更低的延迟以及更高的能效。

此外,Arm 还发布了开发者启动平台,帮助移动开发者充分利用 SME2 的技术优势,通过丰富案例展示如何针对 KleidiAI 增强框架进行开发,从而默认激活硬件层面的最新加速能力。

作者:Arm 人工智能平台和开发者平台与服务高级副总裁 Alex Spinelli

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9596

    浏览量

    393841
  • AI
    AI
    +关注

    关注

    91

    文章

    41370

    浏览量

    302744
  • 安卓
    +关注

    关注

    5

    文章

    2187

    浏览量

    60562

原文标题:Arm SME2 技术加速安卓 AI 升级,驱动移动应用下一代功能革新

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm SME2技术加速腾讯翻译大模型推理

    腾讯混元将翻译大模型 Hy-MT1.5 压缩至最小 440MB(1.25-bit 模型),轻轻松松装进手机。不仅如此,依托第二 Arm 可伸缩矩阵扩展 (Arm SME2)
    的头像 发表于 05-06 10:07 252次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>SME2</b><b class='flag-5'>技术</b><b class='flag-5'>加速</b>腾讯翻译大模型推理

    物理AI如何定义下一代平台革新

    人工智能 (AI) 的下一波浪潮正迈向物理世界,并深度融入汽车、机器人及其他自主设备之中。据麦肯锡 (McKinsey)[1] 预测,到 2030 年,仅在美国市场,由 AI 驱动的智
    的头像 发表于 04-01 15:16 476次阅读

    伟创力携手博通,推进下一代AI液冷解决方案落地

    近日,伟创力宣布旗下先进液冷解决方案公司 JetCool 与 博通(Broadcom)展开合作,为博通 下一代 AI XPU(定制化 AI 计算加速芯片) 提供创新液冷解决方案,助力高
    的头像 发表于 03-17 10:44 774次阅读
    伟创力携手博通,推进<b class='flag-5'>下一代</b><b class='flag-5'>AI</b>液冷解决方案落地

    高通推出完整的AI驱动RAN创新技术组合

    今日,高通技术公司宣布推出完整的AI驱动RAN创新技术组合,在6G时代来临前,加速实现RAN AI
    的头像 发表于 03-04 09:39 431次阅读

    利用ExecuTorch和Arm SME2加速端侧机器学习推理

    贴纸、分离主体以替换背景,或是对图像局部进行选择性增强。这些效果背后,是轻量级分割模型在运行,这些模型通过 ExecuTorch(PyTorch 的开源端侧推理运行时)以及第二 Arm 可伸缩矩阵扩展技术 (
    的头像 发表于 03-03 10:27 743次阅读
    利用ExecuTorch和<b class='flag-5'>Arm</b> <b class='flag-5'>SME2</b><b class='flag-5'>加速</b>端侧机器学习推理

    Arm率先适配腾讯混元HY-1.8B-2Bit模型

    计算平台,Arm 率先完成了对该模型的成功适配。HY-1.8B-2Bit 现已能够在搭载启用第二可伸缩矩阵扩展 (SME2) 技术的 Ar
    的头像 发表于 02-10 17:29 2110次阅读

    Arm SME2技术赋能端侧AI加速实现卓越移动端体验

    试想这样的场景:当你正在发消息时,手机能在你输入过程中实时翻译文字,还能即时总结整段对话内容;或是在拍照时,手机能在你按下快门之前,迅速解析复杂场景画面,并自动对关键主体进行聚焦。换言之,以往需要停顿处理的手机应用,如今已能实时预判并满足你的需求。
    的头像 发表于 01-22 14:18 751次阅读

    英飞凌下一代电磁阀驱动器评估套件使用指南

    英飞凌下一代电磁阀驱动器评估套件使用指南 、前言 在电子工程师的日常工作中,电磁阀驱动器的评估和开发是项重要任务。英飞凌推出的
    的头像 发表于 12-21 11:30 1155次阅读

    Arm Lumex平台赋能新一代旗舰智能手机体验升级

    可伸缩矩阵扩展 (SME2) 技术的全新 Arm C1 CPU 集群与Arm Mali G1-Ultra GPU,Lumex 将先进智能计算带到全球数十亿手机用户的手中,并依托各大旗
    的头像 发表于 12-15 14:27 935次阅读

    开源鸿蒙技术大会2025丨IDE分论坛:聚焦AI驱动的开发工具革新,探索下一代IDE前沿技术

    、企业界专家做精彩分享。论坛聚焦AI驱动的开发工具革新,围绕产业界AI深度融合的开源鸿蒙应用开发实践,探讨在Agentic IDE、自然语言交互等
    的头像 发表于 11-20 17:21 1029次阅读
    开源鸿蒙<b class='flag-5'>技术</b>大会2025丨IDE分论坛:聚焦<b class='flag-5'>AI</b><b class='flag-5'>驱动</b>的开发工具<b class='flag-5'>革新</b>,探索<b class='flag-5'>下一代</b>IDE前沿<b class='flag-5'>技术</b>

    安森美SiC器件赋能下一代AI数据中心变革

    电源解决方案。特别是近期,安森美携手英伟达,共推下一代AI数据中心加速向800V直流供电方案转型,这种技术能力的广度和深度使安森美成为少数能以可扩展、可实际落地的设计满足现代
    的头像 发表于 10-31 13:47 1044次阅读

    Telechips与Arm合作开发下一代IVI芯片Dolphin7

    Telechips宣布,将在与 Arm的战略合作框架下,正式开发下一代车载信息娱乐系统(IVI)系统级芯片(SoC)“Dolphin7”。
    的头像 发表于 10-13 16:11 1495次阅读

    Arm正式取消Cortex命名!CPU向着高算力进发,Lumex CSS平台加持!

    电子发烧友网报道(文/黄晶晶)日前,在Arm Unlocked上海站技术论坛上,Arm重磅推出智能终端专属 Lumex CSS平台。Lumex CSS是套专为旗舰级智能手机及
    的头像 发表于 09-17 08:25 3389次阅读
    <b class='flag-5'>Arm</b>正式取消Cortex命名!CPU向着高算力进发,Lumex CSS平台加持!

    全新Arm Lumex CSS平台实现两位数性能提升

    下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二可伸缩矩阵扩展 (SME2)
    的头像 发表于 09-10 16:14 1078次阅读
    全新<b class='flag-5'>Arm</b> Lumex CSS平台实现两位数性能提升

    主流厂商揭秘下一代无线SoC:AI加速、内存加量、新电源架构等

    标准等方面进行升级。   下一代物联网产品的新需求   芯科科技无线产品营销高级总监Dhiraj Sogani在接受采访时表示,我们的第一代、第二和第三
    的头像 发表于 07-23 09:23 6607次阅读