0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm技术赋能ExecuTorch 1.0正式版发布

Arm社区 来源:Arm社区 2025-11-20 16:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 人工智能平台和开发者平台副总裁 Sharbani Roy

试想这样的场景:专用的端侧人工智能 (AI) 助手与语音交互无需连接云端即可运行,且响应延迟极低;聊天机器人能在用户输入时实时推荐回复内容;游戏体验可根据玩家操作实时调整;可穿戴设备与物联网设备中,更智能的常开式高能效传感器能以低功耗实现强大的智能功能。

这类 AI 体验均可通过 ExecuTorch(Meta 针对 PyTorch 打造的端侧运行时)与 Arm 共同助力开发者实现。二者结合能通过统一的 PyTorch 工作流带来优化的性能与更高效的开发流程,数十亿基于 Arm 架构的边缘侧设备上在该工作流上无缝运行。近期,ExecuTorch 迎来重要里程碑 —— 发布正式版,该版本将“AI 无处不在”的愿景,转化为可供数百万开发者落地的规模化方案。

ExecuTorch 1.0 正式版

赋能一套工作流,覆盖数十亿边缘侧设备

ExecuTorch 1.0 正式版彻底改变了开发者规模化落地 PyTorch 模型的方式。以往,开发者需要针对不同设备类型,单独调整模型版本、管线或框架;如今,只需一套 PyTorch 工作流,开发者即可完成从模型创建、导出、优化、量化到部署的端到端操作,且覆盖移动端、嵌入式与边缘侧设备,不仅大幅减少了开发碎片化问题,同时缩短了产品上市时间。

借助这套工具集,开发者可无缝部署应用与工作负载,在从超高能效微控制器到旗舰智能手机等各类搭载 Arm CPUGPU 和 Arm Ethos-U NPU 的边缘侧设备上,充分释放更先进、更快速的 AI 体验与特性。

助力 ExecuTorch 的 Arm 技术

Arm KleidiAI、CMSIS-NN 与张量算子集架构 (TOSA)通过在 ExecuTorch 中集成后端,共同构建了统一的优化框架。这意味着,当应用与工作负载面向基于 Arm 架构的边缘侧设备时,开发者无需修改代码或模型,即可自动获得性能与效率提升。

KleidiAI 可提供 Arm 内核集成,为当前及未来的 Arm CPU 平台加速 AI 工作负载。目前,该技术已集成到多个框架和运行时中,包括 ExecuTorch 使用的 XNNPACK 运行时。同时,CMSIS-NN ExecuTorch 后端集成相当于 Arm Cortex-M 系列微控制器的性能加速器,能为资源受限的边缘侧设备提供高效、直接集成的推理支持。

ExecuTorch 中的 TOSA 集成为在 Arm GPU 和 Ethos-U NPU 上运行的边缘 AI 与机器学习 (ML) 工作负载,提供了统一的执行接口。TOSA 可将模型转换为独立于硬件的标准化表示,既能确保在这些技术平台上实现一致的部署、移植和验证,又能减少工程开发工作量。

ExecuTorch 1.0 正式版

为移动端和边缘 AI 市场带来价值

移动端领域

在移动端领域,ExecuTorch 1.0 正式版可帮助开发者,在当前数十亿基于 Arm 架构的智能手机及新一代移动设备上,更快、更高效地部署更智能的端侧 AI 体验。

主要优势包括:

与安卓应用工作流无缝集成,且从模型开发到端侧部署均全面支持 PyTorch,大幅缩短产品上市时间。

借助 KleidiAI 优化实现内置性能提升,为文本生成、音频生成、实时语音交互和虚拟助手等各类先进端侧 AI 功能和体验,带来更快的启动速度、更低的延迟以及更少的内存占用。例如,Stable Audio Small 文本转音频模型在基于 Arm CPU 的端侧运行时,生成 11 秒音频仅需 7 到 8 秒,而在启用 SME2 的消费电子设备上,生成时间可缩短至 4 秒以内。

广泛的 Arm 技术支持,确保 AI 模型可在当前及未来的各类 Arm CPU 和 GPU 上运行,具体包括:

Arm Cortex-A CPU 及新一代 Arm CPU(包括启用 SME2 的 Arm C1 CPU),可通过 XNNPACK 中的 KleidiAI 集成实现支持。

当前的 Arm Mali 和 Arm Immortalis GPU 可通过 Vulkan 路径实现支持。

2026 年推出的搭载Arm 神经技术的 Arm Mali GPU,可通过 Vulkan 和 VGF 后端实现支持,助力开发者在移动设备上提升实时 4K 游戏的 AI 性能。

边缘 AI 与高性能物联网

Arm Ethos-U 处理器系列为物联网市场的各类边缘 AI 应用提供出色的加速能力,是 ExecuTorch 1.0 正式版广泛支持的关键生产后端。

这将带来以下价值:

借助提前 (AoT) 编译、运行时支持,以及虚拟平台的可用性,开发者可在基于 Ethos-U 的硬件上市前,提前开始构建应用与工作负载,从而缩短产品上市时间。例如,通过 Arm Corstone 子系统,开发者可先在固定虚拟平台 (FVP) 上模拟 Ethos-U 目标设备,再迁移至 FPGA 原型,最终落地到基于 Corstone 构建的芯片实现方案。

为开发者提供丰富的产品组合,包含 100 多个预先验证的 AI 模型[1],涵盖图像分类、关键词识别等场景。开发者可直接通过 ExecuTorch 在 Ethos-U NPU 上完成端到端部署。

通过 TOSA 标准提升可移植性,这意味着为一个 Arm 平台构建的模型,可部署到多个平台上。

集成 Arm Vela 编译器简化模型编译流程。该编译器可为 Ethos-U NPU 优化并分配 AI 工作负载,无需额外人工操作,即可自动提升效率、降低延迟。

即便在功耗预算极其受限的场景下,也能实现高效的 AI 推理。这得益于强大的算子支持、量化工具,以及回退路径(比如针对基于 Cortex-M 的微控制器的 CMSIS-NN 支持)。

[1] 多款模型可在https://docs.pytorch.org/vision/main/models.html 和https://docs.pytorch.org/audio/main/models.html 查看

此外,在高性能物联网领域,KleidiAI 与主流 AI 框架的集成,还可提升 Arm CPU 上关键模型(包括 Meta Llama 3 和 Phi-3)的性能与效率。

开发者现可获取

ExecuTorch 1.0 正式版的各项优势

开发者即日起就可体验 ExecuTorch 1.0 正式版的各项优势。访问 developer.arm.com,探索 ExecuTorch 的所有 Learning Path、查看相关文档和教程,并将工作流集成到模型导出、编译和部署管线中。此外,开发者还可在 PyTorch 页面[2]查看 ExecuTorch 的更多详细信息,以及获取 XNNPACK、Ethos-U、VGF 和 Vulkan 设备的开发者文档[3]。无论是面向移动设备、PC、可穿戴设备还是边缘传感器开发,开发流程均统一且无缝。

[2] PyTorch 页面:https://pytorch.org/projects/executorch/

[3] 开发者文档:https://docs.pytorch.org/executorch/main/backends-arm-vgf.html

让边缘 AI 无处不在

惠及每一个人

ExecuTorch 1.0 正式版再次印证了 Arm 的愿景——让 AI 在硬件生态系统的每一个层面,都能一致且无缝地运行。依托 Arm 计算平台的强大性能与广泛的生态系统,ExecuTorch 1.0 不仅解锁了规模化部署、高性能表现与创新能力,将助力新一代边缘 AI 体验无处不在,惠及每一个人。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9588

    浏览量

    393679
  • 人工智能
    +关注

    关注

    1820

    文章

    50331

    浏览量

    266968
  • 边缘AI
    +关注

    关注

    1

    文章

    270

    浏览量

    6216

原文标题:ExecuTorch 1.0 正式版发布!重塑基于 Arm 计算平台的边缘 AI 开发体验

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    超声,共赴新程!安泰电子超声应用研讨会圆满收官!

    技术前沿,见证功放在超声测试领域的实力。01企业发声:深耕功放,超声研讨会现场,西安安泰电子(Aigtek)销售总监为大家全面介绍了
    的头像 发表于 03-26 19:08 296次阅读
    超声<b class='flag-5'>赋</b><b class='flag-5'>能</b>,共赴新程!安泰电子超声应用研讨会圆满收官!

    华为联合华海智汇发布数智城市一张网升级解决方案

    华为中国合作伙伴大会2026期间,在“数智城市一张网新升级”公开演讲上,华为携手华海智汇技术有限公司(以下简称“华海智汇”)发布数智
    的头像 发表于 03-24 15:09 461次阅读

    国星光电以MIP技术MLED新蓝图

    3月初,国星光电先后亮相2026行家说开年盛会和2026中国国际LED产业发展大会暨全球LED显示产业调研白皮书发布会,在两场行业论坛上发表《MIP进击篇:MLED新蓝图》主题演讲。
    的头像 发表于 03-10 15:56 393次阅读

    利用ExecuTorchArm SME2加速端侧机器学习推理

    贴纸、分离主体以替换背景,或是对图像局部进行选择性增强。这些效果背后,是轻量级分割模型在运行,这些模型通过 ExecuTorch(PyTorch 的开源端侧推理运行时)以及第二代 Arm 可伸缩矩阵扩展技术 (
    的头像 发表于 03-03 10:27 722次阅读
    利用<b class='flag-5'>ExecuTorch</b>和<b class='flag-5'>Arm</b> SME2加速端侧机器学习推理

    Altair CFD 以技术工程创新?

    的端到端无缝衔接。具备自动网格划分、GPU加速、稳态时间行进等功能,其中几何模型准备效率较传统工具提升80%,稳态仿真可在少于100次迭代中快速收敛,大幅缩短仿真周期。4. AI+便捷交互,降低
    发表于 02-28 14:47

    Arm Flexible Access 扩容升级,更多企业加速芯片开发

    与适用范围,并简化加入流程。此次更新旨在降低复杂度、加快项目进程, 在 最大程度为初创企业及成熟芯片设计团队 降低设计 风险 的前提下,让他们同时得以释 放更广阔 的 边缘 人工智能  (AI) 创新空间。 Arm 商业总监
    的头像 发表于 02-04 16:20 2267次阅读
    <b class='flag-5'>Arm</b> Flexible Access 扩容升级,<b class='flag-5'>赋</b><b class='flag-5'>能</b>更多企业加速芯片开发

    京东关键词API

    商品的「关键词搜索数据」转化为选品、运营、竞品监控、定价策略的决策依据,实现从 “经验驱动” 到 “数据驱动” 的业务升级。结合电商技术开发、运营优化的实际需求,本文从 四大核心场景、实战落地流程、进阶升级方案 三个维度,拆
    的头像 发表于 01-07 09:53 839次阅读

    魏德米勒联合举办智能联接智慧物流行业技术沙龙

    近日,一场聚焦 “智能联接智慧物流” 的行业技术沙龙在北京重磅举办,为行业发展注入新动能!
    的头像 发表于 12-22 16:32 484次阅读

    【新品发布】silex希来科为支持 6GHz 频段的工业用无线网桥 「BR-600AX」~

    【新品发布】silex希来科为支持 6GHz 频段的工业用无线网桥 「BR-600AX」~
    的头像 发表于 12-14 14:53 1440次阅读
    【新品<b class='flag-5'>发布</b>】silex希来科为支持 6GHz 频段的工业用无线网桥 「BR-600AX」<b class='flag-5'>赋</b><b class='flag-5'>能</b>~

    能耗管理系统的国产化趋势:自主技术节能产业

    能耗管理系统的国产化趋势:自主技术节能产业 在 “双碳” 目标推进与自主创新战略深化的背景下,我国能耗管理系统行业正加速从 “依赖进口” 向 “自主可控” 转型。能耗管理系统的国产化趋势日益凸显
    的头像 发表于 11-13 16:11 405次阅读

    Alif Semiconductor的Ensemble MCU新增对ExecuTorch Runtime的支持,助力其推动边缘生成式AI发展

    · Ensemble E4/E6/E8是业界首个为Transformer网络提供硬件加速的MCU系列,可在边缘设备及终端设备上实现本地生成式AI推理 · Alif与Arm合作,在PyTorch大会上
    的头像 发表于 11-04 11:44 1829次阅读
    Alif Semiconductor的Ensemble MCU新增对<b class='flag-5'>ExecuTorch</b> Runtime的支持,助力其推动边缘生成式AI发展

    AppGallery Connect(HarmonyOS 5及以上) --公开测试创建并发布测试版本(一)

    本的VersionCode和正式版本的VersionCode相同,则当测试版本转为正式发布后,会自动更新到正式版本。 正式版本上架后,同版本名称(VersionName)同版本号(Ve
    发表于 09-26 17:24

    苹果发布4款芯片为新机

    来看看苹果发布的4款芯片为新机。 此次的苹果秋季发布会共有四款iPhone新机型及四款新芯片亮相;四款全新 iPhone 机型搭载了新一代处理器芯片;此外,还有全新的网络芯片和蜂窝
    的头像 发表于 09-10 15:28 1414次阅读
    苹果<b class='flag-5'>发布</b>4款芯片为新机<b class='flag-5'>赋</b><b class='flag-5'>能</b>

    技术体验创新 HarmonyOS 游戏领启未来

    【中国,上海,2025年7月31日】2025年中国国际数字娱乐产业大会(CDEC)高峰论坛成功举办。华为终端云服务互动媒体BU总裁张思建在《技术体验创新 HarmonyOS 游戏领启未来》主题
    的头像 发表于 08-04 09:11 1095次阅读
    <b class='flag-5'>技术</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>体验创新 HarmonyOS 游戏领启未来

    美芯晟DtoF传感技术智慧感知清洁新时代

    美芯晟DtoF传感技术智慧感知清洁新时代
    的头像 发表于 07-23 14:35 3605次阅读
    美芯晟DtoF传感<b class='flag-5'>技术</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>智慧感知清洁新时代