0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm与ExecuTorch合作加速端侧生成式AI实现

Arm社区 来源:Arm社区 2024-11-15 11:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 战略与生态部人工智能开发者平台与服务高级副总裁 Alex Spinelli

通过 Arm 计算平台与 ExecuTorch 框架的结合,使得更小、更优化的模型能够在边缘侧运行,加速边缘侧生成式 AI 的实现。

新的 Llama 量化模型适用于基于 Arm 平台的端侧和边缘侧 AI 应用,可减少内存占用,提高精度、性能和可移植性。

全球 2,000 万名 Arm 开发者能够更迅速地在数十亿台边缘侧设备上大规模开发和部署更多的智能 AI 应用。

Arm 正在与 Meta 公司的 PyTorch 团队携手合作,共同推进新的 ExecuTorch 测试版 (Beta) 上线,旨在为全球数十亿边缘侧设备和数百万开发者提供人工智能 (AI) 和机器学习 (ML) 功能,进而确保 AI 真正的潜力能被最广泛的设备和开发者所使用。

借助 ExecuTorch 和新的 Llama 量化模型,Arm 计算平台优化生成式 AI 性能

Arm 计算平台无处不在,为全球众多边缘侧设备提供支持,而 ExecuTorch 则是专为移动和边缘侧设备部署 AI 模型而设计的 PyTorch 原生部署框架。两者的紧密合作,使开发者能够赋能更小、更优化的模型,包括新的 Llama 3.2 1B 和 3B 量化模型。这些新模型可以减少内存占用、提高准确性、增强性能和提供可移植性,成为小型设备上的生成式 AI 应用的理想选择,如虚拟聊天机器人、文本摘要和 AI 助手。

开发者无需额外的修改或优化,便可将新的量化模型无缝集成到应用中,从而节省时间和资源。如此一来,他们能够迅速在广泛的 Arm 设备上大规模开发和部署更多的智能 AI 应用。

随着 Llama 3.2 大语言模型 (LLM) 新版本的发布,Arm 正在通过 ExecuTorch 框架优化 AI 性能,使得在 Arm 计算平台边缘设备运行的真实生成式 AI 工作负载能更为快速。在 ExecuTorch 测试版发布的首日起,开发者便能享有这些性能的提升。

集成 KleidiAI,加速端侧生成式 AI 的实现

在移动领域,Arm 与 ExecuTorch 的合作意味着众多生成式 AI 应用,如虚拟聊天机器人、文本生成和摘要、实时语音和虚拟助手等,完全能够在搭载 Arm CPU 的设备上以更高的性能运行。这一成果得益于 KleidiAI,它引入了针对 4 位量化优化的微内核,并通过 XNNPACK 集成到了 ExecuTorch 中,因此,在 Arm 计算平台上运行 4 位量化的 LLM 时,无缝加速 AI 工作负载的执行。例如,通过 KleidiAI 的集成,Llama 3.2 1B 量化模型预填充阶段的执行速度可以提高 20%,使得一些基于 Arm 架构的移动设备上的文本生成速度超过了每秒 400 个词元 (token)。这意味着,终端用户将从他们移动设备上获得更快速、响应更灵敏的 AI 体验。

物联网的边缘侧 AI 应用加速实时处理能力

在物联网领域,ExecuTorch 将提高边缘侧 AI 应用的实时处理能力,包括智能家电、可穿戴设备以及自动零售系统等。这意味着物联网设备和应用能够以毫秒级的速度响应环境变化,这对保障安全性和功能可用性至关重要。

ExecuTorch 可在 Arm Cortex-A CPU 和 Ethos-U NPU 上运行,以加速边缘侧 AI 应用的开发和部署。事实上,通过将 ExecuTorch 与 Arm Corstone-320 参考平台(也可作为仿真固定虚拟平台 (FVP) 使用)、Arm Ethos-U85 NPU 驱动程序和编译器支持集成到一个软件包中,开发者可在平台上市前几个月就着手开发边缘侧 AI 应用。

更易获取、更快捷的边缘侧 AI 开发体验

ExecuTorch 有潜力成为全球最受欢迎的高效 AI 和 ML 开发框架之一。通过将应用最广泛的 Arm 计算平台与 ExecuTorch 相结合,Arm 正在通过新的量化模型加速 AI 的普及,让开发者能够更快地在更多设备上部署应用,并将更多生成式 AI 体验引入边缘侧。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9618

    浏览量

    394532
  • AI
    AI
    +关注

    关注

    91

    文章

    42161

    浏览量

    303150
  • 人工智能
    +关注

    关注

    1821

    文章

    50542

    浏览量

    267880

原文标题:ExecuTorch 测试版上线,加速 Arm 平台边缘侧生成式 AI 发展

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    面壁智能与安波福达成战略合作AI座舱方案走向全球市场

    的适配部署、车载AI Agent联合方案开发、AI Box产品设计与推广等方向展开深度合作,并逐步将合作范围从安波福中国拓展至安波福全球业务体系。   无论是中国车企
    的头像 发表于 04-30 11:55 174次阅读
    面壁智能与安波福达成战略<b class='flag-5'>合作</b>,<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>座舱方案走向全球市场

    Arm与Google携手共筑AI未来

    如今,全球数十亿智能手机用户已将实时辅助、流畅沟通与高度个性化视为基础体验。在智能手机的功耗限制下实现高性能人工智能 (AI),对规模化提供即时智能体验、释放
    的头像 发表于 04-21 14:39 433次阅读

    AI应用时代,江波龙集成存储如何为AI创造价值?

    AI快速发展的现状和趋势对存储生态和产业链带来颠覆重构,存储原厂将资源专注到AI云端市场,消费类电子市场出现买不到、用不起的经营压力。随着云端AI建设,
    的头像 发表于 03-23 15:19 555次阅读
    <b class='flag-5'>AI</b>应用时代,江波龙集成存储如何为<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创造价值?

    富瀚微推动OpenClaw实现本地运行验证

    随着生成人工智能持续突破,AI正从“内容生成工具”向具备自主执行能力的智能体形态加速演进。在这一背景下,
    的头像 发表于 03-17 17:27 1153次阅读
    富瀚微推动OpenClaw<b class='flag-5'>实现</b><b class='flag-5'>端</b><b class='flag-5'>侧</b>本地运行验证

    TECNO与Arm携手推动移动实时生成AI

    Arm 始终坚信,人工智能 (AI) 及其所带来的价值,理应惠及更广泛的人群。这一理念正引领 AI 迈入全新发展阶段 —— 更具个性化、即时可用,并越来越多地在
    的头像 发表于 03-11 10:31 543次阅读

    利用ExecuTorchArm SME2加速机器学习推理

    贴纸、分离主体以替换背景,或是对图像局部进行选择性增强。这些效果背后,是轻量级分割模型在运行,这些模型通过 ExecuTorch(PyTorch 的开源推理运行时)以及第二代 Arm
    的头像 发表于 03-03 10:27 813次阅读
    利用<b class='flag-5'>ExecuTorch</b>和<b class='flag-5'>Arm</b> SME2<b class='flag-5'>加速</b><b class='flag-5'>端</b><b class='flag-5'>侧</b>机器学习推理

    西门子EDA与Arm携手合作加速系统设计验证进程与软件启动

    对芯片设计而言,加速产品的上市流程至关重要。为此,西门子EDA与Arm携手合作,为Arm合作伙伴提供了一系列基于
    的头像 发表于 12-19 09:06 992次阅读
    西门子EDA与<b class='flag-5'>Arm</b>携手<b class='flag-5'>合作</b><b class='flag-5'>加速</b>系统设计验证进程与软件启动

    应对AI算力、内存、功耗“三堵墙”困境,安谋科技Arm China “周易”X3给出技术锦囊

    AI大模型正加速从云端向边缘与渗透,然而,算力、内存、功耗等却成了制约其规模化落地的“高墙”。专为AI计算而生的神经网络处理器(NPU)
    的头像 发表于 12-18 13:45 613次阅读
    应对<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>算力、内存、功耗“三堵墙”困境,安谋科技<b class='flag-5'>Arm</b> China “周易”X3给出技术锦囊

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入AI 领域落地

    据科技区角报道半导体解决方案提供商 Quintauris 最近宣布和 RISC-V 处理器 IP 领域的头部厂商 SiFive 达成战略合作,目标直接瞄准加速 RISC-V 在嵌入AI
    发表于 12-18 12:01

    Alif Semiconductor的Ensemble MCU新增对ExecuTorch Runtime的支持,助力其推动边缘生成AI发展

    · Ensemble E4/E6/E8是业界首个为Transformer网络提供硬件加速的MCU系列,可在边缘设备及终端设备上实现本地生成AI
    的头像 发表于 11-04 11:44 2134次阅读
    Alif Semiconductor的Ensemble MCU新增对<b class='flag-5'>ExecuTorch</b> Runtime的支持,助力其推动边缘<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>发展

    AI体验跃迁,天玑9500用双NPU开创AI新时代

    架构,从底层解决性能与功耗的矛盾:超性能 NPU 990 性能大幅提升,生成 AI 引擎 2.0 深度加速 Transformer 与大模型;行业首个超能效 NPU以存算一体
    的头像 发表于 09-24 14:47 951次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双NPU开创<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新时代

    此芯科技发布“合一”AI加速计划,赋能边缘与AI创新

    此芯科技正式发布“合一”AI加速计划,旨在为边缘计算和AI场景提供高能效的全栈算力解决方案。该计划由此芯科技联合多家行业
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>计划,赋能边缘与<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新

    Arm神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,移动设备上实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,首次在移动设备上实现 PC 级别的 AI 图形性能,为未来的
    的头像 发表于 08-14 17:59 3006次阅读

    Arm率先适配腾讯混元开源模型,助力AI创新开发

    伙伴共同赋能人工智能 (AI) 部署,助力本土开发者实现 AI 应用创新! 这次的首日开源适配是双方再次携手提升
    的头像 发表于 08-08 09:16 1656次阅读
    <b class='flag-5'>Arm</b>率先适配腾讯混元开源模型,助力<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新开发

    MWCS 2025直击:紫光展锐推出UNISOCAI平台解决方案,加速AI终端落地

    ,并在 AI 与开放 API 的发展方面走在前沿,这一切得益于运营商与开发者之间的深度协作。随着人工智能的采用呈现指数级的增长,5G内置的功能是绝对必要的。中国在基于人工智能的先进应用方面仅次于美国和德国,在生成
    的头像 发表于 06-21 10:33 6338次阅读
    MWCS 2025直击:紫光展锐推出UNISOC<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>平台解决方案,<b class='flag-5'>加速</b><b class='flag-5'>AI</b>终端落地