0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm 推出 Armv9 边缘 AI 计算平台,以超高能效与先进 AI 能力赋能物联网革新

晶芯观察 来源:电子发烧友 作者:黄晶晶 2025-03-06 11:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)当下,快速发展的 AI 正不断赋予边缘设备越来越先进的智能性,使边缘设备胜任越来越重要的任务。为应对边缘侧持续增长的 AI 需求,Arm 近日发布以全新基于 Armv9 架构的超高能效 CPU——Arm Cortex-A320 以及对 Transformer 网络具有原生支持的 Ethos-U85 AI 加速器为核心的边缘AI 计算平台,可支持运行超 10 亿参数的端侧 AI 模型。

wKgZO2fJN8-AZSrtAAJygK-Y8zE909.png

全新超高能效 Arm Cortex-A320 CPU 引领边缘 AI 变革

据 Arm 物联网事业部业务拓展副总裁马健分享,此次全新推出的 Cortex-A320 是 Arm 首个基于 Armv9 架构的超高能效 CPU,为物联网应用专门优化,将彻底变革边缘 AI。在ML性能方面,Cortex-A320 相较于前代超高能效 CPU (Cortex-A35) 提升了高达 10 倍的 ML 计算能力。其能效较 Cortex-A520(Arm 的高能效 Armv9.2 CPU)提升了 50%,进一步降低了功耗。在标量计算性能方面,Cortex-A320 的性能比前代 Cortex-A35 提高了 30%,带来了更强的通用计算能力。

wKgZPGfJN9iAAWfGAAPH-JZBfN8207.png

马健指出,随着对支持更大规模、多模态 AI 模型的硬件需求不断增长,系统的内存需求也在迅速提升。因此,具备更高内存访问性能的系统变得尤为必要,以满足更复杂的应用场景。相比 Cortex-M,Cortex-A 处理器支持更大的可寻址内存空间,并能够更灵活地管理多层次内存访问延迟。

同时,随着边缘 AI 负载变得越来越复杂,对更强大、更灵活的操作系统进行系统管理的需求也在增加。而传统的 Cortex-M 一般只能跑实时操作系统,但功能丰富的操作系统可以使得设备管理更加灵活。

Cortex-A320 具备支持多种操作系统的能力,无论是如 FreeRTOS 和 Zephyr 的实时操作系统 (RTOS),还是如 LinuxAndroid 的功能丰富的操作系统,都能提供高效支持。与此同时,凭借 Arm的 A处理器架构优势,Cortex-A320 可开箱即用地支持 Linux,并且能够轻松移植安卓及其他现有的功能丰富的操作系统。此外,Cortex-A320 最高可支持四核共享集群,可根据不同需求灵活扩展,满足各种应用场景的需求。

Cortex-A320 还为现有的物联网领域的 Cortex-A 产品提供了灵活的升级路径。无论是从 Cortex-A35 迁移,还是从全球出货量最高的基于 Armv8 架构的 Cortex-A 处理器 Cortex-A53 升级,Cortex-A320 都提供了理想的 Armv9 迁移方案,并带来了众多优势,包括更先进的安全性、广泛的 Armv9 软件生态的支持,以及更高的计算性能。
wKgZPGfJN-CAcC5tAAKT-tLpwV0575.png

此外,随着边缘应用场景日趋复杂,以及设备端软件及数据价值日益凸显,安全性问题比以往任何时候都更为关键,Cortex-A320 充分利用了 Armv9 增强的安全性和AI 计算特性。在安全性方面,Secure EL2 增强了 TrustZone 内部的隔离性,支持更安全地运行软件容器。指针验证/分支目标识别 (PACBTI)可有效缓解跳转和返回编程中的指针安全隐患。内存标记扩展 (MTE)通过内存标记机制,使黑客更难利用漏洞进行攻击,提高整体系统安全性。

AI 计算能力增强方面,Armv9 具有增强的 Neon 和可伸缩向量扩展 (SVE2) 技术,提供更高效的 ML 计算能力。其还支持例如 BFloat16 等新数据类型,提高 AI 计算的精度和能效。不仅如此,新增的矩阵乘法指令能够优化 AI 和 ML 计算性能,加速神经网络推理和训练任务。

Cortex-A320 Ethos-U85 深度配合,相得益彰

Arm Cortex-A320 CPU 和 Ethos-U85 NPU 是此次发布的边缘 AI 计算平台的两大核心。该平台具备强大的计算能力,比去年的基于 Cortex-M85 搭配 Ethos-U85 的平台提升了8倍的 ML 计算性能,带来了显著的 AI 计算能力突破。

该边缘 AI 计算平台并不是 CPU 和 AI 加速器的简单堆叠,而是实现了深度配合,让 CPU 和 NPU 相得益彰。马健指出,去年 Arm 推出的集成了 Cortex-M85 和 Ethos-U85 的 Arm Corstone 物联网参考设计平台,显著提升了端侧 Transformer 网络的执行效率。随着此次边缘 AI 计算平台的发布,Ethos-U85 驱动程序已经完成更新,使得 Cortex-A320 能够直接驱动 Ethos-U85,无需额外搭载 Cortex-M。

Cortex-A320 可以为 Ethos-U85 提供更高的内存容量与带宽,让大模型在 Ethos-U85 上的执行如虎添翼;任何开发者们不希望在 Ethos-U85 上运行的 AI 操作,可以回退到 Cortex-A320,利用其 Neon/SVE2 引擎更灵活有效地在 CPU 上执行。例如,在连续图像检测任务中,通常会优先在 AI 加速器上运行,以提高能效。而对于单张图像的处理,在 CPU 上执行可能更高效。这使智能物联网与消费类电子生态系统能够在正确的时间,并在合适的地方运行最适合的工作负载。

将 Arm Kleidi 扩展到物联网

边缘 AI 普及面临的最主要障碍之一是软件开发和部署的复杂性,这正是 Armv9 边缘 AI 计算平台软件生态系统发挥优势的关键所在。去年,Arm 推出了 Kleidi 软件库,并将其引入了智能手机和服务器市场,它包含优化 AI 负载在 Arm CPU 上执行的 KleidiAI 和加速机器视觉的 KleidiCV。如今,Arm 将 Kleidi 扩展到了物联网领域,以加速 AI 性能表现。

wKgZO2fJN-qAOP0AAAEyfYGhWpM463.png

KleidiAI 是一套专为 AI 框架开发者设计的计算内核,让开发者可以无缝地在 Arm CPU 上获取最佳性能,适用于各类设备。它支持如 Neon 和 SVE2 等 Armv9 架构的关键特性,大幅提升了 AI 的计算效率。此外,KleidiAI 已经集成到多个主流 AI 框架,包括 Llama.cpp、ExecuTorch 和 LiteRT(通过 XNNPACK)它可以加速 Meta Llama 3 和 Phi-3 等主流AI 大模型,进一步释放 AI 计算性能。

更好地支持 Deepseek 等深度模型优化

谈及对AI推理应用模型的支持,马健表示:“在百模争霸的时代,模型的架构还在不断地改变,一些新的数据可以让模型变得更聪明或者有一些推理功能。深度的优化也已经开始热火朝天地进行起来了,DeepSeek 就是个非常好的例子。Deepseek 的 R1 模型已达到了 15 亿参数,跑在 Arm 全新的边缘 AI 计算平台上,理论上是绰绰有余的。”

此外,马健还表示,模型的大小有时候并不与 AI 加速器的 TOPS 直接相关,而是更多受到内存带宽和内存容量的限制。Arm 有一系列的 Cortex-A 处理器,从超高的性能到超高的能效。这一系列处理器可以有不同的内存配置。不同的内存配置可以适配不同大小的参数规模。

在AI时代,最重要的是更加贴近市场和应用,从整体上来思考产业发展的趋势和需求。Arm Cortex CPU 选择丰富,能够全面满足边缘 AI 应用场景的需求,比如 Cortex-X925 适用于非常高端的机器人领域,而Cortex- A320用在对能效有极致追求的边缘应用。此外,NPU 方面在不久的未来也将会有AI新产品加入。

由此可以看到,Arm 早已在边缘侧进行了前瞻性布局。此次发布的 Arm 边缘 AI 计算平台能高效执行复杂的 AI 任务,同时保证系统的安全性、可靠性和数据完整性。在 AI 推理时代,Arm 将继续引领行业发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9589

    浏览量

    393769
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Supermicro推出紧凑型高能系统:边缘算力重构AI应用新范式

    近日,全球IT解决方案领导者Supermicro(超微)宣布推出基于**AMD EPYC™ 4005系列处理器**的紧凑型高能系统,“小体积、大算力、低功耗”的颠覆性设计,为零售、
    的头像 发表于 04-22 14:58 1417次阅读

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    AGX Orin 150 TOPS+ 本地大模型推理、具身智能控制、多模态实时交互 迷你AI服务器 176TOPS 意味着OrangePi AI Station正式迈入 高端边缘AI
    发表于 03-10 14:19

    Arm解码边缘AI七大用例如何现实生活

    边缘人工智能 (AI),即直接在产生数据的本地设备上集成 AI 能力,已不再是遥不可及的愿景,而是落地当下的现实。这种技术支持端侧本地处理,无需持续依赖云端,能够满足企业对更低时延、更
    的头像 发表于 01-09 15:27 706次阅读

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入式与 AI 领域落地

    之后,要打造的是高可靠性、高能还支持可扩展的 RISC-V 设计方案。而且合作的核心目标特别明确: 让 RISC-V 处理器在嵌入式、联网AI
    发表于 12-18 12:01

    专为边缘而生:深度解析昆仑芯K100 AI加速卡,释放128 TOPS极致

    昆仑芯K100边缘AI加速卡75W超低功耗实现128 TOPS的INT8算力,重新定义边缘推理
    的头像 发表于 12-14 11:12 3210次阅读
    专为<b class='flag-5'>边缘</b>而生:深度解析昆仑芯K100 <b class='flag-5'>AI</b>加速卡,释放128 TOPS极致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    AI管理系统,通过AI模型提高能耗管理

    策略,难以应对电力负荷波动、可再生能源发电的不确定性以及复杂的市场电价。如今,钡铼技术ARMxy系列边缘计算网关为代表的硬件设备,通过深度融合人工智能技术,为储管理系统注入了全新的
    的头像 发表于 11-05 17:52 1003次阅读

    Arm Flexible Access方案引入Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台(专为联网
    的头像 发表于 10-29 15:27 1252次阅读

    此芯科技发布“合一”AI加速计划,边缘与端侧AI创新

    此芯科技正式发布“合一”AI加速计划,旨在为边缘计算和端侧AI场景提供高能的全栈算力解决方案。
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b>加速计划,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>边缘</b>与端侧<b class='flag-5'>AI</b>创新

    如何在基于Arm架构的边缘AI设备上部署飞桨模型

    Arm 与领先的开源深度学习平台强强联合,会带来什么?那就是推动创新的“火箭燃料”。Arm 携手百度,利用双方在高能
    的头像 发表于 09-06 14:07 1396次阅读

    AI 边缘计算网关:开启智能新时代的钥匙​—龙兴

    顺畅地通向云端,实现设备与云端之间高效的数据传输与交互。通过融合先进边缘计算和人工智能技术,AI 边缘
    发表于 08-09 16:40

    芯原可扩展的高性能GPGPU-AI计算IP汽车与边缘服务器AI解决方案

    芯原股份 (芯原,股票代码:688521.SH) 日前宣布其 高性能、可扩展的GPGPU-AI计算IP的最新进展,这些IP现已为新一代汽车电子和边缘服务器应用提供强劲
    的头像 发表于 06-16 10:44 1543次阅读

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 在移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能、比与开发效率上的挑战。以下从技术架构、性能突破、应用场景、生态系统及战略价值展开分析: 一、技术架构:异构
    的头像 发表于 05-29 09:54 4602次阅读

    联网工程师为什么要学Linux?

    均基于Linux二次开发。 2)边缘计算AI整合 随着边缘智能设备的普及,Linux在轻量化AI模型部署(如TensorFlow Li
    发表于 05-26 10:32

    超低功耗Wi-Fi 6模块联网:NRF7002

    高能特性为边缘计算设备提供了理想的无线连接方案。 核心亮点与参数解析1. ‌极致设计‌ P
    发表于 05-21 17:10

    AI边缘计算网关_AI边缘智能网关自助政务服务机_厦门计讯联科技有限公司

    在数字化浪潮席卷全球的今天,政务服务智能化转型已成为提升治理效能、优化民生体验的关键举措。计讯联凭借深耕联网领域的技术积淀,其自主研发的AI边缘
    的头像 发表于 05-19 18:08 743次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>边缘</b><b class='flag-5'>计算</b>网关_<b class='flag-5'>AI</b><b class='flag-5'>边缘</b>智能网关<b class='flag-5'>赋</b><b class='flag-5'>能</b>自助政务服务机_厦门计讯<b class='flag-5'>物</b>联科技有限公司