0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Ethos-U85:满足物联网面向AI时代的高性能需求

Arm社区 来源:Arm社区 2024-04-09 17:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着人工智能 (AI) 不断对我们的日常生活产生越来越大的影响,其推理任务也逐渐从云端迁移到边缘侧和端侧。边缘侧推理为板载设备引入智能化能力,使数据能够在本地进行处理,并实时做出决策,同时提高了数据隐私性和安全性。

Arm Ethos NPU

Arm 多年来不断开发边缘 AI 加速器,以满足边缘侧和端侧不断增长的推理工作负载需求。此前两款成功的 NPU 产品 —— Arm Ethos-U55 和 Ethos-U65,为边缘侧和端侧 AI 应用带来了高性能、高能效的解决方案。

Ethos-U55 通常部署在基于 Cortex-M 的异构系统中。而 Ethos-U65 则将 Ethos-U 系列的适用性扩展到基于 Cortex-A 的系统中,并为设备上的机器学习 (ML) 能力带来了两倍的性能提升。这两款产品均提供统一的工具链,可简化开发并支持常见的 ML 神经网络运算,包括卷积神经网络 (CNN) 和循环神经网络 (RNN)。

Transformer 架构的影响

于 2017 年问世的 Transformer 架构彻底改变了生成式 AI,并成为许多新型神经网络的首选架构。基于 Transformer 架构的模型可利用注意力机制处理序列数据,并在机器翻译、自然语言理解、语音识别、分割和图像字幕生成等多项 AI 任务中实现优异的效果。

这些模型可被调整和压缩,在不过多影响准确度的情况下,能高效运行于边缘设备上,并在许多边缘侧和端侧用例中发挥领先的优势。

全新 Ethos-U85 NPU

依托 Ethos-U 系列 NPU 过往的成功经验,Arm 推出了全新产品 —— Ethos-U85。该处理器秉承此前 Ethos-U NPU 一贯的高性能、高能效设计理念,并可同时为边缘侧和端侧设备上采用 Transformer 架构的现有和未来的工作负载提供支持。

Ethos-U85 是 Arm Ethos-U 产品线中的第三代 NPU,也是迄今为止性能和能效最强的 Ethos NPU。与上一代产品相比,该 NPU 的性能提升了四倍,能效提高了 20%,并且可在主流网络上实现高达 85% 的利用率。全新 Ethos-U85 可满足诸如工厂自动化和商用或智能家居摄像头等物联网应用不断攀升的性能需求。此外,其专为搭配基于 Cortex-M 或 Cortex-A的系统一同运行而设计,并容忍高 DRAM 延迟。

Ethos-U85 的主要特性包括:

单周期支持从 128 到 2048 个 MAC 单元的配置 —— 在 1GHz 时,算力可支持从 256 GOPS 到 4 TOPS。

支持 int8 权重和 int8 或 int16 激活。

支持 Transformer 架构网络,以及 CNN 和 RNN。

硬件原生支持 2/4 稀疏性,使吞吐量翻倍。

内部 SRAM 为 29 至 267 KB,多达六个 128 位 AXI5 接口

支持权重压缩,采用标准和快速权重编码器

支持扩展压缩。

除了 Ethos-U55 和 Ethos-U65 目前支持的算子,通过支持 TRANSPOSE、GATHER、MATMUL、RESIZE BILINEAR 和 ARGMAX 等运算,Ethos-U85 涵盖了对 Transformer 模型和 DeeplabV3 语义分割网络的原生硬件支持。

Ethos-U85 也支持元素级算子链化。通过链化将元素级运算与先前的运算相结合,使 SRAM 不必先写入再读取中间张量。由此可凭借 NPU 和内存之间数据传输量的减少,提高 NPU 的效率。相比于 Ethos-U65,链化是 Ethos-U85 在效率提升上的新功能之一,其余还包括快速的权重编码器、优化的 MAC 阵列能效,以及提升的元素效率。

76e89a6c-f64e-11ee-a297-92fbcf53809c.png

图:Ethos-U85 系统配置

Ethos-U85 可用于与 Ethos-U55 和 Ethos-U65 相同的系统配置流程,并且我们支持从基于 Cortex-A 的系统直接驱动 Ethos-U85 的功能。

Ethos-U85 支持与上一代 Ethos-U 系列产品相同的软件工具链, 即使用 TFLmicro 运行时。此外,在这个基础上,Ethos-U85 同时还能为更广泛采用 Transformer 架构的用例提供支持,这对于已经投入在基于 Cortex-A/Cortex-M 与 Ethos-U55/Ethos-U65 的系统厂商来说,将能扩大其过往的投资价值。未来,我们预计将支持面向边缘设备的 PyTorch 运行时 ExecuTorch。

Ethos-U85 支持的算子将在 NPU 上进行加速,对于特殊算子不支持的情况,其中部分算子将调用 CMSIS-NN 库实现在 Cortex-M系统上进行加速。例如,在 tinyLlama 的用例中,该模型算子可完全映射到 Ethos-U85,没有算子回退到 CPU

Ethos-U85 担任了 Arm 全新物联网参考设计平台 Corstone-320 的核心角色,该参考设计平台加快了各类 AIoT 解决方案中高性能 SoC 的开发和部署。

释放边缘 AI 的无限潜力

Ethos-U85 将提供在边缘侧和端侧设备上执行领先 AI 功能所需的算力。随着 AI 时代的不断发展,我们的合作伙伴将获得基于 Arm Ethos-U 的可靠、高效兼具高性能的解决方案。我们预计在新兴的边缘 AI 用例、智能家居、零售或工业场景中看到 Ethos-U85 被广泛部署,这些用例和场景需要更高的计算性能,并支持新型的 AI 框架。

Arm 引以为傲的是,我们不断通过前沿的软硬件解决方案,为合作伙伴与生态系统提供强而有力的支持。全新 Ethos-U85 的推出将释放边缘侧和端侧 AI 推理用例的无限潜能,从而改变世界。Arm 正在引领边缘 AI 的创新提升至全新水平,并持续夯实 Arm 成为未来边缘 AI 的基石。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • sram
    +关注

    关注

    6

    文章

    809

    浏览量

    117229
  • 物联网
    +关注

    关注

    2939

    文章

    47336

    浏览量

    408121
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261624
  • Cortex-M
    +关注

    关注

    2

    文章

    234

    浏览量

    30969
  • AI加速器
    +关注

    关注

    1

    文章

    73

    浏览量

    9434

原文标题:Arm Ethos-U85:满足物联网面向 AI 时代的高性能需求

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瑞萨电子RA8P1系列32位AI MCU介绍

    RA8P1系列是瑞萨电子首款搭载高性能Arm Cortex-M85(支持Helium矢量扩展)及Ethos-U55 NPU的32位AI加速微
    的头像 发表于 09-23 10:15 2569次阅读
    瑞萨电子RA8P1系列32位<b class='flag-5'>AI</b> MCU介绍

    香橙派发布RISC-V高性能智能网关解决方案OrangePi R2S,赋能智能家居和工业互联网

    OrangePiR2S,该板基于开芯微KyX18核RISC-VAI处理器,在算力、能效和接口配置等方面均达到业界领先水平,旨在满足联网应用的高性能需求。面对AIoT
    的头像 发表于 06-06 17:29 988次阅读
    香橙派发布RISC-V<b class='flag-5'>高性能</b>智能网关解决方案OrangePi R2S,赋能智能家居和工业互<b class='flag-5'>联网</b>

    联网工程师为什么要学Linux?

    联网工程师需要掌握Linux的主要原因可以从技术生态、开发需求、行业应用及就业竞争力四个角度来分析: 一、技术生态与行业适配性 1)嵌入式开发的主流平台
    发表于 05-26 10:32

    Synaptics发布高性能AI MCU,推动边缘计算新突破

    新突思科技发布SR系列高性能自适应微控制器(MCU),基于Astra™原生AI平台,专为边缘AI情境感知设计。该系列支持三种功耗模式(性能、超低功耗、持续运行),搭载
    的头像 发表于 04-23 10:00 926次阅读
    Synaptics发布<b class='flag-5'>高性能</b><b class='flag-5'>AI</b> MCU,推动边缘计算新突破

    ESP32-C3FH4:高性能联网芯片的卓越之选,智能门锁安防等应用

    防护,满足联网设备安全需求 低功耗设计:多种省电模式延长电池设备使用寿命 ESP32-C3FH4以其出色的性能参数和广泛的应用适应性,
    发表于 04-03 11:41

    Nordic nRF54 系列芯片:开启 AI联网时代

    ,在保证性能的同时实现了成本的有效控制。​ Nordic nRF54 系列芯片凭借其在 AI 机器学习和联网领域的卓越表现,正引领着行业的发展潮流。无论是追求
    发表于 04-01 00:18

    适用于数据中心和AI时代的800G网络

    选择无拥塞路径,提高数据传输效率。 多租户性能隔离:确保不同用户任务之间带宽分配合理。 飞速(FS)800G光模块在AI数据中心中的作用 为满足AI和大规模数据中心的带宽
    发表于 03-25 17:35

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布,为 AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性能、低功耗和灵活扩展的需求。 [](
    发表于 03-19 17:54

    MediaTek发布全新高性能边缘AI联网芯片

    在国际嵌入式展(EMBEDDED WORLD)上, MediaTek 发布高性能边缘 AI 联网芯片 Genio 720 和 Genio 520。作为 Genio 智能
    的头像 发表于 03-12 16:21 851次阅读

    Arm 推出 Armv9 边缘 AI 计算平台,以超高能效与先进 AI 能力赋能联网革新

    架构的超高能效 CPU——Arm Cortex-A320 以及对 Transformer 网络具有原生支持的 Ethos-U85 AI 加速器为核心的边缘AI 计算平台,可支持运行超
    的头像 发表于 03-06 11:43 1782次阅读
    <b class='flag-5'>Arm</b> 推出 Armv9 边缘 <b class='flag-5'>AI</b> 计算平台,以超高能效与先进 <b class='flag-5'>AI</b> 能力赋能<b class='flag-5'>物</b><b class='flag-5'>联网</b>革新

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    的应用不断增加,尤其是在需要低延迟和实时数据处理的场景中,如自动驾驶、工业自动化和联网设备。其可编程性和灵活性使其能够适应多样化的边缘计算需求。• 数据中心与高性能计算:在数据中心中
    发表于 03-03 11:21

    Arm推出全球首个Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台以 Cortex-A320 CPU 和 Ethos-U85 NPU 为核心,专为联网应用优化,支持运行超 10 亿参数的端侧
    的头像 发表于 02-27 17:08 1234次阅读

    如何在Arm Ethos-U85上使用ExecuTorch

    在快速发展的机器学习领域,PyTorch 凭借其灵活性和全面的生态系统,已成为模型开发的热门框架。Arm 与 Meta 合作在 ExecuTorch 中引入了对 Arm 平台的支持,进一步简化了模型算法开发过程,实现无缝在边缘侧设备上部署 PyTorch 模型。
    的头像 发表于 02-14 14:23 1027次阅读
    如何在<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>上使用ExecuTorch

    基于Arm Ethos-U85 NPU部署小语言模型

    随着人工智能 (AI) 的演进,人们对使用小语言模型 (SLM) 在嵌入式设备上执行 AI 工作负载的兴趣愈发高涨。
    的头像 发表于 01-20 09:53 958次阅读

    国产固态继电器如何满足联网应用的需求

    联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为
    的头像 发表于 01-03 15:57 1156次阅读