0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

花茶晶晶 来源:电子发烧友 作者:黄晶晶 2024-04-16 09:10 次阅读

电子发烧友网报道(文/黄晶晶)在嵌入式领域,边缘与端侧AI推理需求不断增长,Arm既有Helium 技术使 CPU 能够执行更多计算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器,以满足更高性能和更复杂的 AI 工作负载。Ethos-U NPU系列是业界首款 AI 微加速器,英飞凌、恩智浦半导体、奇景光电 (Himax)、Alif Semiconductor 和 Synaptics 等领先企业均已推出搭载 Ethos-U 的量产芯片。最近,Arm发布Arm Ethos-U85 AI加速器,这款加速器在性能、算力、应用场景方面进一步拓展,着眼于未来几年的边缘AI的应用所需。

全新Arm Ethos-U85 AI加速器

与上一代产品相比,Ethos-U85 性能提升四倍,能效提高 20%,它支持MAC 单元从 128 个扩展到 2048 个(在 1GHz 时,算力实现 4 TOPs)。Ethos-U85 提供了相同的一致工具链,实现无缝的开发者体验。全新 Ethos-U85 NPU 支持TensorFlow Lite 和 PyTorch 等 AI 框架。Ethos-U85可满足于智能家居、零售、工业等新兴的边缘 AI 场景对更高性能计算的需求。

wKgZomYclwuAXCUGAAKIwINsqQs457.png
图:Arm Ethos-U85 提供卓越的神经网络加速功能


Ethos-U85支持Transformer 架构和卷积神经网络 (CNN) 以实现 AI 推理。Arm 物联网事业部业务拓展副总裁马健Chloe Ma分析,Ethos-U85 不仅仅提供卷积神经网络 (CNN) 所需的权重矩阵乘的运算,还支持矩阵相乘,这是 Transformer 架构网络的一个基本组成部分。Ethos-U85 增加对Transformer 架构网络的支持,这是优化大模型边缘落地微调时间、提升模型泛化的一个关键特性。

马健表示:“基于 Transformer 的模型具有优异的泛化功能,它将更快地驱动新 AI 应用的发展。Transformer 在视觉和生成式 AI 用例中,比如视频理解、图文结合,图像增强与生成、图像分类和目标检测等方面都极有价值。Transformer 架构网络的注意力机制容易利用并行计算来实现,提高硬件使用效率,使得这些模型能够部署在计算资源有限的边缘设备上。开发者可以通过选用针对 Transformer 架构网络优化的设计,发掘边缘 AI 的新机遇,使这些应用享有更快的推理、更优化的模型性能和可扩展性。”

Ethos-U85 不仅支持低功耗MCU的AI加速。在高性能边缘计算系统中,Ethos-U85与Armv9 Cortex-A CPU相结合,为基于应用处理器智能物联网平台上运行的AI任务实现加速。这将使 Ethos-U85 能够在工业机器视觉、边缘网关、可穿戴设备和消费类机器人等应用中,带来高效能的边缘推理。

全新Arm Corstone-320智能物联网参考设计平台

Corstone-320 包含了 Cortex-M 系列最高性能的嵌入式处理器 Cortex-M85,Ethos-U85 NPU AI 加速器以及Arm Mali-C55 ISP等,以实现为视觉应用优化的低功耗系统。与此前推出的Arm物联网参考设计一致,Corstone-320 不仅仅提供芯片计算子系统 IP 组合,还附带了软件、AI 模型库和开发工具,以实现软件的复用,同时也利用了 Arm 强大的生态系统。它还附带了仿真 Corstone-320 完整系统的 Arm 虚拟硬件,以及单独的 CPU 和 NPU 的固定虚拟平台 (FVP) 模型,以简化开发并加速产品设计,支持软硬件并行协同开发。这种提供边缘 AI 和智能物联网计算子系统全套软硬件和工具链的方法,使得合作伙伴能够在一系列性能点上快速开发,并聚焦于打造差异化价值。

wKgZomYclyuAcbh3AAE7eIyZSLw925.png
图:Arm 助力加速边缘 AI 设备部署进程


马健介绍,全新的参考设计是针对实际工作负载开发的,参考用例包括部署在智能家居中的电池供电摄像系统,以及在工业和零售系统中的低帧率网络摄像头。同时,Corstone-320 参考设计提供了有安全保证的软硬件组合,使得在此参考设计基础上开发的合作伙伴们能够顺利地通过 PSA Certified Level 2 认证,实现对区域和全球安全标准的合规。总之,通过 Corstone-320 预先集成、预先验证的参考设计模版,Arm 能帮助合作伙伴减少边缘智能芯片开发的成本和时间。

基于 Arm 平台的 AI 软件生态系统

“只有 Arm 计算平台才能提供 AI 从云到端、现代敏捷开发和部署流程中所需的特性和功能,实现基于量产验证的一致架构,并采用统一工具链完成AI 转型。”马健说道。实际上,一致性的工具链和平台对于开发者而言非常重要,尤其是面对物联网碎片化,加上AI功能引入的复杂性,如果缺少一个良好的生态、工具支持,将耗费开发者大量的开发时间。

随着边缘 AI 的持续扩展,简单易用才更适于普及推广,因此物联网生态链上下游的芯片与系统供应商、算法软件开发者与集成商们汇聚在Arm计算平台。目前,包括开发者、数据科学家、学术界在内的 AI 研究开发社区,不仅持续受益于 Arm 生态系统与合作伙伴提供的丰富信息与知识,也围绕 Arm 计算平台构建日益增长的软件和工具生态系统,以及开源软件库和 AI 框架,以更简化的开发流程,扩展边缘 AI 的部署。

wKgZomYclzqAGsH9AAFhwlxkXtU102.png
图:基于 Arm 平台的 AI 软件生态系统

马健举例说:“大家熟知的 PyTorch 开源 ML 框架,广泛用于构建和训练神经网络模型,而我们也很高兴看到 PyTorch 基金会投资边缘 AI,发布针对移动和边缘设备推理工具包 ExecuTorch,提供了轻量级运行时 (Runtime) 和算子注册表,覆盖了PyTorch生态系统中的各类模型。此外,由于 Arm 特有的 IP 授权许可模式和开放生态,OEM 和 ODM 可以有多种基于 Arm 架构和计算平台的芯片与模组选择,更灵活地开发适于最终应用的系统方案。”

小结:

随着边缘 AI 的持续发展,Arm 始终处于推动市场和技术进步的核心地位,从 Cortex-M 嵌入式处理器的 Helium 矢量增强指令集,到 Cortex-A 应用处理器的 SVE、SVE2、SME 对矢量和矩阵运算的优化,再到 Ethos-U AI 加速器,Arm 不断丰富产品线并拉高性能。

马健表示,Arm 不会止步于此。随着大模型持续通过量化、剪枝和聚类技术来缩减优化模型,使大模型适于在边缘和超级终端设备部署,Arm认为大小模型云边端结合成为未来 AI 产品的重要发展趋势,也是 AI 应用赋能行业发展的重要方向。而 Arm 已经为此做好准备,来挑战物联网与大模型、多模态 AI 结合的性能与效率极限。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8653

    浏览量

    361854
  • AI
    AI
    +关注

    关注

    87

    文章

    26472

    浏览量

    264106
  • AI加速器
    +关注

    关注

    1

    文章

    62

    浏览量

    8556
收藏 人收藏

    评论

    相关推荐

    Arm平台赋能移动端生成AI

    生成式人工智能 (Generative AI) 涵盖了当下广为人知,且备受关注的大语言模型 (LLM),如今也已落地边缘侧的移动设备。
    的头像 发表于 04-26 11:09 312次阅读

    Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

    Arm发布的新一代Ethos-U AI加速器确实在业界引起了广泛关注。
    的头像 发表于 04-18 15:59 295次阅读

    Arm推第三代边缘AI加速器Arm Ethos-U85

    除了Ethos-U85之外,Arm还推出了全新的物联网参考设计平台Corstone-320。该平台将Arm最高性能的Cortex-M
    发表于 04-16 11:09 112次阅读
    <b class='flag-5'>Arm</b>推第三代<b class='flag-5'>边缘</b><b class='flag-5'>AI</b><b class='flag-5'>加速器</b>:<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>

    Arm发布第三代NPU,适用于工业自动化等场景,性能提升四倍

    Ethos-U85 在能源效率上相比前作提高了 20%,且可兼容常用神经网络以达 85% 的利用率。其设计适配基于 Arm Cortex-M / A 处理器内核的系统,对内存延迟有较强适应性。
    的头像 发表于 04-12 16:13 459次阅读

    Arm Ethos-U85:满足物联网面向AI时代的高性能需求

    随着人工智能 (AI) 不断对我们的日常生活产生越来越大的影响,其推理任务也逐渐从云端迁移到边缘侧和端侧。
    的头像 发表于 04-09 17:04 473次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>:满足物联网面向<b class='flag-5'>AI</b>时代的高<b class='flag-5'>性能</b>需求

    Arm推出新一代Ethos-U AI加速器全新物联网参考设计平台

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)今日宣布推出 Arm Ethos-U85 神经网络处理器 (NPU),是
    的头像 发表于 04-09 17:02 532次阅读
    <b class='flag-5'>Arm</b>推出新一代<b class='flag-5'>Ethos</b>-U <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>及<b class='flag-5'>全新</b>物联网参考设计平台

    安谋科技赵永超:生成AI加速落地,行业应用创新从“芯”突破

    AI的发展机遇,以及企业要如何面对生成AI落地难题。   随着ChatGPT等生成AI
    的头像 发表于 12-26 14:32 700次阅读
    安谋科技赵永超:<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b><b class='flag-5'>加速</b><b class='flag-5'>落地</b>,行业应用创新从“芯”突破

    PCIe在AI加速器中的作用

    从线上购物时的“猜你喜欢”、到高等级自动驾驶汽车上的实时交通信息接收,再到在线视频游戏,所有的这些都离不开人工智能(AI加速器AI加速器是一种高
    的头像 发表于 11-18 10:36 1242次阅读
    PCIe在<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>中的作用

    AI加速器架构设计与实现》+第2章的阅读概括

    首先感谢电子发烧友论坛提供的书籍和阅读评测的机会。 拿到书,先看一下封面介绍。这本书的中文名是《AI加速器架构设计与实现》,英文名是Accelerator Based on CNN Design
    发表于 09-17 16:39

    AI加速器架构设计与实现》+学习和一些思考

    AI加速器设计的学习和一些思考 致谢 首先感谢电子发烧友论坛提供的书籍 然后为该书打个广告吧,32K的幅面,非常小巧方便,全彩印刷,质量精良,很有质感。 前言 设计神经网络首先要考虑的几个问题
    发表于 09-16 11:11

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    平台通过软硬件深度协同,较经典方案提升超 8 成性能支持运行 170 余个主流 AI 模型,推动 RISC-V 进入高
    发表于 08-26 14:14

    Arm Ethos-U NPU处理入门指南

    感谢您使用Arm Ethos-U NPU处理系列。为您提供最好的使用Arm Ethos-U NPU开发机器学习(ML)应用程序的经验设计我
    发表于 08-08 06:17

    Arm Ethos-U NPU应用程序开发概述

    到嵌入系统中,并使用两个Arm连接到嵌入或外部存储AMBA 5 AXI接口,M0和M1。 •为了优化Ethos-U NPU的
    发表于 08-02 06:37

    【书籍评测活动NO.18】 AI加速器架构设计与实现

    经验总结图解NPU算法、架构与实现,从零设计产品级加速器当前,ChatGPT和自动驾驶等技术正在为人类社会带来巨大的生产力变革,其中基于深度学习和增强学习的AI计算扮演着至关重要的角色。新的计算范式需要
    发表于 07-28 10:50

    AI边缘计算盒子是如何推动边缘AI应用落地

    AI边缘计算盒子(AI Edge Computing Box)是一种集成了边缘计算和AI算法处理能力的设备,可以用于
    的头像 发表于 05-26 14:08 702次阅读