0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用神经处理单元集群改造边缘人工智能

星星科技指导员 来源:嵌入式计算设计 作者:Saumitra Jagdale 2022-08-16 11:41 次阅读

随着人工智能领域的发展,这些设备的计算量和功耗都在增加。随后,边缘设备上的处理负载随着系统架构的性能和复杂性而显着增长。因此,更高分辨率的图像和更复杂的算法被灌输到系统中,随着对人工智能处理的需求不断增加,需要进一步优化以实现高 TOPS 性能。

Synopsys 发布了神经处理单元 (NPU)、知识产权 (IP) 内核和工具链,以满足 AI 片上系统 (SoC) 中日益复杂的神经网络模型的性能需求。其新的 DesignWare ARC NPX6 和 NPX6FS NPU IP 可处理实时计算的需求,同时为 AI 应用消耗超低功耗。此外,该公司的新 MetaWare MX 开发工具提供了一个完整的编译环境和自动神经网络算法分区,以最大限度地提高最新 NPU 上应用软件开发的资源效率。

使用新的 DesignWare ARC NPX6 和 NPX6FS NPU IP 以及 MetaWare MX 开发工具包,设计人员可以利用最新的神经网络模型,满足不断升级的性能预期,并加快其下一代智能 SoC 的上市时间。ARC NPX6 NPU IP 系列包括众多处理深度学习算法覆盖的产品,包括对象识别、图像质量增强和场景分割等计算机视觉任务,以及音频和自然语言处理等更大的人工智能应用。设计中的单个内核可以从 4K MAC 扩展到 96K MAC,以实现超过 250 TOPS 的单个 AI 引擎性能和超过 440 TOPS 的稀疏性。

NPX6 NPU IP 包含对多达 8 个 NPU 的多 NPU 集群的硬件和软件支持,稀疏度为 3500 TOPS。由于硬件和软件中的高级带宽功能以及内存层次结构(每个内核中包含 L1 内存和访问通用 L2 内存的高性能、低延迟连接),因此可以扩展到大量 MAC 数量。对于受益于神经网络内的 BF16 或 FP16 的应用,提供了一个可选的张量浮点单元。

poYBAGL7EgCAI5Q_AAGJ5AosORk022.png

图片来源:新思科技

MetaWare MX 开发工具包为应用软件开发提供软件编程环境,包括神经网络软件开发工具包 (NN SDK) 和虚拟模型支持。NN SDK 自动将使用 Pytorch、Tensorflow 或 ONNX 等流行框架训练的神经网络转换为 NPX 优化的可执行代码。

其概念是,NPX6 NPU 处理器 IP 可随后用于制造各种产品,从几 TOPS 到数千 TOPS,所有这些都可以使用单个工具链编写。

NPX6 NPU IP 的主要特点:

可扩展的实时 AI/神经处理器 IP,性能高达 3,500 TOPS,支持 CNN、RNN/LSTM、转换器推荐网络和其他神经网络。

电源效率(高达 30 TOPS/W)在业界是无与伦比的。

1-24核卷积加速器,增加4K MAC/核

支持张量算子集架构并允许变量激活 (TOSA) 的张量加速器

软件开发套件

自动混合模式量化工具

降低带宽的架构和软件工具特性

通过并行处理各个层来减少延迟。

DesignWare ARC VPX 矢量 DSP 无缝集成。

生产力很高。MetaWare MX Development Toolkit 支持 Tensorflow 和 Pytorch 框架以及 ONNX 交换标准。

此外,ARC NPX6FS NPU IP 符合 ISO 26262 ASIL D 标准,用于随机硬件故障检测和系统功能安全开发流程。这些处理器具有符合 ISO 26262 的特定安全机制,可处理下一代区域设计的混合关键性和虚拟化需求,以及完整的安全文档。

ARC MetaWare MX 开发工具包包括神经网络软件开发工具包 (SDK)、编译器和调试器、虚拟平台 SDK、运行时和库以及高级仿真模型。它提供了一个统一的工具链环境来加速应用程序开发,并在 MAC 资源之间智能地划分算法以进行优化处理。MetaWare MX 安全开发工具包包含安全手册和安全指南,可帮助开发人员满足 ISO 26262 标准并为安全关键型汽车应用的 ISO 26262 合规性测试做准备。

使用 NPU 集群加速边缘 AI 应用程序

为了满足 AI 应用日益增长的性能和复杂需求,NXP NPU IP 内核提供了高性能、可扩展的实时 AI 和神经处理 IP,高达 3500 TOPS 支持各种神经网络,如 CNN、RNN/LSTM、变压器、和推荐网络。

此外,它通过并行处理各个层来减少延迟。此外,高效的 MetaWare MX 开发工具包支持 Tensorflow 和 Pytorch 框架以及 ONNX 交换格式。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 变压器
    +关注

    关注

    157

    文章

    6898

    浏览量

    130530
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98719
  • AI
    AI
    +关注

    关注

    87

    文章

    26424

    浏览量

    264029
收藏 人收藏

    评论

    相关推荐

    5G智能物联网课程之Aidlux下人工智能开发

    机器人案例.pdf 人工智能 AI泛边缘智能安防实训 31分38秒 https://t.elecfans.com/v/25509.html *附件:泛边缘案例课.pdf
    发表于 04-01 10:40

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能领域布局
    发表于 02-26 10:17

    BrainChip与MYWAI建立合作,助力边缘人工智能解决方案

    双方合作预期会推动边缘人工智能在工业自动化和机器人领域的广泛应用,为广大企业及其用户带来显著经济利益。本次合作的核心在于,针对不同行业如制造业、物流业、能源管理以及医疗卫生等研发出相应的机器人解决方案
    的头像 发表于 01-18 10:08 190次阅读

    意法半导体加快边缘人工智能应用,助力企业产品智能化转型

      点击上方  “ 意法半导体中国” , 关注我们 ‍‍‍‍‍‍‍‍ ✦   ST Edge AI Suite 是意法半导体新推出的整合各种软件和工具的边缘人工智能开发套件,为开发者和企业在工业
    的头像 发表于 12-14 16:15 303次阅读
    意法半导体加快<b class='flag-5'>边缘人工智能</b>应用,助力企业产品<b class='flag-5'>智能</b>化转型

    人工智能大模型、应用场景、应用部署教程超详细资料

    人工智能是IC行业近几年的热词,目前此技术已经有很多成熟的模型和落地案例。在此跟大家做个分享,更多详细资料,请自行搜索:【展锐坦克邦】,坦克邦-智算天地集算法模型、部署说明于一体,为广大客户提供了
    发表于 11-13 14:49

    人工神经网络相关资料

    以冯·诺依曼型计算机为中心的信息处理技术的高速发展,使得计算机在当今的信息化社会中起着十分重要的作用。但是,当用它来解决某些人工智能问题时却遇到了很大的困难。 例如,一个人可以很容易地识别他人的脸孔
    发表于 09-27 06:13

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在
    发表于 09-21 11:09

    《通用人工智能:初心与未来》-试读报告

    、社交、想象力、创造力、感知力,这是无法逻辑和推理去定义和构造的。人工智能路途遥远,远远还不到与人类竞争的程度,而且也不会反生的。与其胡思乱想,不如好好学习发展人工智能,让社会的生产力继续提高,让
    发表于 09-18 10:02

    不可错过!人工神经网络算法、PID算法、Python人工智能学习等资料包分享(附源代码)

    ,是模拟人工智能的一条重要途径。人工神经网络与人脑相似性主要表现在: ①神经网络获取的知识是从外界环境学习得来的; ②各神经元的连接权,即突
    发表于 09-13 16:41

    基于IDE构建用于STM32微处理器的完整人工智能项目

    本用户手册指导了基于 IDE 逐步构建用于 STM32 微处理器的完整人工智能(AI)项目,自动转换预训练好的神经网络(NN)并集成所生成的优化库。本手册还介绍了 X-CUBE-AI 扩展包,该扩展
    发表于 09-07 06:15

    边缘人工智能的前景在哪?机器学习解决方案!

    部署,在边缘设备上轻松实现机器学习。 在边缘计算的背景下,边缘设备仅指在网络边缘运行并采集、处理和分析数据的设备。例如
    的头像 发表于 09-06 12:15 827次阅读
    <b class='flag-5'>边缘人工智能</b>的前景在哪?机器学习解决方案!

    边缘计算属于人工智能吗?

    边缘计算属于人工智能吗?  边缘计算是一种新的技术,它将数据处理和存储从云计算中心转移到网络边缘。它可以提高数据
    的头像 发表于 08-24 15:18 469次阅读

    如何利用视觉处理器在可视门铃和智能零售设计中扩展边缘 AI 功能

    随着“边缘人工智能 (AI)”的兴起,“在网络边缘拥有更高的智能性”也倍受讨论,拥有更高本地实时处理能力的好处就易被忽视,而这种处理无需依赖
    的头像 发表于 07-08 11:21 290次阅读

    【书籍评测活动NO.16】 通用人工智能:初心与未来

    之后的达特茅斯研讨会开始,机器来模仿人类学习及其他方面的智能,即实现“人工智能”(Artificial Intelligence,AI)便成为计算机领域持续的研究热点。时至今日,以深度学习为代表
    发表于 06-21 14:41

    【EASY EAI Nano人工智能开发套件试用体验】EASY EAI Nano人工智能开发套件开箱及硬件初体验

    及接线柱、12V 1A电源等。 EASY EAI Nano人工智能开发板塑料盒和静电袋包装,里面有一根黑色的数据线。 EASY EAI Nano人工智能开发套件包装还是很不错的,
    发表于 05-31 19:18