0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm为Cortex-M添加了神经网络指令 针对物联网网络外部边缘的产品

Q4MP_gh_c472c21 来源:ZYD 2019-02-25 17:04 次阅读

Arm已经在其Cortex-M架构中添加了神经网络处理指令,针对物联网网络外部边缘的产品,例如可以识别少量语音而无需连接到云的设备,例如人声唤醒命令。

“M-Profile Vector Extensions”(MVE)已经在“Helium”品牌下宣布,与该公司的高端Cortex-A内核的Neon SIMD(单指令多数据)扩展非常类似。氦扩展还将处理数字信号处理,提供比现有DSP指令更高的性能,这些指令是为了将Cortex-M3转换为Cortex-M4而创建的。

Arm将Helium描述为“针对M-profile架构量身定制的Neon技术的优化SIMD功能,以及针对新兴用例的新编程功能和数据类型”。

与标准的32位Armv8-M指令一起使用固定长度的128位向量(具有聚集负载和散布存储,低开销循环和预测)和增加的算术支持(固定和浮点,包括半精度和单精度浮点数和8位整数和复杂数学,由150条指令共同覆盖,包括8位向量点积。

同时,支持新指令的硬件包括通过“TrustZone for Armv8-M”扩展和PSA原则的安全功能。

总体而言,从现有的Armv8.1-M指令集架构(ISA)可以看出,与现有的Armv8-M架构(基于int32中的复杂FFT估算)相比,预计性能提升高达5倍,高达15倍机器学习(基于int8中的矩阵乘法)。

Armv8.1-M核心实施选项包括:

省略了氦,带有可选的标量浮点(带或不带双精度支撑)

氦只支持向量整数,带有可选的标量浮点(带或不带双精度支持)

具有向量整数加浮点的氦(支持矢量单精度和半精度),带标量浮点(带或不带双精度支持)

那么指令集指令是否会导致硅足迹大幅增加?

不,根据Arm,特别是在执行氦指令时将重新使用一些现有的v8-M硬件。没有确切的数据发布。

除语音处理外,还可以预见振动分析和视觉应用。

如今,多个供应商的工具链和模型都可以使用。包括Armv8.1-M在内的硅产品有望在两年内上市。

除了矢量处理,Helium亮点还包括:

交织和解交织加载和存储指令(VLD2 / VST2,步长为2,VLD4 / VST4,步长为4)

向量收集载荷和向量散布存储向量寄存器中元素的存储器访问,使用另一个向量寄存器中的元素定义向量中每个元素的地址偏移量。

允许软件处理任意存储器访问模式,并可用于模拟特殊寻址模式,如循环寻址,这些模式通常用于信号处理。

还可以帮助加速各种数据处理任务中数组中数据元素的非顺序访问向量复数值处理支持整数(8,16和32位)和浮点数(32位),例如VCADD,VCMUL,VCMLA指令车道预测位整数支持。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8615

    浏览量

    361311
  • 物联网
    +关注

    关注

    2860

    文章

    41250

    浏览量

    357374
  • Cortex-M
    +关注

    关注

    2

    文章

    221

    浏览量

    29560

原文标题:Arm为Cortex-M添加了神经网络指令

文章出处:【微信号:gh_c472c2199c88,微信公众号:嵌入式微处理器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    请问mbed联网操作系统会成为cortex-m中的android吗?

    mbed 联网操作系统会成为cortex-m中的android吗?
    发表于 01-17 07:14

    ARM Cortex-M处理器对比表

    Cortex-M处理器系列针对低成本、高能效的微控制器进行了优化。 这些处理器可以在各种应用中找到,包括联网、工业和日常消费设备。 该处理器系列基于
    发表于 08-29 07:00

    基于Keras在NuMicro M480系列微控制器上实施汽车牌照识别

    识别。 Armé Cortex- M4核心支持 DSP 指令以加速算法。 信息可以传送到边缘设备上的 UART 等外围设备 。 您可以在下
    发表于 08-29 06:46

    人工神经网络和bp神经网络的区别

    人工神经网络和bp神经网络的区别  人工神经网络(Artificial Neural Network, ANN)是一种模仿人脑神经元网络结构和功能的计算模型,也被称为
    的头像 发表于 08-22 16:45 3065次阅读

    卷积神经网络和深度神经网络的优缺点 卷积神经网络和深度神经网络的区别

    深度神经网络是一种基于神经网络的机器学习算法,其主要特点是由多层神经元构成,可以根据数据自动调整神经元之间的权重,从而实现对大规模数据进行预测和分类。卷积
    发表于 08-21 17:07 1952次阅读

    卷积神经网络的介绍 什么是卷积神经网络算法

    卷积神经网络的介绍 什么是卷积神经网络算法 卷积神经网络涉及的关键技术 卷积神经网络(Convolutional Neural Network,CNN)是一种用于图像分类、物体识别、语
    的头像 发表于 08-21 16:49 1281次阅读

    卷积神经网络的基本原理 卷积神经网络发展 卷积神经网络三大特点

    卷积神经网络的基本原理 卷积神经网络发展历程 卷积神经网络三大特点  卷积神经网络的基本原理 卷积神经网络(Convolutional Ne
    的头像 发表于 08-21 16:49 1268次阅读

    卷积神经网络概述 卷积神经网络的特点 cnn卷积神经网络的优点

    卷积神经网络概述 卷积神经网络的特点 cnn卷积神经网络的优点  卷积神经网络(Convolutional neural network,CNN)是一种基于深度学习技术的
    的头像 发表于 08-21 16:41 1706次阅读

    卷积神经网络的应用 卷积神经网络通常用来处理什么

    卷积神经网络的应用 卷积神经网络通常用来处理什么 卷积神经网络(Convolutional Neural Network,简称CNN)是一种在神经网络领域内广泛应用的
    的头像 发表于 08-21 16:41 3563次阅读

    卷积神经网络原理:卷积神经网络模型和卷积神经网络算法

    卷积神经网络原理:卷积神经网络模型和卷积神经网络算法 卷积神经网络(Convolutional Neural Network,CNN)是一种基于深度学习的人工
    的头像 发表于 08-17 16:30 837次阅读

    用CMSIS-NN版本转换Arm Cortex-M神经网络:r0p0指南

    2. 概览 本指南向您展示了如何将神经网络从任何框架转换成一个基于 Arm Cortex-M-M 装置的实施工具, 使用 Arm CMSIS- NN 库。 此教程用于不再支持的 CMS
    发表于 08-11 07:06

    如何使用Arm CMSIS-DSP实现经典机器学习库

    的使用CMSIS-DSP开源库中的其他技术。 CMSIS-DSP库是Arm针对各种Arm优化的丰富的DSP函数集合Cortex-M处理器,如Cort
    发表于 08-02 07:12

    什么是神经网络?为什么说神经网络很重要?神经网络如何工作?

    神经网络是一个具有相连节点层的计算模型,其分层结构与大脑中的神经元网络结构相似。神经网络可通过数据进行学习,因此,可训练其识别模式、对数据分类和预测未来事件。
    的头像 发表于 07-26 18:28 1666次阅读
    什么是<b class='flag-5'>神经网络</b>?为什么说<b class='flag-5'>神经网络</b>很重要?<b class='flag-5'>神经网络</b>如何工作?

    神经处理将实时决策带到边缘

    神经网络模型效率的提高和 高速神经网络加速器正在帮助机器学习转向 边缘。恩智浦 i.MX 8M Plus就是一个很好的例子,它是我们EdgeVerse产品组合的新成员。它提供专用机器学
    的头像 发表于 05-25 09:25 309次阅读

    三个最流行神经网络

    在本文中,我们将了解深度神经网络的基础知识和三个最流行神经网络:多层神经网络(MLP),卷积神经网络(CNN)和递归神经网络(RNN)。
    发表于 05-15 14:19 1105次阅读
    三个最流行<b class='flag-5'>神经网络</b>