0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm机器学习处理器助力边缘设备机器学习

pmkA_arm_china 来源:未知 作者:胡薇 2018-06-26 10:57 次阅读

如果能够拥有一部智能个人助理,它能听懂我们说的话并做出智能反应,然后处理日常任务,那感觉一定很棒。鉴于机器学习(ML)领域近期取得的进展,Arm相信这一天很快就会到来。机器学习已经远远越过移动市场的边界,延伸到医疗保健、零售、汽车和服务器等领域,从只能识别猫的图片发展到可以解决现实问题的水平。

现在主要的难点是如何将这种能力转移到边缘,解决如今普遍存在的隐私、安全、带宽和延迟问题,Arm 机器学习处理器朝这个方向迈出了一大步。

移动性能

机器学习处理器是专门为移动和相邻市场(例如智能相机、AR/VR无人机、医疗和消费性电子产品等)推出的全新设计,性能为 4.6 TOP/s,能效为 3 TOPs/W。计算能力和内存的进一步优化大大提高了它们在不同网络中的性能。

其架构包括用于执行卷积层的固定功能引擎以及用于执行非卷积层和实现选定原语和算子的可编程层引擎。网络控制单元管理网络的整体执行和网络的遍历,DMA 负责将数据移入、移出主内存。板载内存可以对重量和特征图进行中央存储,减少流入外部存储器的流量,从而降低功耗。

有了固定功能和可编程引擎,机器学习处理器变得非常强大、高效和灵活,足以应对未来的挑战,不仅保留了原始性能,还具备多功能性,能够有效运行各种神经网络

主要特点

大幅提升 CPUGPUDSP 和加速器效率。

采用开源软件,无锁定。

与现有软件框架紧密集成:TensorFlowTensorFlow Lite、Caffe、Caffe 2。

经优化后适用于Arm Cortex CPU和Arm Mali GPU。

Arm 机器学习处理器架构

为应对多个市场带来的挑战,满足不同的性能需求,从物联网的每秒几 GOP 到服务器的每秒数十 TOP,机器学习处理器采用了全新的可扩展架构。

对于物联网或嵌入式应用,该架构的性能可降低至约每秒 2 GOP,而对于 ADAS、5G 或服务器型应用,性能可提高至每秒 150 TOP。这些多重配置的效率可达到现有解决方案的数倍。

由于与现有的 Arm CPU、GPU 和其他 IP 兼容,且能提供完整的异构系统,该架构还可通过 TensorFlow、TensorFlow Lite、Caffe 和 Caffe 2 等常用的机器学习框架来获取。

随着机器学习的工作负载不断增大,计算需求将呈现出多种形式。Arm 已经开始采用拥有不同性能和效率等级的增强型 CPU 和 GPU,运行多种机器学习用例。我们推出Arm 机器学习平台的目的在于扩大选择范围,提供异构环境,满足每种用例的选择和灵活性需求,开发出边缘智能系统。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18275

    浏览量

    222140
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8651

    浏览量

    361775
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130556

原文标题:助力边缘设备机器学习,Arm机器学习处理器来了!

文章出处:【微信号:arm_china,微信公众号:Arm芯闻】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ARM发布两款针对移动终端的AI芯片架构:物体检测和机器学习处理器

    ARM发布了两款针对移动终端的AI芯片架构,物体检测(Object Detection,简称OD)处理器机器学习(Machine Learning,简称ML)
    的头像 发表于 02-23 11:59 7146次阅读
    <b class='flag-5'>ARM</b>发布两款针对移动终端的AI芯片架构:物体检测和<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>处理器</b>

    超低功耗FPGA解决方案助力机器学习

    IoT应用。通过提供结合了灵活、超低功耗FPGA硬件和软件解决方案、功能全面的机器学习推理技术,Lattice sensAI将加速网络边缘设备上传感
    发表于 05-23 15:31

    Project Trillium-提供业界最具扩展性、应用范围最广的机器学习计算平台

    的同时,也要求保持出色的能效表现。 基于这样的需求,Arm宣布推出全新机器学习平台Project Trillium。 新的设备需要高性能的机器
    发表于 03-07 20:12

    机器学习处理器单元支持浮点的乘加运算

    。  Achronix为了解决这一大困境,创新地设计了机器学习处理器(MLP)单元,不仅支持浮点的乘加运算,还可以支持对多种定浮点数格式进行拆分。
    发表于 11-26 06:42

    高性能的机器学习边缘计算更给力-iMX8M Plus为边缘计算赋能

    、智能零售、智能工厂和智慧城市等应用领域而言是必不可少的。以前,机器学习需要成本昂贵而又复杂的云计算,也就是“基于云的人工智能”。但现在,很多机器学习操作可在网络
    发表于 09-07 13:49

    高性能的机器学习边缘计算更给力-iMX8M Plus为边缘计算赋能

    、智能零售、智能工厂和智慧城市等应用领域而言是必不可少的。以前,机器学习需要成本昂贵而又复杂的云计算,也就是“基于云的人工智能”。但现在,很多机器学习操作可在网络
    发表于 09-07 13:55

    微型机器学习

    人工智能 AI 正在加快速度从云端走向边缘,进入到越来越小的物联网设备中。而这些物联网设备往往体积很小,面临着许多挑战,例如功耗、延时以及精度等问题,传统的机器
    发表于 09-15 09:23

    高性能的机器学习边缘计算更给力-iMX8M Plus为边缘计算赋能

    、智能零售、智能工厂和智慧城市等应用领域而言是必不可少的。以前,机器学习需要成本昂贵而又复杂的云计算,也就是“基于云的人工智能”。但现在,很多机器学习操作可在网络
    发表于 09-24 09:09

    高性能的机器学习边缘计算更给力

    、智能零售、智能工厂和智慧城市等应用领域而言是必不可少的。以前,机器学习需要成本昂贵而又复杂的云计算,也就是“基于云的人工智能”。但现在,很多机器学习操作可在网络
    发表于 10-15 13:58

    为什么需要将机器学习迁移到边缘设备

    专注于边缘计算。第一章:为什么需要将机器学习迁移到边缘设备机器
    发表于 12-20 06:35

    机器人技术和机器学习

    机器人技术和机器学习正成为嵌入式系统硬件和软件供应商的下一个重大事件。嵌入式系统可以通过网络连接和物联网(IoT)来传递信息、共享资源。无论是智能,低能耗,边缘
    发表于 12-20 06:03

    什么是TinyML?微型机器学习

    学习工具包的一个例子. 图片由 Arduino 提供为了达到1兆瓦的目标,我们几乎完全局限于计算能力较差的硬件,如微控制(mcu)和数字信号处理器(dsp)。这些设备通常是基于 C
    发表于 04-12 10:20

    什么是机器学习? 机器学习基础入门

    得它们能够完美地在传感旁边运行机器学习工作负载,而这正是数据收集的地方。对于嵌入式和物联网工程师来说,现在是探索机器学习世界的最佳时机,从
    发表于 06-21 11:06

    创建一个边缘机器学习系统

    本指南适用于系统设计人员,可能使用Arm Flexible access程序。 本指南将帮助您开发可以执行机器学习的片上系统(SoC)在边缘。本指南中介绍的SoC可以
    发表于 08-02 11:02

    如何使用Arm CMSIS-DSP实现经典机器学习

    的使用CMSIS-DSP开源库中的其他技术。 CMSIS-DSP库是Arm针对各种Arm优化的丰富的DSP函数集合Cortex-M处理器,如Cortex-M4、Cortex-M7、Cortex-M33
    发表于 08-02 07:12