0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MIT韩松团队开发全新微型深度学习技术MCUNet

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2020-12-04 14:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

MCUNet能够把深度学习单片机上做到 ImageNet 70% 以上的准确率,我们的研究表明,在物联网设备上在线进行小资源机器学习的时代正在到来。”

近日,MIT 电子工程和计算机科学系助理教授韩松告诉 DeepTech,他所带领的团队解决了此前由于单片机硬件资源的限制无法在物联网设备上的进行微型机器学习的难题。

今年 7 月,韩松团队发表的论文 “MCUNet: Tiny Deep Learning on IoT Devices” 中提出了 MCUNet 方案,可以通过高效的网络架构搜索(TinyNAS)和轻量推理引擎(TinyEngine)的联合设计,实现在 MCU(Microcontroller Unit 微控制单元,又称单片机)上运行 ImageNet 级别的推理。该论文第一作者林己在接受 DeepTech 采访时表示,“我们发现,用我们的 MCUNet 方案,基本上相对轻量级的应用,在手机上跑得比较快的应用,都可以部署到单片机上。”

该论文显示,相比谷歌的 TF-Lite Micro 与 ARM 的 CMSIS-NN 的传统方案,使用 MCUNet 进行学习推理所需要的内存可以减少为原来的 29%,同时推理速度能够提升 1.7-3.3 倍。

据了解,上述论文已入选今年的 AI 顶会 NeurIPS Spotlight,将在 12 月初进行线上分享探讨活动。

更让人兴奋的是,NeurIPS 举行前夕,林己告诉 DeepTech,论文发表后,团队对 MCUNet 方案进行了再度优化,实现了运行使用内存缩减的同时推理速度的再提升。

DeepTech 了解到,目前,MCUNet 技术已与三家公司达成合作,同时更多公司表达了合作意向。

目前该技术大多用于语音或者视觉的关键词检测。语音检测如大家熟悉的 Siri 以及 OK Google 之类;在视觉关键词检测方面,林己举例说,比如人物识别应用中,可以先使用基于 MCUNet 方案低功耗、低成本的硬件检测摄像头前是否有人,检测结果显示有人之后,再去开启强大的、能耗高的下一级 AI 系统。如此一来,可以实现整个设备在能耗较低的待机状态下随时准备激活的效果,降低成本的同时,保持系统的高效工作。

MCUNet 实现 IoT 设备上的微型机器学习

一直以来,深度学习在 IoT 微型设备上的运行难点在于,单片机的硬件资源限制。因为单片机的内存资源仅为手机、GPU 的几千分之一,这导致原本在手机和 GPU 上能够完美运行的 AI 方案,根本无法放入单片机中(模型大小过大),运行就更是别想(activation过大)。先前的模型压缩、网络设计相关工作,主要是优化减小神经网络的计算量或者模型大小,没有考虑到运行时神经网络的 activation 大小,这导致优化过的神经网络也难以满足单片机的资源限制。

对此,韩松团队开发的 MCUNet 方案,采用 TinyNAS 和 TinyEngine 结合的方式,能够合理规划单片机上仅有的内存,并进行高效的推理运算。

其中,TinyNAS 需要通过两个步骤完成对单片机有限的空间进行合理规划,以达到提升最终模型精确度的目的。

第一步,自动搜索神经网络空间来适配不同硬件的资源限制,找到可以满足硬件资源限制的最高精度的搜索空间;第二步,根据不同搜索空间中神经网络计算量的分布,选择特定单片机的自由搜索空间进行网络架构的搜索。

搜索空间时,需要输入分辨率和网络宽度进行搜索。大概有 108 个可能的搜索空间配置,每个搜索空间配置包含 3.3×1025个子网络。

韩松团队认为,在内存约束下更有可能生成高 FLOPS 模型的设计空间可以提供更高的模型容量,因此有可能实现高精度。对比红色和黑色,使用红色空间进行神经体系结构搜索可达到 78.7% 的最终精度,而黑色空间则为 74.2%(在 ImageNet 100 上)。

图 | TinyNAS 通过分析不同搜索空间的 FLOP CDF 来选择最佳搜索空间

经过 TinyNAS 的优化,确保单片机在硬件资源最佳分配的状态下使用 TinyEngine 展开推理运算。

在推理运算方面,传统的机器学习方案 TF-Lite Micro 与 CMSIS-NN 采用的是基于解释器的运行框架。在推理运行的同时进行网络结构的解释,所以需要将神经网络操作中所有可能用到的算子以及支持所有上级的代码全部储存,这必须要有足够大的内存才能够承载。另外,解释型框架是在运行期间对神经网络的结构进行解释,这一动作也将增加运行的负担。

这种 “甜蜜的负担” 对于 “身强力壮的巨人” 手机和 GPU 等内存足够大的设备并无大碍,但对于单片机这种自身条件有限的 “小家伙” 来说,简直寸步难行,甚至有将其压垮的架势。

由此,韩松团队为 “小家伙” 量身定制了新的方案 ——MCUNet,林己向 DeepTech 介绍称,MCUNet 使用 TinyEngine 框架,将神经网络的编译和执行步骤分开进行。编译阶段明确决定好内存的调度、执行过程中的必备动作以及所需算子,在执行过程中,微型处理器上只需要对当前神经网络所执行的任务需要的算子进行储存,内存调度上也无需进行动态处理。做到节省解释时间的同时,也让内存资源本就紧张的单片机能够 “松一口气”,让更大模型神经网络的运行看到一丝希望。

实验结果显示,使用 TinyEngine 运行之下的推理,与传统框架 TF-Lite Micro 对比,推理速度提升了 3 倍,内存占用缩减为1/4,在 ImageNet 上的准确率则提高了 17%。

图 | TinyEngine 与传统框架推理效率、内存占用峰值、精确度对比

值得注意的是,在该论文发表之后,韩松团队又加入了 in-place depthwise convolution 技术,结合 TinyNAS 可以进一步缩小神经网络运行时的最大内存,同时降低神经网络运行的硬件需求,实现 MCUNet 方案推理运算下效率和准确率的进一步提升。另外,林己还提到,“现在我们还加入了目标检测相关的应用,比如可以用来检测人、车以及人有没有戴口罩等,而此前主要关注分类方面的应用”。

MCUNet 诞生于新冠疫情期间

“整体研发尤其后期,是在疫情下进行的,同学们都是在隔离的条件下独立完成研发,团队通过远程进行交流,其实做得很辛苦。”

谈及 MCUNet 的研发过程,韩松表示他印象最深刻的是疫情期间团队成员在无法面对面交流的情况下进行研发,挑战很大。

前文提到,提出 MCUNet 方案的论文已入选今年的 NeurIPS spotlight。其实,除此之外,韩松团队今年入选 NeurIPS 的还有另外两篇,分别为《TinyTL:降低内存占用而非参数量用于高效的设备上学习》和《可微分数据增强:训练数据高效的生成对抗网络》。在此不对另外两篇论文进行展开,简单了解下该团队中 MCUNet 研发的主要成员。

带队老师韩松,为麻省理工电子工程和计算机科学系助理教授,在斯坦福大学获得博士学位,研究重点为高效的深度学习计算。他曾提出的深度压缩技术可以在不损失神经网络精度的前提下大幅缩小网络的模型参数,并且在硬件实现的高效推理引擎中首次探索了模型剪枝和参数稀疏化在深度学习加速器中的应用。曾获 ICLR' 16 和 FPGA' 17 最佳论文奖等奖项,也因其在 “深度压缩” 技术上的贡献,于 2019 年被《麻省理工科技评论》评为全球 “35 岁以下的 35 名杰出创新者”。

MCUNet 论文第一作者林己,现为 MIT HAN Lab 在读博士生,研究方向是高效率的深度学习算法和系统,除 MCUNet,他还曾开发全自动的深度模型压缩和加速方法(AMC)。

参与 MCUNet 研究的还有陈威铭,为台湾大学博士、MIT HAN Lab 准博后,研究方向主要包括微型化机器学习,MCUNet 方案中,陈威铭设计了适合微型控制器(Microcontroller)上运行的深度学习模型引擎(TinyEngine)。

原文标题:MIT韩松团队开发全新微型深度学习技术MCUNet,实现ImageNet超70%准确率,可在物联网设备高效运行

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • mcu
    mcu
    +关注

    关注

    147

    文章

    18635

    浏览量

    387623
  • 计算机
    +关注

    关注

    19

    文章

    7765

    浏览量

    92695
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:MIT韩松团队开发全新微型深度学习技术MCUNet,实现ImageNet超70%准确率,可在物联网设备高效运行

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    (第10系列)、YOLOv8-Tiny工业优化版(第9系列),满足产线端设备算力限制,模型推理速度提升300%。 LabVIEW生态整合 作为工业自动化领域主流开发环境,LabVIEW与深度学习的集成
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    讲师,使用LabVIEW开发了大量视觉检测、运动控制、数据采集方面软件,具有丰富的非标自动化设备经验。精通LabVIEW、Halcon、深度学习算法部署,擅长将复杂技术转化为实战课程。
    发表于 12-03 13:50

    Bourns发布全新增量式微型编码器

    Bourns 推出 PEC04 系列 4 mm 增量式微型编码器、PEC05 PEC05 系列 5 mm 增量式微型编码器,以及 PEC06 型号 6 mm 增量式微型编码器。Bourns
    的头像 发表于 09-22 16:05 945次阅读

    如何在机器视觉中部署深度学习神经网络

    人士而言往往难以理解,人们也常常误以为需要扎实的编程技能才能真正掌握并合理使用这项技术。事实上,这种印象忽视了该技术为机器视觉(乃至生产自动化)带来的潜力,因为深度学习并非只属于计算机
    的头像 发表于 09-10 17:38 705次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b>神经网络

    NVIDIA助力Axio团队打造全新DPU数据面开发框架

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领域的创新突破。
    的头像 发表于 08-30 15:58 1155次阅读

    深度学习对工业物联网有哪些帮助

    深度学习作为人工智能的核心分支,通过模拟人脑神经网络的层级结构,能够自动从海量工业数据中提取复杂特征,为工业物联网(IIoT)提供了从数据感知到智能决策的全链路升级能力。以下从技术赋能、场景突破
    的头像 发表于 08-20 14:56 769次阅读

    自动驾驶中Transformer大模型会取代深度学习吗?

    持续讨论。特别是在自动驾驶领域,部分厂商开始尝试将多模态大模型(MLLM)引入到感知、规划与决策系统,引发了“传统深度学习是否已过时”的激烈争论。然而,从技术原理、算力成本、安全需求与实际落地路径等维度来看,Transforme
    的头像 发表于 08-13 09:15 3929次阅读
    自动驾驶中Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    华为全新升级AI辅助开发能力

    人工智能正深度融入各行各业,软件开发也正站在工作范式变革的前沿阵地。AI各项技术的突破性进展,正以前所未有的深度和广度重塑软件开发的每一个环
    的头像 发表于 07-09 16:46 1304次阅读
    华为<b class='flag-5'>全新</b>升级AI辅助<b class='flag-5'>开发</b>能力

    RIGOL示波器助力MIT开发氢燃料电池摩托车

    在清洁能源和可持续交通的浪潮中,氢燃料电池技术正逐渐成为未来交通的重要发展方向。麻省理工学院(MIT)的一支研究团队在这一领域取得了突破性进展,他们成功开发出一款氢燃料电池摩托车。在这
    的头像 发表于 03-26 14:04 515次阅读
    RIGOL示波器助力<b class='flag-5'>MIT</b><b class='flag-5'>开发</b>氢燃料电池摩托车

    可智能深度学习的AI摄像机模组方案

    、方案优势 500/800万像素CMOS传感器。 专业级海思Hi3519DV500、 Hi3403/3402、星宸SSC338G。 可内嵌智能深度学习人脸算法,机动车识别、车牌识别、非机动车识别算法
    发表于 03-21 11:28

    灵汐科技开源类脑深度学习应用开发平台BIDL

    富案例等问题,一直制约着其广泛应用。为了突破这一瓶颈,灵汐科技联合脑启社区正式宣布开源类脑深度学习应用开发平台BIDL(Brain-inspired Deep Learning)。
    的头像 发表于 03-05 09:13 1495次阅读
    灵汐科技开源类脑<b class='flag-5'>深度</b><b class='flag-5'>学习</b>应用<b class='flag-5'>开发</b>平台BIDL

    军事应用中深度学习的挑战与机遇

    人工智能尤其是深度学习技术的最新进展,加速了不同应用领域的创新与发展。深度学习技术的发展深刻影响
    的头像 发表于 02-14 11:15 828次阅读

    E Ink元太科技与MIT Solve合作推动创新技术

    Ink元太科技将设立“E Ink创新奖”,在未来三年内提供总计高达30万美元(每年最高10万美元)的奖励基金。这一举措旨在支持和鼓励那些致力于解决全球关键问题的创新团队,推动他们在技术研发和应用上取得更大突破。 E Ink元太科技表示,此次与
    的头像 发表于 02-13 10:19 680次阅读

    BP神经网络与深度学习的关系

    BP神经网络与深度学习之间存在着密切的关系,以下是对它们之间关系的介绍: 一、BP神经网络的基本概念 BP神经网络,即反向传播神经网络(Backpropagation Neural Network
    的头像 发表于 02-12 15:15 1362次阅读

    海光信息技术团队完成模型与DCU国产化适配

    正式上线运行。 这一成果标志着海光信息技术团队在推动国产化深度计算技术方面取得了重要突破。DeepSeek V3和R1模型作为先进的深度学习
    的头像 发表于 02-06 11:37 1762次阅读