0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

工程组寻求将 1mW 人工智能推向边缘

颜立歆 来源:创客 作者:创客 2022-07-21 17:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

TinyML 小组最近召开成立大会时,成员必须解决一些基本问题,首先是:什么是 TinyML?

TinyML 是一个工程师社区,专注于如何在超低功耗系统中最好地实施机器学习 (ML)。他们的第一次每月会议致力于定义问题。机器学习是否可以用于微控制器等低功耗设备?是否需要专业的超低功耗机器学习处理器

Qualcomm AI Research 的 Evgeni Gousev 将 TinyML 定义为消耗 1mW 或以下的机器学习 (ML) 方法。Gousev 表示,1mW 是智能手机中永远在线应用的“神奇数字”。

“有很多关于云 ML 的讨论,而智能手机级别的 ML 变得越来越复杂,”他说。“但如果你查看数据,90% 的数据都在现实世界中。您如何连接所有这些相机、IMU 和其他传感器并在该级别进行 ML?”

“微型机器学习将变得庞大,迫切需要推动微型机器学习的整个生态系统,包括应用程序、软件、工具、算法、硬件、ASIC、设备、晶圆厂和其他一切,”Gousev 说.

poYBAGLXVcyABy2ZAAhnB_GyUAU57.jpeg

谷歌工程师 Nat Jefferies 出席首届 TinyML 聚会(图片:TinyML)

TensorFlow 精简版

谷歌工程师 Daniel Situnayake 介绍了 TensorFlow Lite 的概述,这是谷歌 TensorFlow 框架的一个版本,专为包括微控制器在内的边缘设备而设计。

“TensorFlow Lite 一直以手机为目标,但我们很高兴能在更小的设备上运行它,”他说。

在 TensorFlow 中构建模型后,工程师可以通过 Tensor Flow Lite 转换器运行它,该转换器“使其更小并执行量化之类的操作,这使您可以将模型的大小和精度降低到合适的比例在你的目标设备上,”他说。

Situnayake 描述了一种可用于提高电源效率的技术,该技术涉及将模型链接在一起。

“想象一个分类器的级联模型,其中你有一个非常低功率的模型,几乎不使用任何功率来检测是否有声音发生,然后另一个模型需要更多的能量来运行,它会判断它是否是人类语音,”他解释道。“然后,只有在满足这些条件时才会唤醒一个更深层次的网络,它会使用更多的电力和资源。通过将这些链接在一起,您只需在需要时唤醒[能源密集型],因此您可以大大节省能源效率。”

Nat Jefferies 是 Google 的“微控制器 TensorFlow Lite”团队的工程师,他描述了现代消费电子产品对能源消耗的严格要求的趋势,尽管具有复杂的功能和复杂的传感器系统。这些小工具可能使用需要持续数月或数年的电池运行,或者使用能量收集。

“我们认为最好的解决方案是 Tiny ML——在微控制器上进行深度学习,”他说。“这使我们能够进行 CPU 周期和传感器读取,这 [不消耗太多功率],而不是将所有信息发送到芯片外...... TinyML 可用于将传感器数据压缩成几个字节,你然后可以发送……只需一小部分功率,”他说。

Jefferies 说,最近在谷歌挑战中,参赛者开发了 250kbyte 的模型来进行人员检测,收到了许多令人印象深刻的提交,并“验证了我们所做的事情是有意义的”。

“目前,我们能够将 TensorFlow 模型缩小到可以将它们安装在微控制器上的程度,这就是为什么现在是进入这一领域的绝佳时机,”他说。“我们很高兴能够启动这个过程。”

谷歌在微控制器上的 TensorFlow Lite 路线图包括开源谷歌的一些演示、与芯片供应商合作优化内核、优化 TensorFlow Lite 的内存使用以在相同的设备上运行更复杂的模型,以及支持更多的开发平台(SparkFun Edge 是唯一的到目前为止支持的板,但 Arduino 和 Mbed 板支持即将推出)。

专业设备
为机器学习提供专业低功耗应用处理器案例的是 GreenWaves Technologies 业务开发副总裁 Martin Croome。Croome 同意业界关于如何进行超低功耗机器学习的讨论迟到了。

“我们迫切需要更多地关注这一领域,无论是从算法的角度还是从我们的[硬件]世界,”他说。

GreenWaves 开发了一款 RISC-V 应用处理器 GAP8,该处理器专注于边缘设备的推理,功耗为毫瓦,并提供超低待机电流。该公司的目标是电池供电的设备以及使用能量收集的设备(在我们之前的文章中了解有关 GreenWaves 芯片如何工作的更多信息)。

多种技术用于降低功耗。这包括并行化,但不是为了加快速度;使用 8 个内核以允许较慢的时钟速度,这允许内核电压下降,从而节省能源(实际上,时钟频率是动态调整的,取决于工作负载)。

该芯片面向卷积神经网络 (CNN),硬件加速器在单个时钟周期内对 16 位数据执行 5×5 卷积(不包括回写)。显式内存管理依赖于广泛用于图像处理的 CNN 的性质;图像传感器是固定大小的,推理需要相同数量的权重,结果总是相同的大小。因此,一个工具可以在编译时为所有数据移动生成代码。

Croome 承认,足够专业化以有效处理 ML 工作负载,同时保持足够的灵活性以响应技术进步是一个棘手的平衡。

人工智能的范围正在以令人难以置信的速度向前发展。今天关于如何做事的好主意可能不是明天的好主意,”克鲁姆说。“如果我们过于专业化,我们将非常擅长加速每个人去年所做的事情,这对公司不利。因此,我们试图平衡灵活性、可编程性和加速之间的差异。”

克鲁姆说,GreenWaves 的芯片已经打样一年,将于本月开始生产,并将在第三季度末向客户批量发货。

TinyML 聚会于每个月的最后一个星期四在湾区举行,向来自工业界和学术界的与会者开放。


审核编辑 黄昊宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18698

    浏览量

    186277
  • 人工智能
    +关注

    关注

    1819

    文章

    50298

    浏览量

    266844
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    1MW光伏项目“四可”装置数据采集类设备具体配置详解

    1MW工商业分布式光伏项目多采用串式逆变器方案,适配厂房屋顶、园区空地等场景,其“四可”(可观、可测、可调、可控)能力的落地,核心依赖数据采集类设备构建全链路感知体系。此类设备需满足GB/T
    的头像 发表于 03-23 13:58 747次阅读
    <b class='flag-5'>1MW</b>光伏项目“四可”装置数据采集类设备具体配置详解

    AI驱动的“电能柔性接口”:固态变压器在1MW级算力机架的应用

    AI驱动的“电能柔性接口”:固态变压器在1MW级算力机架的应用与SiC核心组件技术解析 行业观察:2026年超大规模数据中心与1MW机架的全面崛起 进入2026年,全球数字基础设施正式跨入了一个以
    的头像 发表于 03-10 07:39 492次阅读
    AI驱动的“电能柔性接口”:固态变压器在<b class='flag-5'>1MW</b>级算力机架的应用

    天合光联合Energy Aware助力澳洲耐克1MW屋顶光伏项目成功并网发电

    近日,天合光能联合Energy Aware,在澳大利亚打造的耐克1MW屋顶光伏项目成功并网发电。项目打破传统屋顶光伏“功能优先、形态单一”的固有模式,组件整体排布成耐克标志性的Swoosh“对勾
    的头像 发表于 03-02 15:18 493次阅读

    浅谈人工智能(2)

    接前文《浅谈人工智能1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能
    的头像 发表于 02-22 08:24 330次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    应用案例 | Enclustra 水星Mercury+ XU1核心板边缘人工智能送入卫星轨道

    KlepsydraTechnologies致力于实现卫星搭载的高效人工智能推理功能——例如支持基于图像的实时地理定位。Klepsydra与Enclustra合作,人工智能框架与紧凑型FPGA硬件
    的头像 发表于 12-12 08:33 674次阅读
    应用案例 | Enclustra 水星Mercury+ XU<b class='flag-5'>1</b>核心板<b class='flag-5'>将</b><b class='flag-5'>边缘人工智能</b>送入卫星轨道

    边缘计算和人工智能,别再傻傻分不清啦!

    这几年,只要聊到“智能制造”“智慧城市”“自动化工厂”, 边缘计算 和**人工智能(AI)**这两个词就总是成双成对地出现。 但你是不是也有点懵:到底谁在算?谁在“聪明”?它们又是什么关系? 别急
    的头像 发表于 11-19 15:46 534次阅读

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    AI 边缘计算网关:开启智能新时代的钥匙​—龙兴物联

    顺畅地通向云端,实现设备与云端之间高效的数据传输与交互。通过融合先进的边缘计算和人工智能技术,AI 边缘计算网关能够在靠近数据源的网络边缘,对数据进行实时处理和精准分析,进而实现
    发表于 08-09 16:40

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们
    发表于 07-31 11:38

    爱立信携手超微加速边缘人工智能部署

    爱立信与超微 Supermicro近日宣布有意开展战略合作,加速边缘人工智能部署。
    的头像 发表于 06-17 09:42 1.6w次阅读

    如何构建边缘人工智能基础设施

    随着人工智能的不断发展,其争议性也越来越大;而在企业和消费者的眼中,人工智能价值显著。如同许多新兴科技一样,目前人工智能的应用主要聚焦于大规模、基础设施密集且高功耗的领域。然而,随着人工智能
    的头像 发表于 06-09 09:48 1191次阅读

    边缘计算如何颠覆人工智能变革

    2025年以来,DeepSeek发布的大模型热度居高不下,再次点燃了全球对人工智能的无限热情。深度学习模型以指数级速度膨胀,性能不断突破极限,成本效益也在向着更低的趋势发展,这为各行各业带来了颠覆性
    的头像 发表于 05-30 09:29 1154次阅读