0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

并非所有的模拟计算都是平等的

星星科技指导员 来源:嵌入式计算设计 作者:Marcie Weinstein 2022-07-10 11:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着消费、生物医学和 IoT/IIoT 市场中始终监听设备的爆炸式增长,似乎每个人都在尝试使用模拟来节省设计中的功耗。借助使用“模拟内存计算”来降低处理器功率的新型机器学习 (ML) 数字芯片,半导体供应商正在发明新方法来利用模拟计算的固有功率和计算效率。那么,有什么问题呢?事实是,尽管这些芯片利用模拟电路的固有优势来节省芯片内用于神经网络处理的功率,但它们最终是在数字域中对数字数据进行操作的数字处理芯片——这意味着它们只为系统提供有限的节能。幸运的是,模拟ML ) 内核——现在可以在系统级实现更高的功率效率。

虽然模拟内存计算和模拟ML 有时都被标记为“模拟计算”,但它们绝不是一回事。设计人员需要了解模拟内存计算和模拟ML 内核之间的差异,以便他们能够创建更节能的终端设备?

内存模拟计算的芯片级效率

模拟内存计算通常是指在其他数字机器学习处理器的神经网络中使用模拟电路,以便以较低的功率执行乘法累加 (MAC) 功能。但是利用这种方法的芯片仍然是在标准数字处理范式内运行的时钟处理器,需要立即对所有模拟传感器数据进行数字化,无论是否相关。事实上,使用模拟内存计算的芯片实际上需要三个单独的数据转换才能确定数据的重要性。传感器数据立即转换为数字进行初始处理(数字化优先架构),然后将它们转换为芯片内的模拟数据以实现 MAC 功能,最后,它们在芯片内被转换回数字,以进行推理、分类和其他功能所需的额外数字处理。因此,大量的数据转换,但没有太多的实际模拟处理。

虽然模拟内存计算可能会降低单个推理芯片的功率,但它仅以非常有限的方式使用模拟,因此它只能为整个系统提供同样有限的功率降低。

AnalogML 的系统级效率

相比之下,analogML 内核完全在模拟域内运行,不需要时钟,并且在对任何数据进行数字化之前使用原始模拟传感器数据进行推理和分类。集成到始终监听的设备中,analogML 内核在花费任何精力进行单个数据转换之前确定数据的重要性。我们称其为“先分析”,因为analogML 核心保持数字系统关闭,除非检测到相关数据。

与包含模拟内存计算的 ML 芯片相比,analogML 内核处理模拟传感器数据的更简化方法对系统级效率产生重大影响。(见图 1。)

poYBAGLKQeaABv-TAAN5J2XuCvw484.png

图 1:使用具有模拟内存计算的 ML 芯片的数字化优先系统架构(顶部模块)与使用模拟ML 内核的分析优先系统架构(底部模块)的比较

例如,在典型的语音优先系统中,analogML 内核 100% 的时间都处于开启状态,在始终侦听模式下消耗低至 10µA 的电流以确定哪些数据是重要的(分析优先架构),然后再消耗任何功率关于数字化。这会使系统的其余部分保持休眠状态,直到检测到相关数据。与在数字域中 100% 的时间(数字化优先架构)运行并消耗高达 3000-4000µA 的更传统的 ML 芯片相比,使用模拟ML 的分析优先方法可将电池寿命延长多达 10 倍。这就是持续数天而不是数小时的智能耳塞与一次充电即可持续数年而不是数月的声控电视遥控器之间的区别。

AnalogML Core 中有什么?

深入analogML 核心的底层揭示了模拟内存计算(模拟计算仅用于神经网络)与analogML 核心(由多个软件控制的模拟处理块组成,我们可以启用、重新配置)之间的区别,并针对各种分析优先应用程序进行调整。这些模块——可以在需要时独立供电——实现了一系列功能。(见图 2)。

pYYBAGLKQe2ANlTxAAQlRDBIzYQ775.png

图 2:analogML 内核的框图

传感器接口——可以为特定传感器类型(麦克风、加速度计等)合成接口电路

模拟特征提取——从原始的模拟传感器数据中挑选出显着特征,大大减少进入神经网络的数据量

模拟神经网络——高效、小尺寸、可编程模拟推理模块

模拟数据压缩——模拟传感器数据的连续收集和压缩支持低功耗数据缓冲

模拟范式转变

AnalogML 远远超出了在整个 ML 芯片计算的一小部分中使用一点点模拟计算来节省功耗。这是一个完整的模拟前端解决方案,它使用接近零的功率来确定信号链中最早点的数据的重要性——而数据仍然是模拟的——以最大限度地减少通过系统运行的数据量和数字系统 (ADC/MCU/DSP) 开启的时间量。在某些应用中,例如玻璃破碎检测,事件可能每十年发生一次(或从不发生),使用模拟ML 内核使数字系统在 99% 以上的时间内保持关闭可以将电池寿命延长数年。这开辟了新类别的持久远程应用程序,如果所有相关或不相关的数据在处理之前都被数字化,这些应用程序将无法实现。

底线是所有模拟计算都不相等。无论芯片中包含多少模拟处理来降低其功耗,除非该芯片在模拟域中运行,在模拟数据上,它并没有做我们所知道的最能节省系统功耗的一件事——减少数字处理数据。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53534

    浏览量

    459068
  • mcu
    mcu
    +关注

    关注

    147

    文章

    18605

    浏览量

    386997
  • adc
    adc
    +关注

    关注

    100

    文章

    7392

    浏览量

    553786
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深度休眠状态下外部所有的IO都可以唤醒MCU吗?

    深度休眠状态下,外部所有的IO都可以唤醒MCU吗?
    发表于 12-04 06:00

    是不是所有的工厂都适合升级改造成智慧工厂?

    并非所有工厂都适合立刻、全面地进行智慧化升级。 智慧工厂不是目的,而是手段。它更像是一剂“强身健体”的良药,但前提是您的工厂得“对症”。 根据我们实施了大量物联网项目的经验,一个工厂是否适合升级
    的头像 发表于 10-30 16:56 375次阅读

    南大团队实现迄今最高计算精度的模拟存算一体芯片

    电子发烧友网综合报道 在当今计算技术快速发展的背景下,模拟计算作为一种独特的计算范式,正逐渐展现出其独特的魅力与潜力。与传统的数字计算不同,模拟计算
    的头像 发表于 10-19 00:59 5978次阅读
    南大团队实现迄今最高<b class='flag-5'>计算</b>精度的<b class='flag-5'>模拟</b>存算一体芯片

    世界电信日 | 数智绽放平等之花:让技术温暖拥抱她和他

    2025年世界电信和信息社会日以“在数字化转型中实现性别平等”为主题。值此通信人共同节日来临之际,移远通信向所有投身通信技术创新、推动数字包容发展的同仁和各界人士,致以崇高敬意和诚挚祝贺!孩童手中
    的头像 发表于 05-17 09:05 269次阅读
    世界电信日 | 数智绽放<b class='flag-5'>平等</b>之花:让技术温暖拥抱她和他

    电机泥泵轴系系统扭振设计计算

    文章基于研究轴系扭转振动设计电机泥泵轴系系统,介绍了计算轴系自由摄动因有频率的传递矩阵法和计算强迫振动的动力放大系数法,并且深入研究分析机组强迫摄动中的激振力。用FUNET软件模拟计算泥泵叶轮的激振
    发表于 04-24 21:08

    使用VirtualLab Fusion中分布式计算的AR波导测试图像模拟

    计算时间超过31小时。通过使用一个由8个多核PC组成的网络,提供35个客户端分布式计算,将模拟时间减少到1小时5分钟。基本模拟任务基本任务集合:FOV使用分布式
    发表于 04-10 08:48

    西门子PLC-模拟量采集计算使用方法

    西门子PLC-模拟量采集计算使用方法,很实用
    发表于 04-09 15:29 0次下载

    云 GPU 加速计算:突破传统算力瓶颈的利刃

    在数字化时代,数据呈爆炸式增长,传统的算力已难以满足复杂计算任务的需求。无论是人工智能的深度学习、大数据的分析处理,还是科学研究中的模拟计算,都对算力提出了极高的要求。而云 GPU 加速计算的出现
    的头像 发表于 02-17 10:36 516次阅读

    THS1206采样并非连续,请问这是为什么?

    按照PDF,我先后对THS1206进行初始化和设置,先写0x401到CR1复位,再写0x400到CR1清除复位,然后写0x0c8到CR0设置为双通道差分输入连续采样模式,再写0x422到CR1设置为深度为2,即每次读两个数。但是实际调试中发现:THS1206采样并非连续,请问这是为什么?
    发表于 02-13 06:05

    Fluidyn-PANACHE交通污染仿真案例演示:导入GIS数据快速建模

    在数值仿真计算的过程中,三维模型的建立通常是我们所要面对的第一个难题,为了实现仿真模拟计算的准确性和真实性,利用三维模型软件建立一个可供计算的三维模型至关重要。
    的头像 发表于 01-17 09:43 608次阅读
    Fluidyn-PANACHE交通污染仿真案例演示:导入GIS数据快速建模

    DAC8760的数字地和模拟地能否不连呢?

    of the device)。 虽然名称都是GND,但有数字地和模拟地之分。产品手册上的所有电路范例都是数字地和模拟地相连的。是否可以用两
    发表于 01-14 06:24

    AFE0064芯片手册中把所有的地引脚都表示为GND,是不是就意味着不分数字地和模拟地呢?

    最近在用AFE0064设计一款产品,再画版图的时候遇到了问题,就是AFE0064芯片手册中把所有的地引脚都表示为GND,是不是就意味着不分数字地和模拟地呢?如果后端AD分数字地和模拟地,为了达到更好的性能,GND应该和数字地相
    发表于 01-10 07:06

    读取AFE4403的ADC计算都是负值,是对的吗?

    读取AFE4403的ADC计算都是负值,这对吗?
    发表于 12-20 08:13

    计算和HPC的关系

    尽管云计算和HPC在架构、应用场景和成本效益等方面存在显著差异,但云计算和HPC之间并非孤立存在,而是相互补充、协同发展的关系。下面,AI部落小编带您探讨云计算和HPC的关系。
    的头像 发表于 12-14 10:35 665次阅读

    ADS4129在250msps时,是所有的采样都是延迟固定的10个时钟周期吗?是什么原因造成的这种延迟呢?

    上图中的ADC latency是10个时钟周期,那么在250msps时,是所有的采样都是延迟固定的10个时钟周期吗?是什么原因造成的这种延迟呢?
    发表于 12-09 06:28