0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IMC为什么会回归?

Astroys 来源:Astroys 作者:Astroys 2022-11-09 09:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

In-memory computing(以下简称IMC)是一种古老而有争议的组织计算机硬件的方式,以最大限度地减少能耗并提高性能,但除了在一些非常特定的应用中,它从未真正进入主流。但边缘计算AI的需求可能为这种架构理念提供了机会。

IMC将计算元素放在内存中而不是中央处理器中的概念在计算机科学的边缘有很长的历史。IMC是那些总是建立在合理推理基础上的想法之一,而且非常有意义,甚至影响了计算机架构的重大进步,但却没有以其纯粹的形式突破主流。但现在,一种古老的录音技术、边缘计算的限制和深度学习网络的内部结构的奇妙结合,可能会把IMC重新拉回聚光灯下。

一个古老的观点

IMC的概念可以追溯到计算机的早期。计算机工程师们很快意识到,虽然冯诺依曼架构(中央处理器从主存储单元读取指令和数据)非常灵活并被普遍采用,但它的效率往往很低。重复地从内存中获取少量数据,做一些简单的计算,然后把结果放回内存的算法,一遍又一遍地,花费大量的时间和精力获取指令和移动数据,但在实际计算上花费的时间和精力却被压缩了。由于从内存中获取一个单词的时间和能量几乎总是比CPU中的算术或逻辑成本大,这种低效很要命,特别是在像边缘计算这样的功耗受限的环境中。

一些架构师采取了显而易见的行动,为什么把它们全部集中在CPU中,而不直接将简单的计算元素构建到内存单元中呢?理论上,这将大大减少所有读写操作的时间延迟和功耗,并且可以绕过CPU不断获取和解码指令的需要。

现实的阻碍

事实证明,不这么做有一些非常好的实际理由。赋予内存计算元素什么样的能力是至关重要的。将这些功能放在哪里,以及如何将它们连接到内存阵列中也是如此。虽然通常有可能设计一个IMC架构,在一组很窄的算法上工作得很好,但你越试图使架构通用,你放弃的效率就越多。如果你只是在CPU上做了一些聪明的事,那么很快就会得到一个效率较低的架构。

CPU架构师很聪明。他们用另一种方法来解决所有这些读写的低效问题:缓存。然后是更多缓存,更多的缓存层。通过尝试让大多数读写操作发生在缓存而不是主内存中,可以消除一些低效的问题(取决于缓存和相关算法)。

与此同时,主存储正从一种高度专业化的手工制造产品变成一种商品。用户越来越不愿意做任何迫使他们购买专用存储芯片的事了。因此,IMC成了一种很难销售的产品。但这并没有阻止该领域的研究。今年的ISSCC会议有许多关于这个主题的论文,原因我们稍后将会看到。

IMC的机遇

有一种非常狭窄的算法可以从IMC中获得巨大的收益,这是个巨大的商业领域:3D图形渲染。着色(在3D模型的2D渲染中为像素添加色彩和亮度的过程)对3D模型中的每个点进行一些简单的操作,反复进行。虽然着色算法有很多变体,但它们都非常相似,一个设计良好的架构可以覆盖很多变体,这是一个成功的IMC应用的处方。

我们知道这种思维的结果就是GPU。虽然通常不这样描述,但GPU实际上是一个巨大的内存芯片,它有专门的处理器(着色引擎)明智地分散在内存块中。这种架构不仅主导了3D图形渲染,而且通用GPU和CUDA等并行编程语言的出现也显示了这种架构对更广泛的并行化问题的适应性。

进入AI

其中一类可并行化的问题是AI的一个分支:深度学习网络。当你训练或使用深度学习网络时,里面发生的只是我们一直在讨论的那种大规模、有序的简单计算阵列。在训练过程中,你将输入和正确的答案输入到模型中,并进行大量的简单计算,将答案通过网络的各层向输入传播,同时细化称为激活权重的巨大参数表。一旦训练好网络,你就把输入信息应用到模型中,做一系列矩阵乘法(同样是简单操作的有序集合,在网络的末端弹出一个答案,一个推理)。

通过对内存非常仔细的安排和精心编程,这个过程对GPU来说是小菜一碟。因此,GPU在深度学习中无处不在。但是GPU虽然对优秀的软件非常有效,但在推理计算方面却没有理想的效率。这一事实导致了大量的研究论文和初创公司设计更适合深度学习加速,特别是为推理加速设计的加速器芯片。这种架构有很多,但大多数都有一个共同的想法:使用大量的小型计算元素来并行处理深度学习的大量计算负载,并将这些元素放置在非常靠近或位于内存中的位置。

Syntiant和Untether等初创公司也属于非常接近的一类。这类公司似乎更喜欢“at-memory computing(以下简称为AMC)”这个短语,而不是更传统的术语,可能是因为他们没有把计算元素放在内存阵列中,而是放在芯片的旁边。但还有另外一类。

模拟

这就是那个奇怪结合的地方(一个模拟推理加速器),我们分三步讨论。首先,深度学习网络有一个奇怪的特性:大多数网络在内部计算中几乎不受微小误差的影响。在几乎所有的有序算术中,无论你用32位、8位,甚至有时是4位来表示数字,对所产生的推理的准确性都没有什么区别。在这些计算中,传统GPU中的大部分内存和数据路径位都被浪费了。

其次,工程师们很久以前就发现,闪存单元不仅可以存储数字位,还可以存储模拟数据:例如,足以产生可接受的语音记录。这一发现为多级闪存的工作奠定了基础。因此,在原则上,模拟闪存可以存储深度学习网络的低精度激活权重,而不放弃推理的准确性。

第三,由于闪存阵列的组织方式,你可以让闪存阵列在一个周期内计算乘积的模拟和乘积,这是矩阵算术和推理计算的基本操作,只需要很少的能量。这对于将激活权重(只在训练期间改变)作为模拟值存储在闪存单元中,然后一次性读出整个输入乘以权重并相加的集合来说,是非常好的。整个过程功耗非常小。

把这三个部分放在一起,你就有了一个非常快、非常高效的模拟推理加速器背后的想法。这种设计消除了数字设计的大部分内存和大多数处理元素,而是在闪存阵列中进行模拟乘积。Axelera、Mythic和TetraMem等初创公司正在使用这种方法开发芯片或IP,并瞄准了对功耗要求严苛的边缘计算领域。

但是在模拟电路中存在着固有的挑战,以至于许多年来大多数模拟电路设计已经被数字方法所取代。模拟信号会被噪声破坏。模拟内存会随着时间的推移而损耗。模拟电路往往是专用的,而且很难从一种工艺扩展到下一种。这些问题会再次导致模拟应用被其数字竞争对手超越吗?

这一次可能会有所不同。在边缘计算中,以极低的功耗进行大规模、快速推理的能力是非常大的优势。随着芯片从14nm扩展到10nm、5nm及以上,不断上升的成本、巨大的设计挑战和日益增长的供应链担忧,使得仅仅遵循摩尔定律的数字工艺让模拟方法被淘汰的说法没那么肯定了。

ARM和IBM的研究人员最近联合发表的一篇论文表明,一些非常重要的玩家正在认真对待这项技术的长期发展。该论文介绍了一种14nm模拟IMC芯片,该芯片直接解决了该技术的噪声和内存漂移问题。

似乎可以肯定的是,更多的IMC和AMC的例子将出现在边缘计算应用中,无论具体的实现是模拟还是数字。除了在这些环境中GPU已经霸占的领域之外,这种方法是否会过渡到云数据中心或超级计算机,仍然是一个开放和非常有趣的问题。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11327

    浏览量

    225878
  • 中央处理器
    +关注

    关注

    1

    文章

    126

    浏览量

    17126
  • IMC
    IMC
    +关注

    关注

    1

    文章

    36

    浏览量

    5201

原文标题:IMC为什么会回归?

文章出处:【微信号:Astroys,微信公众号:Astroys】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    余承东缺席发布但宣布华为手机全面回归 大方公布新手机CPU型号

    余承东通过微博掷地有声地官宣:“搭载麒麟芯片和全新鸿蒙操作系统的畅享90系列发布,华为手机终于实现了全面回归!感谢一路支持、一路相伴的朋友。”
    的头像 发表于 03-25 00:00 78次阅读
    余承东缺席发布<b class='flag-5'>会</b>但宣布华为手机全面<b class='flag-5'>回归</b> 大方公布新手机CPU型号

    线性回归的类型和应用

    线性回归是一种统计建模方法,用来将连续响应变量描述为一个或多个预测变量的函数。它有助于您理解和预测复杂系统的行为,或者分析试验、金融和生物数据。
    的头像 发表于 03-13 10:20 284次阅读
    线性<b class='flag-5'>回归</b>的类型和应用

    3大核心优势:imc防侧滚系统,让列车行驶更稳更安全!

    1铁路安全的隐形威胁:侧滚现象在铁路运输中,轮对的扭转振动(侧滚)不仅降低牵引力,还会加速部件磨损,甚至影响列车运行稳定性。如何提前检测并防止侧滚?imc与DNVGL强强联手,推出防侧滚系统
    的头像 发表于 02-03 17:49 175次阅读
    3大核心优势:<b class='flag-5'>imc</b>防侧滚系统,让列车行驶更稳更安全!

    Skoda赛车测试显身手:imc 测量方案如何征服极端测试环境?

    当赛车在砾石赛道上高速漂移,轮胎与地面摩擦出火花;当急刹时车身重心剧烈转移,车轮承受着数倍于自重的冲击力——这样的极端场景,正是Skoda检验车辆性能的“终极考场”。而在这场“考试”中,imc的测量
    的头像 发表于 01-28 09:05 594次阅读
    Skoda赛车测试显身手:<b class='flag-5'>imc</b> 测量方案如何征服极端测试环境?

    SensorMicro芯火微电子iMC微型红外模组:开启消费级红外热像新体验

    在科技飞速发展的当下,消费级应用市场对于创新产品的需求日益增长。SensorMicro芯火微电子推出的iMC微型红外模组,正是为满足这一市场需求而精心打造的一款红外热像组件,为消费领域带来了全新的视觉体验与应用可能。
    的头像 发表于 01-21 10:34 1124次阅读
    SensorMicro芯火微电子<b class='flag-5'>iMC</b>微型红外模组:开启消费级红外热像新体验

    从-40°C至125°C,最高可达2万rpm:imc领航电机转子温度测试

    过高,永磁体受损,电机性能大打折扣!别怕,imc电机转子测温方案来啦!imc测试方案5大优势从极寒到酷热,满足严苛环境测试要求想象一下,从-40°C的极寒到125°C的干燥
    的头像 发表于 01-21 09:05 270次阅读
    从-40°C至125°C,最高可达2万rpm:<b class='flag-5'>imc</b>领航电机转子温度测试

    GRAS imc eVTOL集成测试与测量解决方案

    ,GRAS&imc测试能力强强联合,为客户带来端到端一体化测试解决方案。核心优势:精准应对eVTOL测试难题在eVTOL测试过程中,高压信号同步、噪声认证、高速旋
    的头像 发表于 12-30 09:02 462次阅读
    GRAS <b class='flag-5'>imc</b> eVTOL集成测试与测量解决方案

    小模组,大期待!SensorMicro芯火微电子iMC系列微型红外模组正式发布

    对于红外热成像,每个人都有不同的期待:期待更便捷的热像使用体验、期待更精准的红外测温应用……你的期待,即将到来!面相移动终端的快速集成热像方案——iMC微型红外模组在芯火微电子正式发布!
    的头像 发表于 12-29 10:45 893次阅读
    小模组,大期待!SensorMicro芯火微电子<b class='flag-5'>iMC</b>系列微型红外模组正式发布

    毫米级轮轨力测量方案:imc应变片传感器遥测技术

    乘坐舒适:减少振动带来的颠簸感成本效益:优化维护流程,延长设备寿命imc应变片传感器遥测技术:从测量到分析全流程方案Part.21.感知层:应变片—毫米变形的"捕
    的头像 发表于 12-17 09:03 334次阅读
    毫米级轮轨力测量方案:<b class='flag-5'>imc</b>应变片传感器遥测技术

    降本增效兼顾:imc ARGUS最新推出4款数采测量模块

    适用于多种测试场景汽车、铁路、航空航天、eVTOL和重型机械行业imc测试测量公司宣布为其新一代模块化数据采集(DAQ)系统推出四款新型测量模块。如今,全新的ARGUSfit模块可为车辆测试
    的头像 发表于 11-18 09:01 761次阅读
    降本增效兼顾:<b class='flag-5'>imc</b> ARGUS最新推出4款数采测量模块

    升级旋转遥测极端环境测试稳定性—imc发布新型电源模块

    面向汽车、铁路、eVTOL与重型机械行业攻克旋转部件测试难点在恶劣测试环境下开展可靠的长期监测项目近日,德国imc测试测量推出新型电源模块xTP-NT-POWER-M。这是一款适用于MTP-NT
    的头像 发表于 11-12 09:03 761次阅读
    升级旋转遥测极端环境测试稳定性—<b class='flag-5'>imc</b>发布新型电源模块

    应对空间与能耗挑战:迈威IMC系列紧凑型工业光纤收发器

    内日益紧张的安装空间与持续运行带来的能耗压力,迈威全新IMC系列光纤收发器应势而生,专注于应对空间与能耗的核心挑战,为工业互联提供更优解。
    的头像 发表于 11-11 19:22 1291次阅读
    应对空间与能耗挑战:迈威<b class='flag-5'>IMC</b>系列紧凑型工业光纤收发器

    为什么焊点 IMC 层厚度必须锁定 3-5μm?

    在电子制造领域,从日常使用的智能手机到汽车中的核心控制系统,再到航空航天设备,每一个电子产品的稳定运行都离不开焊点的可靠连接。而在焊点的微观结构里,有一层名为金属间化合物(IMC)的物质,它的厚度
    的头像 发表于 09-28 23:27 1773次阅读
    为什么焊点 <b class='flag-5'>IMC</b> 层厚度必须锁定 3-5μm?

    什么是IMC(金属间化合物)

    什么是金属间化合物(IMC)金属间化合物(IMC)是两种及以上金属原子经扩散反应形成的特定化学计量比化合物,其晶体结构决定界面机械强度与电学性能。在芯片封装中,常见的IMC产生于如金与铝、铜与锡等
    的头像 发表于 09-11 14:42 3582次阅读
    什么是<b class='flag-5'>IMC</b>(金属间化合物)

    Commvault邀您相约IMC 2025第八届智造数字科技大会

    在全球制造业数字化转型浪潮中,IMC 2025第八届智造数字科技大会将于2025年6月20日在北京盛大开幕。
    的头像 发表于 06-18 11:45 1216次阅读