0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存储器式运算将有助于新一代AI加速器发展

dKBf_eetop_1 来源:未知 作者:李倩 2018-05-04 16:06 次阅读

业界开始重新审视十年前开发的处理器架构,看好速度较GPU快1万倍的所谓「存储器式运算」(In-Memory Computing;IMC),将有助于新一代AI加速器发展。

新创公司、企业巨擘和学术界开始重新审视十年前开发的处理器架构,看好它或许刚好就是机器学习(machine learning)的理想选择。他们认为,「存储器式运算」(In-Memory Computing;IMC)架构可望推动新型的人工智能(AI)加速器进展,使其速度较现行的GPU更快1万倍。

这些处理器承诺可在CMOS微缩速度放缓之际扩展芯片性能,而要求密集乘法累积阵列的深度学习算法也正逐渐获得动能。这些芯片虽然距离商用化上市还有一年多的时间,但也可能成为推动新兴非挥发性存储器成长的引擎。

例如,新创公司Mythic瞄准在快闪存储器(flash)阵列内部进行神经网路运算任务,致力于从模拟领域降低功耗。该公司的目标是在2019年底量产芯片,成为率先推出这一类新芯片的公司之一。

美国圣母大学(Notre Dame)电子工程系系主任Suman Datta说:「在我们学术界大多数的人认为,新兴存储器将成为实现存储器处理器(processor-in-memory;PIM)的技术之一。采用新的非挥发性存储器将意味着创造新的使用模式,而存储器式运算架构将是关键之一。」

Datta指出,在1990年代,有几位学者试图打造这样的处理器。诸如EXECUBE、IRAM和FlexRAM之类的设计都「失败了,而今,随着相变存储器(PCM)、电阻式RAM (RRAM)和STT MRAM等新兴存储器出现,以及业界对于机器学习硬体加速器的兴趣浓厚,开始振兴这个领域的研究。不过,据我所知,大部份的展示都还是在元件或元件阵列层级进行,而不是一个完整的加速器。」

其中一家竞争对手来自IBM于2016年首次披露的「电阻处理器」(Resistive Processing Unit;RPU)。这是一款4,096 x 4,096交叉阵列的模拟元件。

IBM研究员Vijay Narayanan认为,「其挑战在于找出正确的模拟存储器元素是什么——我们正在评估相变、RRAM和铁电。」Vijay Narayanan同时也是一位材料科学家,他主要的研究领域是在高K金属闸极。

在2015年,美国史丹佛大学(Stanford University)也曾经发布在这一领域的研究。中国和韩国的研究人员也在追求这一理念。

为了实现成功,研究人员需要找到相容于CMOS晶圆厂的存储器元件所需材料。此外,Narayanan说,「真正的挑战」就在于必须在施加电压时展现对称的电导或电阻。

IBM Research的材料科学家Vijay Narayanan表示,大多数用于AI的存储器处理器仍处于研究阶段,距离可上市的时间约三至五年

关于未来电晶体的几点思考

IBM至今已经制造出一些离散式元件和阵列,但并不是一款具有4Kx4K阵列的完整测试芯片,也尚未采用目前所认为的理想材料。Narayanan表示,IBM的Geoff Burr在500 x 661阵列上采用相变材料进行深度神经网路(DNN)训练,而其结果显示「合理的精确度和加速度」。

「我们正稳步前进,但了解还必须改善现有的材料,而且也在评估新材料。」

IBM希望使用模拟元件,以便能够定义多个电导状态,从而较数位元件更有助于为低功耗操作开启大门。该公司还看好大型阵列可望成为平行执行多项AI操作的大好机会。

Narayanan乐观地认为,IBM可以利用其于高k金属闸极方面累积的多年经验,找到调整AI加速器电阻的材料。他花了十几年的时间,才将IBM在该领域的专业知识从研究转向商业产品,并与格芯(Globalfoundries)和三星(Samsung)等业界伙伴合作。

展望未来,IBM将致力于开发闸极全环(GAA)电晶体,将纳米片用于7nm节点以外的应用。他认为这一类的设计并不存在根本的障碍,而只是实施的问题。

除了纳米片之外,研究人员正在探索负电容场效电晶体(FET),这些FET可在电压变化很小的情况下提供较大的电流变化。从研究人员发现这种掺杂氧化铪是铁电材料,而且可能相容于CMOS后,过去这五年来,这种想法越来越受到关注。

但Narayanan也说,「目前还有很多反对者以及同时支持二者的人。」

「我们的研究显示,负电容是一种短暂的效应,」Notre Dame的Datta说,「因此,当极化开关切换时,通道电荷得以暂时启动,而一旦暂态稳定后就不会再取得任何结果。」

美国加州大学柏克莱分校(UC Berkeley)的研究人员则「相信这是一种重要的『新状态』。因此,故事仍在继续发展中,可以说大部份的公司都在内部进行评估中。 」

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1670

    浏览量

    74272
  • 存储器
    +关注

    关注

    38

    文章

    7147

    浏览量

    161978
  • 人工智能
    +关注

    关注

    1776

    文章

    43839

    浏览量

    230589

原文标题:人工智能重振存储器式运算架构

文章出处:【微信号:eetop-1,微信公众号:EETOP】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

    Arm发布的新一代Ethos-U AI加速器确实在业界引起了广泛关注。
    的头像 发表于 04-18 15:59 281次阅读

    在微芯片上使用3D反射器堆栈有助于加快6G通信的发展

    一项新的研究发现,在微芯片上使用3D反射器堆栈可以使无线链路的数据速率提高三倍,从而有助于加快6G通信的发展
    的头像 发表于 03-13 16:31 234次阅读

    一种创新的面积和能效AI存储器设计—MCAIMem

    人工智能芯片通常使用 SRAM 存储器作为缓冲器(buffers),其可靠性和速度有助于实现高性能。
    的头像 发表于 01-03 17:16 1535次阅读
    一种创新的面积和能效<b class='flag-5'>AI</b><b class='flag-5'>存储器</b>设计—MCAIMem

    ADI全新集成电路有助于监测心率

    电子发烧友网站提供《ADI全新集成电路有助于监测心率.pdf》资料免费下载
    发表于 11-24 10:38 0次下载
    ADI全新集成电路<b class='flag-5'>有助于</b>监测心率

    多层pcb生产,更有助于高精度布线

    多层pcb生产,更有助于高精度布线
    的头像 发表于 11-15 11:02 249次阅读

    AI加速器架构设计与实现》+第2章的阅读概括

    首先感谢电子发烧友论坛提供的书籍和阅读评测的机会。 拿到书,先看下封面介绍。这本书的中文名是《AI加速器架构设计与实现》,英文名是Accelerator Based on CNN Design
    发表于 09-17 16:39

    AI加速器架构设计与实现》+学习和些思考

    AI加速器设计的学习和些思考 致谢 首先感谢电子发烧友论坛提供的书籍 然后为该书打个广告吧,32K的幅面,非常小巧方便,全彩印刷,质量精良,很有质感。 前言 设计神经网络首先要考虑的几个问题
    发表于 09-16 11:11

    STM32F2的存储器和总线架构

    系统架构  多层AHB总线矩阵  存储空间  存储器映射  片上SRAM  位带操作  片上闪存  自适应闪存加速器(STM32F2新增)  启动模式  代码空间的动态重映射(STM32F2新增)  内嵌bo
    发表于 09-13 06:20

    ST GaN产品创新型快速充电器解决方案

    在消费类应用领域,由于快速充电器的快速增长,GaN 技术在 2020-2021 跨越了鸿沟,目前其他交直流应用场景中也采用了GaN• 带有嵌入驱动程序 / 控制(MasterGaN、VIPerGaN)的系统封装 (SiP) 由于集成简单,
    发表于 09-07 07:20

    STM32U599平衡图显性能与功耗的新一代产品

    STM32U599平衡图显性能与功耗的新一代产品,内容包含: STM32U5x9 的高性能与高阶图形加速器 、STM32U5的矢量图形 、STM32U5x9 的低功耗设计 、LPBAM - sensor hub等。
    发表于 09-05 07:21

    如何从命令行使用DS-5调试进行跟踪

    有时,能够从命令行驱动DS-5调试非常有用。 如果您正在自动化测试或执行重复性任务,这将有助于节省大量时间。 在本教程中,我们将向您展示如何以这种方式捕获跟踪。
    发表于 08-28 08:25

    激光脉冲或将有助于开发下一代高容量电池

    近日,阿卜杜拉国王科技大学(King Abdullah University,KAUST)了一项研究成果,该成果可能有助于改进下一代电池的阳极材料。
    发表于 08-08 14:44 188次阅读

    Intel媒体加速器参考软件用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互白板(IWBs)和亭位使用模型的参考媒体播放应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理
    发表于 08-04 07:07

    【书籍评测活动NO.18】 AI加速器架构设计与实现

    的神经网络结构,掌握如何从零开始设计个能用、好用的产品级加速器。通过阅读本书,你将: 透彻理解与深度学习相关的机器学习算法及其实现 学会主流图像处理领域神经网络的结构 掌握加速器运算
    发表于 07-28 10:50

    孔环是什么?深入了解孔环有助于实现PCB设计

    本文将探讨孔环,因为更深入的了解孔环有助于确保成功地实现PCB设计。
    的头像 发表于 07-19 10:21 2721次阅读
    孔环是什么?深入了解孔环<b class='flag-5'>有助于</b>实现PCB设计