0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

王欣然教授团队提出基于二维材料的高效稀疏神经网络硬件方案

清新电源 来源:南京大学集成电路学院 2025-01-13 10:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1月8日,王欣然教授领导的合作团队在国际顶级期刊《Nature Electronics》以“An index-free sparse neural network using two-dimensional semiconductor ferroelectric field-effect transistors”为题发表最新研究进展,报道了基于二维材料的高效稀疏神经网络硬件解决方案。

194e239a-cede-11ef-9310-92fbcf53809c.png

稀疏性 (Sparsity)是人脑中的神经突触的本征属性。在大脑发育过程中,超过一半的突触会以细粒度和非结构化的方式被剪枝(Pruning),这是人脑具有高能效的关键因素。受此启发,稀疏神经网络(Sparse neural network)早在上世纪九十年代就被提出,已成为人工智能轻量化的主流路径。

虽然稀疏神经网络中90%的权重可以被剪枝,但剪枝过程中需要反复与外部存储设备进行索引(Indexing),消耗了整个系统90%以上的能耗和时延。类比于分离计算和存储的冯诺依曼瓶颈,索引过程成为稀疏神经网络硬件的瓶颈(图1)。目前产业界主流方案为英伟达自A100芯片开始提出的粗粒度、结构化剪枝(Structured pruning),其本质是通过一定程度的精度牺牲来减轻索引开销,并未在根本上解决索引瓶颈。

19647262-cede-11ef-9310-92fbcf53809c.png

图1 硬件的索引瓶颈造成稀疏神经网络效率低下

为了解决稀疏神经网络软硬件不适配的问题,王欣然教授领导的合作团队借鉴了神经生物学模型:支持突触产生、剪枝、重新生长等动态行为的,并非神经元本身,而是环绕在神经元和突触周围的星形胶质细胞 (Astrocytes)和小胶质细胞 (Microglial)。受此启发,稀疏性信息在位置上也需要尽可能接近权重信息,并直接参与稀疏运算。

在本工作中,团队首次提出了“存内稀疏”计算架构(In-Memory Sparsity),其把稀疏神经网络的训练过程抽象为稀疏矩阵和权重矩阵的Hadamard乘积,并集成在一个单元内部(图2)。整个稀疏网络的硬件基于二硫化钼(MoS₂)铁电晶体管技术,每个单元包含两个铁电晶体管,其中模拟铁电晶体管用于存储权重数据,而数字铁电晶体管用于编码稀疏性信息,直接决定权重是否被修剪。稀疏性信息被提前编程而免除了外部索引,从而大大降低了稀疏神经网络训练的开销。

19799994-cede-11ef-9310-92fbcf53809c.png

图2 “存内稀疏”架构设计

为支撑存内稀疏架构芯片级并行计算,团队开发了以矢量近似更新算法(Vectorial Approximate Updating, VAU)为核心的软件-硬件协同优化方法(Software-Hardware Co-Optimization, SHCO)。其要点在于:摒弃传统更新方案中完全精确但低效的逐个单元更新、以及高效却失准的行列更新,而是在预先的稀疏性编码的基础上,以行列为最小单元进行近似更新。结果表明,VAU算法在稀疏硬件上实现的精确度可以和理论值媲美,证明了软硬件协同优化的必要性。基于存内稀疏架构和软硬件协同优化方法,团队制备了硬件阵列,完成了多种稀疏训练过程的片上实测:包括预训练、剪枝、过剪、以及重新生长,最后在75%的稀疏率下实现了精度为98.4%的EMNIST手写字母分类(图3)。

为了证明硬件方案的可拓展性,团队基于NeuroSim仿真工具,将经典卷积神经网络VGG8-Net部署在三种不同的硬件架构上:密集硬件、传统稀疏硬件、以及本文提出的免索引稀疏硬件。仿真证明,存内稀疏架构的免索引稀疏硬件,首次基于极细粒度和非结构化稀疏性,实现一个数量级的能耗和时延收益。

1998aca8-cede-11ef-9310-92fbcf53809c.png

图3 基于免索引硬件的片上稀疏训练

综上所述,受人脑启发,团队首次提出了稀疏神经网络的“存内稀疏”计算架构,并基于二维半导体铁电晶体管技术进行了免索引单元开发和阵列级片上演示,打破了稀疏神经网络硬件长期面临的瓶颈。本工作也充分展示了二维半导体等新材料、新器件技术赋能人工智能硬件的巨大潜力:二维材料具有低温后道工艺兼容的特点,可以与成熟的硅基电路进行三维单片集成,突破先进封装技术在互联密度方面的局限,进一步提升近存、存算芯片的能效。

原文链接:https://www.nature.com/articles/s41928-024-01328-4

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106808
  • 二维材料
    +关注

    关注

    0

    文章

    53

    浏览量

    5742

原文标题:Nature Electronics:王欣然教授团队提出基于二维材料的高效稀疏神经网络硬件方案

文章出处:【微信号:清新电源,微信公众号:清新电源】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶中常提的卷积神经网络是个啥?

    在自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像处理中尤其常见,因为图像本身就可以看作是由像素排列成的二维网格。
    的头像 发表于 11-19 18:15 1842次阅读
    自动驾驶中常提的卷积<b class='flag-5'>神经网络</b>是个啥?

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    数的提出很大程度的解决了BP算法在优化深层神经网络时的梯度耗散问题。当x&gt;0 时,梯度恒为1,无梯度耗散问题,收敛快;当x&lt;0 时,该层的输出为0。 CNN
    发表于 10-29 07:49

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    类脑视觉芯片里程碑突破:复旦团队首创二维半导体DRAM仿生神经

    在类脑视觉芯片领域,复旦大学的研究团队取得了令人瞩目的突破,他们联合研发出了基于二维半导体DRAM的仿生神经元。这一成果为类脑计算与视觉处理的融合发展带来了新的曙光,有望革新当前人工智能在视觉感知
    的头像 发表于 08-15 17:00 751次阅读
    类脑视觉芯片里程碑突破:复旦<b class='flag-5'>团队</b>首创<b class='flag-5'>二维</b>半导体DRAM仿生<b class='flag-5'>神经</b>元

    上海大学在二维钙钛矿光电探测器领域取得重要进展

    图1.(a)热调控示意图;(b)PL光谱;(c)TRPL mapping图。 近日,上海大学材料基因组工程研究院生浩教授团队二维钙钛矿光
    的头像 发表于 08-12 09:31 703次阅读
    上海大学在<b class='flag-5'>二维</b>钙钛矿光电探测器领域取得重要进展

    神经网络专家系统在电机故障诊断中的应用

    摘要:针对传统专家系统不能进行自学习、自适应的问题,本文提出了基于种经网络专家系统的并步电机故障诊断方法。本文将小波神经网络和专家系统相结合,充分发挥了者故障诊断的优点,很大程度上降
    发表于 06-16 22:09

    世界首台非硅二维材料计算机问世 二维材料是什么?二维材料的核心特征解读

    据外媒报道;美国宾夕法尼亚州立大学团队在《自然》杂志发表研究成果,首次利用原子级厚度的二维材料(非硅)成功研制出功能完整的计算机,标志着新型电子设备开发的重要进展。这是一项突破性成果;首次利用
    的头像 发表于 06-12 15:25 1188次阅读

    基于STM32的二维码识别源码+二维码解码库lib

    基于STM32的二维码识别源码+二维码解码库lib项目实例下载! 纯分享帖,需要者可点击附件免费获取完整资料~~~【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内
    发表于 05-23 20:45

    泰克科技测试设备在二维金属材料研究中的应用

    经典二维材料以其原子级厚度、独特的电学/机械性能和多样的结构,成为纳米技术领域的基础材料,和二维金属材料相比在结构、电学行为和稳定性方面有较
    的头像 发表于 03-27 15:06 810次阅读
    泰克科技测试设备在<b class='flag-5'>二维</b>金属<b class='flag-5'>材料</b>研究中的应用

    BP神经网络与卷积神经网络的比较

    BP神经网络与卷积神经网络在多个方面存在显著差异,以下是对两者的比较: 一、结构特点 BP神经网络 : BP神经网络是一种多层的前馈神经网络
    的头像 发表于 02-12 15:53 1324次阅读

    如何优化BP神经网络的学习率

    训练过程中发生震荡,甚至无法收敛到最优解;而过小的学习率则会使模型收敛速度缓慢,容易陷入局部最优解。因此,正确设置和调整学习率对于训练高效、准确的神经网络模型至关重要。 、学习率优化算法 梯度下降法及其变种 : 标准梯
    的头像 发表于 02-12 15:51 1433次阅读

    什么是BP神经网络的反向传播算法

    神经网络(即反向传播神经网络)的核心,它建立在梯度下降法的基础上,是一种适合于多层神经元网络的学习算法。该算法通过计算每层网络的误差,并将这些误差反向传播到前一层,从而调整权重,使得
    的头像 发表于 02-12 15:18 1289次阅读

    BP神经网络与深度学习的关系

    ),是一种多层前馈神经网络,它通过反向传播算法进行训练。BP神经网络由输入层、一个或多个隐藏层和输出层组成,通过逐层递减的方式调整网络权重,目的是最小化网络的输出误差。
    的头像 发表于 02-12 15:15 1358次阅读

    人工神经网络的原理和多种神经网络架构方法

    在上一篇文章中,我们介绍了传统机器学习的基础知识和多种算法。在本文中,我们会介绍人工神经网络的原理和多种神经网络架构方法,供各位老师选择。 01 人工神经网络   人工神经网络模型之所
    的头像 发表于 01-09 10:24 2264次阅读
    人工<b class='flag-5'>神经网络</b>的原理和多种<b class='flag-5'>神经网络</b>架构方法

    雷钰团队及合作者在二维材料缺陷调控及生物应用等领域取得新进展

    自石墨烯首次被成功剥离之后,二维材料于储能、柔性器件、电子学、光子学、生物医学以及催化等诸多领域均展现出广泛的应用前景。在可规模化合成二维材料方法中,液相剥离法通过削弱块状层状
    的头像 发表于 12-31 11:36 902次阅读
    雷钰<b class='flag-5'>团队</b>及合作者在<b class='flag-5'>二维</b><b class='flag-5'>材料</b>缺陷调控及生物应用等领域取得新进展