0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

王欣然教授团队提出基于二维材料的高效稀疏神经网络硬件方案

清新电源 来源:南京大学集成电路学院 2025-01-13 10:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1月8日,王欣然教授领导的合作团队在国际顶级期刊《Nature Electronics》以“An index-free sparse neural network using two-dimensional semiconductor ferroelectric field-effect transistors”为题发表最新研究进展,报道了基于二维材料的高效稀疏神经网络硬件解决方案。

194e239a-cede-11ef-9310-92fbcf53809c.png

稀疏性 (Sparsity)是人脑中的神经突触的本征属性。在大脑发育过程中,超过一半的突触会以细粒度和非结构化的方式被剪枝(Pruning),这是人脑具有高能效的关键因素。受此启发,稀疏神经网络(Sparse neural network)早在上世纪九十年代就被提出,已成为人工智能轻量化的主流路径。

虽然稀疏神经网络中90%的权重可以被剪枝,但剪枝过程中需要反复与外部存储设备进行索引(Indexing),消耗了整个系统90%以上的能耗和时延。类比于分离计算和存储的冯诺依曼瓶颈,索引过程成为稀疏神经网络硬件的瓶颈(图1)。目前产业界主流方案为英伟达自A100芯片开始提出的粗粒度、结构化剪枝(Structured pruning),其本质是通过一定程度的精度牺牲来减轻索引开销,并未在根本上解决索引瓶颈。

19647262-cede-11ef-9310-92fbcf53809c.png

图1 硬件的索引瓶颈造成稀疏神经网络效率低下

为了解决稀疏神经网络软硬件不适配的问题,王欣然教授领导的合作团队借鉴了神经生物学模型:支持突触产生、剪枝、重新生长等动态行为的,并非神经元本身,而是环绕在神经元和突触周围的星形胶质细胞 (Astrocytes)和小胶质细胞 (Microglial)。受此启发,稀疏性信息在位置上也需要尽可能接近权重信息,并直接参与稀疏运算。

在本工作中,团队首次提出了“存内稀疏”计算架构(In-Memory Sparsity),其把稀疏神经网络的训练过程抽象为稀疏矩阵和权重矩阵的Hadamard乘积,并集成在一个单元内部(图2)。整个稀疏网络的硬件基于二硫化钼(MoS₂)铁电晶体管技术,每个单元包含两个铁电晶体管,其中模拟铁电晶体管用于存储权重数据,而数字铁电晶体管用于编码稀疏性信息,直接决定权重是否被修剪。稀疏性信息被提前编程而免除了外部索引,从而大大降低了稀疏神经网络训练的开销。

19799994-cede-11ef-9310-92fbcf53809c.png

图2 “存内稀疏”架构设计

为支撑存内稀疏架构芯片级并行计算,团队开发了以矢量近似更新算法(Vectorial Approximate Updating, VAU)为核心的软件-硬件协同优化方法(Software-Hardware Co-Optimization, SHCO)。其要点在于:摒弃传统更新方案中完全精确但低效的逐个单元更新、以及高效却失准的行列更新,而是在预先的稀疏性编码的基础上,以行列为最小单元进行近似更新。结果表明,VAU算法在稀疏硬件上实现的精确度可以和理论值媲美,证明了软硬件协同优化的必要性。基于存内稀疏架构和软硬件协同优化方法,团队制备了硬件阵列,完成了多种稀疏训练过程的片上实测:包括预训练、剪枝、过剪、以及重新生长,最后在75%的稀疏率下实现了精度为98.4%的EMNIST手写字母分类(图3)。

为了证明硬件方案的可拓展性,团队基于NeuroSim仿真工具,将经典卷积神经网络VGG8-Net部署在三种不同的硬件架构上:密集硬件、传统稀疏硬件、以及本文提出的免索引稀疏硬件。仿真证明,存内稀疏架构的免索引稀疏硬件,首次基于极细粒度和非结构化稀疏性,实现一个数量级的能耗和时延收益。

1998aca8-cede-11ef-9310-92fbcf53809c.png

图3 基于免索引硬件的片上稀疏训练

综上所述,受人脑启发,团队首次提出了稀疏神经网络的“存内稀疏”计算架构,并基于二维半导体铁电晶体管技术进行了免索引单元开发和阵列级片上演示,打破了稀疏神经网络硬件长期面临的瓶颈。本工作也充分展示了二维半导体等新材料、新器件技术赋能人工智能硬件的巨大潜力:二维材料具有低温后道工艺兼容的特点,可以与成熟的硅基电路进行三维单片集成,突破先进封装技术在互联密度方面的局限,进一步提升近存、存算芯片的能效。

原文链接:https://www.nature.com/articles/s41928-024-01328-4

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108178
  • 二维材料
    +关注

    关注

    0

    文章

    57

    浏览量

    5785

原文标题:Nature Electronics:王欣然教授团队提出基于二维材料的高效稀疏神经网络硬件方案

文章出处:【微信号:清新电源,微信公众号:清新电源】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    二维材料电学表征与器件测试方法及实现方案

    所谓二维材料 (Two dimen-sional material),指的是电子仅可在两个维度的非纳米尺度(1-100nm)上自由运动(平面运动)的材料,属于纳米材料的范畴,包含具有超
    的头像 发表于 04-21 09:25 89次阅读
    <b class='flag-5'>二维</b><b class='flag-5'>材料</b>电学表征与器件测试方法及实现<b class='flag-5'>方案</b>

    二维影像扫描引擎在门禁二维码刷卡梯控行业中的应用

    在当今科技日新月异的时代,二维影像扫描引擎以其卓越的识别性能和广泛的应用领域,成为了门禁系统中不可或缺的重要组成部分,尤其在二维码刷卡梯控行业中展现出了非凡的价值。本文将深入探讨二维影像扫描引擎在
    的头像 发表于 12-17 15:42 502次阅读
    <b class='flag-5'>二维</b>影像扫描引擎在门禁<b class='flag-5'>二维</b>码刷卡梯控行业中的应用

    神经网络的初步认识

    日常生活中的智能应用都离不开深度学习,而深度学习则依赖于神经网络的实现。什么是神经网络神经网络的核心思想是模仿生物神经系统的结构,特别是大脑中神经
    的头像 发表于 12-17 15:05 460次阅读
    <b class='flag-5'>神经网络</b>的初步认识

    二维数组介绍

    大家不要认为二维数组在内存中就是按行、列这样二维存储的,实际上,不管二维、三数组… 都是编译器的语法糖。 存储上和一数组没有本质区别,
    发表于 11-25 07:42

    自动驾驶中常提的卷积神经网络是个啥?

    在自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像处理中尤其常见,因为图像本身就可以看作是由像素排列成的二维网格。
    的头像 发表于 11-19 18:15 2247次阅读
    自动驾驶中常提的卷积<b class='flag-5'>神经网络</b>是个啥?

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    数的提出很大程度的解决了BP算法在优化深层神经网络时的梯度耗散问题。当x&gt;0 时,梯度恒为1,无梯度耗散问题,收敛快;当x&lt;0 时,该层的输出为0。 CNN
    发表于 10-29 07:49

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    CICC2033神经网络部署相关操作

    在完成神经网络量化后,需要将神经网络部署到硬件加速器上。首先需要将所有权重数据以及输入数据导入到存储器内。 在仿真环境下,可将其存于一个文件,并在 Verilog 代码中通过 readmemh 函数
    发表于 10-20 08:00

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的神经结构,尽管这种微生物的
    的头像 发表于 09-28 10:03 1567次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    类脑视觉芯片里程碑突破:复旦团队首创二维半导体DRAM仿生神经

    在类脑视觉芯片领域,复旦大学的研究团队取得了令人瞩目的突破,他们联合研发出了基于二维半导体DRAM的仿生神经元。这一成果为类脑计算与视觉处理的融合发展带来了新的曙光,有望革新当前人工智能在视觉感知
    的头像 发表于 08-15 17:00 1200次阅读
    类脑视觉芯片里程碑突破:复旦<b class='flag-5'>团队</b>首创<b class='flag-5'>二维</b>半导体DRAM仿生<b class='flag-5'>神经</b>元

    上海大学在二维钙钛矿光电探测器领域取得重要进展

    图1.(a)热调控示意图;(b)PL光谱;(c)TRPL mapping图。 近日,上海大学材料基因组工程研究院生浩教授团队二维钙钛矿光
    的头像 发表于 08-12 09:31 1029次阅读
    上海大学在<b class='flag-5'>二维</b>钙钛矿光电探测器领域取得重要进展

    神经网络专家系统在电机故障诊断中的应用

    摘要:针对传统专家系统不能进行自学习、自适应的问题,本文提出了基于种经网络专家系统的并步电机故障诊断方法。本文将小波神经网络和专家系统相结合,充分发挥了者故障诊断的优点,很大程度上降
    发表于 06-16 22:09

    世界首台非硅二维材料计算机问世 二维材料是什么?二维材料的核心特征解读

    据外媒报道;美国宾夕法尼亚州立大学团队在《自然》杂志发表研究成果,首次利用原子级厚度的二维材料(非硅)成功研制出功能完整的计算机,标志着新型电子设备开发的重要进展。这是一项突破性成果;首次利用
    的头像 发表于 06-12 15:25 2038次阅读

    基于STM32的二维码识别源码+二维码解码库lib

    基于STM32的二维码识别源码+二维码解码库lib,推荐下载!
    发表于 05-28 22:04

    基于STM32的二维码识别源码+二维码解码库lib

    基于STM32的二维码识别源码+二维码解码库lib项目实例下载! 纯分享帖,需要者可点击附件免费获取完整资料~~~【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内
    发表于 05-23 20:45