0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华大学的存算一体化架构和并行加速方法专利

汽车玩家 来源:爱集微 作者:嘉德IPR 2020-03-14 11:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

清华大学基于多个忆阻器阵列的全硬件完整存算一体系统,能够高效的运行卷积神经网络算法,证明了存算一体架构全硬件实现的可行性,对今后AI算力瓶颈的突破有着极大意义。

集微网消息,近日来,清华大学微电子学研究所、未来芯片技术高精尖创新中心的钱鹤、吴华强教授团队与合作者在《自然》在线发表了题为“Fully hardware-implemented memristor convolutional neural network”的研究论文,报道了基于忆阻器阵列芯片卷积网络的完整硬件实现。该成果所研发的基于多个忆阻器阵列的存算一体系统,在处理卷积神经网络时的能效远高于GPU,大幅提升了计算设备的算力,成功实现了以更小的功耗和更低的硬件成本完成复杂的计算。

随着以人工智能为代表的信息技术革命兴起,基于各种深度神经网络的算法可以实现图像识别与分割、物体探测以及完成对语音和文本的翻译、生成等处理。然而深度神经网络算法是一类以数据为中心的计算,实现该算法的硬件平台需要具有高性能、低功耗的处理能力,这就对集成电路芯片技术提出了的更高要求。目前传统实现该算法的硬件平台是基于存储和计算分离的冯诺依曼架构,这种架构在计算时需要将数据在存储器件和计算器件之间来回搬移,因此在包含大量参数的深度神经网络的计算过程中,该架构的能效较低。为此,开发一种新型计算硬件来运行深度神经网络算法成为当前亟需解决的问题。

基于这种情况,清华大学团队于2019年11月7日提出一项名为“基于忆阻器的神经网络的并行加速方法及处理器、装置”的发明专利(申请号:201911082236.3),申请人为清华大学。此专利针对复杂神经网络的运算,提供了一种基于忆阻器的存算一体化架构和并行加速方法,并在该系统架构上高效运行了卷积神经网络。

清华大学的存算一体化架构和并行加速方法专利

图1 忆阻器单元及阵列示意图

图一展示了忆阻器单元及阵列,是此专利所用的核心硬件结构。忆阻器是一种可以通过施加外部激励,调节其电导状态的非易失型器件。由忆阻器构成的阵列可以并行的完成乘累加计算,并同时进行计算和存储,因此基于这种特性可以对大量数据实现存算一体计算。由于乘累加是运行神经网络需要的核心计算任务。将忆阻器的的电导表示为权重值,可以实现高能效的神经网络运算,图1右侧展示的忆阻器阵列即为一个m行n列的神经网络权重矩阵。

清华大学的存算一体化架构和并行加速方法专利

图2 基于忆阻器阵列的卷积神经网络卷积计算与全连接计算示意图

卷积神经网络包括卷积层、下采样层、池化层和全连接层,每一层都需要做模块化的功能处理。在卷积层中,通过卷积核替代标量的权重,加上偏置量,并在每一层添加非线性激活函数,通过多个卷积层来解决较为复杂的问题。图2展示了基于忆阻器阵列的卷积计算和全连接计算示意图,用一个忆阻器阵列来实现一个卷积层的卷积计算,如对输入图像 “ 2”进行卷积处理,同时该卷积层包括多个卷积核,每个卷积核对应忆阻器阵列的一行,且每行的多个忆阻器分别用于表示一个卷积核的各个元素的值。而对于全连接型的计算,该忆阻器阵列的每一列用于接收全连接层的输入,各行用于提供全连接层的输出,每一行的多个忆阻器分别用于表示该行的输出对应的各个权重。

清华大学的存算一体化架构和并行加速方法专利

图3 基于忆阻器的神经网络并行加速示意图

基于忆阻器的神经网络并行加速示意图如图3所示,主要将多个第一忆阻器阵列并行地执行卷积层的操作,并将结果输出至第二功能层。通常卷积层需要多个子输入数据,可以按照任意顺序分别提供给多个第一忆阻器阵列,由于各子输入数据由忆阻器阵列进行卷积处理需要耗用的时间基本相同,因此加快卷积层的处理速度,即加快神经网络的处理速度,利用并行处理方式可以大大缩短处理时间。

清华大学的存算一体化架构和并行加速方法专利

图4 神经网络片外训练方法

图4展示了基于忆阻器阵列的神经网络片外训练方法,首先利用数学软件构建神经网络的数学模型,进而基于处理器和存储器等运行及训练上述数学模型,最后将训练好的数学模型的权重参数写入神经网络对应的忆阻器阵列,此时则可执行并行加速的计算过程,并同时对数据进行存储,实现存算一体加速。

随着计算存储一体化的发展趋势,基于忆阻器在硬件架构方面的革新,将数据存储单元和计算单元融合为一体,能显著减少数据搬运,极大提高计算并行度和能效。清华大学的钱鹤、吴华强教授团队搭建的这一基于多个忆阻器阵列的全硬件完整存算一体系统,并能够高效的运行卷积神经网络算法,并验证了图像识别功能,证明了存算一体架构全硬件实现的可行性,对今后AI算力瓶颈的突破有着极大意义。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4847

    浏览量

    108406
  • 忆阻器
    +关注

    关注

    8

    文章

    76

    浏览量

    20925
  • 存算一体
    +关注

    关注

    1

    文章

    122

    浏览量

    5263
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安克与知科技联合打造Thus一体AI音频芯片

    AI音频芯片,并邀请知科技创始人兼CEO王绍迪上台,分享双方联合研发Thus一体AI音频芯片的合作历程与产业思考。ANKER Thus
    的头像 发表于 05-27 10:03 159次阅读

    广西电信携手华为打造AI WAN一体化创新方案

    5月15日,以“筑牢数字生命线 智网强基兴八桂”为主题的2026世界电信和信息日报告会暨广西互联网大会于南宁隆重召开。会议期间,广西电信携手华为打造的AI WAN一体化方案创新能力精彩亮相。该
    的头像 发表于 05-18 17:16 769次阅读

    拆解一体技术瓶颈,亿铸科技如何逐个突破

    搬运,不仅造成带宽与时延瓶颈,还产生极高额外能耗。行业内个公认的观点是:当前 AI 计算中数据搬运成本已远超计算本身成本,存储墙、能耗墙成为制约力的两大核心瓶颈。
    的头像 发表于 05-14 09:51 257次阅读

    中国移动发布全国一体化力网技术创新体系

    近日,在2026移动云大会期间,中国移动举办了"强基铸・智启新程——全国一体化力网技术创新分论坛"。论坛聚焦AI时代力基础设施建设的核心命题,围绕硬核能力、网络融智、全域
    的头像 发表于 05-09 10:44 2019次阅读

    安克创新发布Thus™芯片:一体架构重塑AI音频新生态

    2026年4月22日,安克创新在深圳举办技术沟通会,正式推出全球首款基于NOR Flash技术的神经网络一体(CIM)AI音频芯片Thus™。这款芯片通过颠覆性架构设计,将AI峰值
    的头像 发表于 04-23 09:59 4663次阅读

    清华大学体育锻炼数字案例:基于蓝牙物联网的学生运动健康管理

    项目背景 清华大学作为中国顶尖的高等学府,贯秉承“无体育,不清华”的育人传统。从早期的“强迫运动”到著名的“为祖国健康工作五十年”口号,体育精神深深融入了清华的校园文化。然而,随着时
    发表于 04-15 17:31

    什么是安消一体化物联网系统云平台--安防消防一体化物联网系统云平台简称安消一体化云平台

    安防消防一体化系统、大型场馆消防安防一体化系统平台、大型场馆消防安防指挥中心一体化系统平台、工厂消防安防一体化系统平台
    的头像 发表于 04-14 08:59 692次阅读

    光储充一体化电站微电网系统建设的应用方案

    摘要: 光储充一体化电站作为新能源领域的创新模式,集成了太阳能发电和能量存储系统,旨在提高能源利用效率和响应能源需求的灵活性。这种模式对传统的能源供应和管理模式提出了挑战,同时也为能源行业的发展
    发表于 04-10 15:49

    清华大学电子工程系到访天数智芯参观交流

    近日,清华大学电子工程系、清华校友总会电子工程系分会、清华大学上海校友会电子信息专委会组织师生、校友代表到访天数智芯,开展深度校企交流活动,共话国产力创新与产学研协同发展。
    的头像 发表于 04-07 17:40 1693次阅读

    科技王绍迪:AI可穿戴需求爆发,一体成主流AI芯片架构

    集中在AI驱动的细分场景需求释放,知科技聚焦的一体芯片具备高技术壁垒,同时在AI发展需求下具备天然的架构优势和发展前景。
    的头像 发表于 12-23 09:34 1.1w次阅读
    知<b class='flag-5'>存</b>科技王绍迪:AI可穿戴需求爆发,<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>成主流AI芯片<b class='flag-5'>架构</b>

    华为AI WAN解决方案使能一体化新服务

    此前,9月24日-26日,2025年中国国际信息通信展览会在北京召开。期间,华为数据通信产品线运营商领域总裁刘凯在力基础设施论坛上发表了“AI WAN使能智能时代IP承载网一体化新服务”的主旨演讲。
    的头像 发表于 10-09 16:17 1433次阅读

    在TR组件优化与一体架构中构建技术话语权

    电磁兼容性、热管理在内的12项专业能力评估。\"这种评估体系,正是行业对技术人才的分级认证标准。 1.2 异构计算架构下的能力矩阵 一体架构
    发表于 08-26 10:40

    文看懂“一体

    今天这篇文章,我们来聊个最近几年很火的概念——一体。为什么会提出“
    的头像 发表于 08-18 12:15 1767次阅读
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>”

    缓解高性能一体芯片IR-drop问题的软硬件协同设计

    在高性能计算与AI芯片领域,基于SRAM的一体(Processing-In-Memory, PIM)架构因兼具计算密度、能效和精度优势成为主流方案。随着
    的头像 发表于 07-11 15:11 1743次阅读
    缓解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>芯片IR-drop问题的软硬件协同设计

    国际首创新突破!中国团队以一体排序架构攻克智能硬件加速难题

    2025 年 6 月 25 日,北京大学团队在智能计算硬件方面取得领先突破,国际上首次实现了基于一体技术的高效排序硬件架构 (A fas
    的头像 发表于 07-02 16:50 1056次阅读
    国际首创新突破!中国团队以<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>排序<b class='flag-5'>架构</b>攻克智能硬件<b class='flag-5'>加速</b>难题