0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

清华大学的存算一体化架构和并行加速方法专利

汽车玩家 来源:爱集微 作者:嘉德IPR 2020-03-14 11:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

清华大学基于多个忆阻器阵列的全硬件完整存算一体系统,能够高效的运行卷积神经网络算法,证明了存算一体架构全硬件实现的可行性,对今后AI算力瓶颈的突破有着极大意义。

集微网消息,近日来,清华大学微电子学研究所、未来芯片技术高精尖创新中心的钱鹤、吴华强教授团队与合作者在《自然》在线发表了题为“Fully hardware-implemented memristor convolutional neural network”的研究论文,报道了基于忆阻器阵列芯片卷积网络的完整硬件实现。该成果所研发的基于多个忆阻器阵列的存算一体系统,在处理卷积神经网络时的能效远高于GPU,大幅提升了计算设备的算力,成功实现了以更小的功耗和更低的硬件成本完成复杂的计算。

随着以人工智能为代表的信息技术革命兴起,基于各种深度神经网络的算法可以实现图像识别与分割、物体探测以及完成对语音和文本的翻译、生成等处理。然而深度神经网络算法是一类以数据为中心的计算,实现该算法的硬件平台需要具有高性能、低功耗的处理能力,这就对集成电路芯片技术提出了的更高要求。目前传统实现该算法的硬件平台是基于存储和计算分离的冯诺依曼架构,这种架构在计算时需要将数据在存储器件和计算器件之间来回搬移,因此在包含大量参数的深度神经网络的计算过程中,该架构的能效较低。为此,开发一种新型计算硬件来运行深度神经网络算法成为当前亟需解决的问题。

基于这种情况,清华大学团队于2019年11月7日提出一项名为“基于忆阻器的神经网络的并行加速方法及处理器、装置”的发明专利(申请号:201911082236.3),申请人为清华大学。此专利针对复杂神经网络的运算,提供了一种基于忆阻器的存算一体化架构和并行加速方法,并在该系统架构上高效运行了卷积神经网络。

清华大学的存算一体化架构和并行加速方法专利

图1 忆阻器单元及阵列示意图

图一展示了忆阻器单元及阵列,是此专利所用的核心硬件结构。忆阻器是一种可以通过施加外部激励,调节其电导状态的非易失型器件。由忆阻器构成的阵列可以并行的完成乘累加计算,并同时进行计算和存储,因此基于这种特性可以对大量数据实现存算一体计算。由于乘累加是运行神经网络需要的核心计算任务。将忆阻器的的电导表示为权重值,可以实现高能效的神经网络运算,图1右侧展示的忆阻器阵列即为一个m行n列的神经网络权重矩阵。

清华大学的存算一体化架构和并行加速方法专利

图2 基于忆阻器阵列的卷积神经网络卷积计算与全连接计算示意图

卷积神经网络包括卷积层、下采样层、池化层和全连接层,每一层都需要做模块化的功能处理。在卷积层中,通过卷积核替代标量的权重,加上偏置量,并在每一层添加非线性激活函数,通过多个卷积层来解决较为复杂的问题。图2展示了基于忆阻器阵列的卷积计算和全连接计算示意图,用一个忆阻器阵列来实现一个卷积层的卷积计算,如对输入图像 “ 2”进行卷积处理,同时该卷积层包括多个卷积核,每个卷积核对应忆阻器阵列的一行,且每行的多个忆阻器分别用于表示一个卷积核的各个元素的值。而对于全连接型的计算,该忆阻器阵列的每一列用于接收全连接层的输入,各行用于提供全连接层的输出,每一行的多个忆阻器分别用于表示该行的输出对应的各个权重。

清华大学的存算一体化架构和并行加速方法专利

图3 基于忆阻器的神经网络并行加速示意图

基于忆阻器的神经网络并行加速示意图如图3所示,主要将多个第一忆阻器阵列并行地执行卷积层的操作,并将结果输出至第二功能层。通常卷积层需要多个子输入数据,可以按照任意顺序分别提供给多个第一忆阻器阵列,由于各子输入数据由忆阻器阵列进行卷积处理需要耗用的时间基本相同,因此加快卷积层的处理速度,即加快神经网络的处理速度,利用并行处理方式可以大大缩短处理时间。

清华大学的存算一体化架构和并行加速方法专利

图4 神经网络片外训练方法

图4展示了基于忆阻器阵列的神经网络片外训练方法,首先利用数学软件构建神经网络的数学模型,进而基于处理器和存储器等运行及训练上述数学模型,最后将训练好的数学模型的权重参数写入神经网络对应的忆阻器阵列,此时则可执行并行加速的计算过程,并同时对数据进行存储,实现存算一体加速。

随着计算存储一体化的发展趋势,基于忆阻器在硬件架构方面的革新,将数据存储单元和计算单元融合为一体,能显著减少数据搬运,极大提高计算并行度和能效。清华大学的钱鹤、吴华强教授团队搭建的这一基于多个忆阻器阵列的全硬件完整存算一体系统,并能够高效的运行卷积神经网络算法,并验证了图像识别功能,证明了存算一体架构全硬件实现的可行性,对今后AI算力瓶颈的突破有着极大意义。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106781
  • 忆阻器
    +关注

    关注

    8

    文章

    75

    浏览量

    20722
  • 存算一体
    +关注

    关注

    1

    文章

    113

    浏览量

    4965
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为AI WAN解决方案使能一体化新服务

    此前,9月24日-26日,2025年中国国际信息通信展览会在北京召开。期间,华为数据通信产品线运营商领域总裁刘凯在力基础设施论坛上发表了“AI WAN使能智能时代IP承载网一体化新服务”的主旨演讲。
    的头像 发表于 10-09 16:17 855次阅读

    在TR组件优化与一体架构中构建技术话语权

    电磁兼容性、热管理在内的12项专业能力评估。\"这种评估体系,正是行业对技术人才的分级认证标准。 1.2 异构计算架构下的能力矩阵 一体架构
    发表于 08-26 10:40

    文看懂“一体

    今天这篇文章,我们来聊个最近几年很火的概念——一体。为什么会提出“
    的头像 发表于 08-18 12:15 933次阅读
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>”

    缓解高性能一体芯片IR-drop问题的软硬件协同设计

    在高性能计算与AI芯片领域,基于SRAM的一体(Processing-In-Memory, PIM)架构因兼具计算密度、能效和精度优势成为主流方案。随着
    的头像 发表于 07-11 15:11 867次阅读
    缓解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>芯片IR-drop问题的软硬件协同设计

    国际首创新突破!中国团队以一体排序架构攻克智能硬件加速难题

    2025 年 6 月 25 日,北京大学团队在智能计算硬件方面取得领先突破,国际上首次实现了基于一体技术的高效排序硬件架构 (A fas
    的头像 发表于 07-02 16:50 543次阅读
    国际首创新突破!中国团队以<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b>排序<b class='flag-5'>架构</b>攻克智能硬件<b class='flag-5'>加速</b>难题

    清华大学携手华为打造业内首个园区网络智能

    清华大学响应国家教育新基建战略,正在加速推进网络管理平台升级:为满足在线教育、协同创新及智慧校园的发展需求,为清华大学跻身世界一流大学创造基础条件,
    的头像 发表于 05-07 09:51 640次阅读

    苹芯科技 N300 一体 NPU,开启端侧 AI 新征程

    随着端侧人工智能技术的爆发式增长,智能设备对本地力与能效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制约端侧AI性能突破的关键掣肘。在这背景下,
    的头像 发表于 05-06 17:01 861次阅读
    苹芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一体</b> NPU,开启端侧 AI 新征程

    电机群网络管控一体化PLC-SCADA设计及应用

    一体化的PLC-SCADA系统。借助网络和总线实现对电机群传动系统的管理和控制。通过在纺织印染机构多单元电机传动中的应用,实践证明该控制方可靠、有效。纯分享帖,需要者可点击附件获取完整资料~~~*附件
    发表于 04-26 01:15

    2025年开放原子校源行清华大学站成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校源行”(清华站)在清华大学成功举办。
    的头像 发表于 04-22 16:46 755次阅读

    奇瑞汽车携手清华大学发布“分体式飞行汽车”专利

    继2024年10月在奇瑞全球创新大会上宣布三复合翼飞行汽车成功完成首航后,奇瑞再次带来飞行汽车领域的最新进展。日前,由奇瑞汽车股份有限公司与清华大学智能交通实验室共同申请的“分体式飞行汽车”专利正式公开,该
    的头像 发表于 02-20 09:14 800次阅读

    济南市中区一体化中心上线DeepSeek

    济南市中未来产业发展有限公司(简称“市中产发”)联合华为、北京昇腾和清昴智能基于市中区一体化中心(国家大学科技园节点)昇腾
    的头像 发表于 02-19 10:38 1163次阅读

    清华大学与华为启动“卓越中心”专项合作

    近日,清华大学与华为技术有限公司在清华大学自强科技楼正式签署合作协议,共同宣布“清华大学鲲鹏昇腾科教创新卓越中心专项合作”(简称“卓越中心”)正式启动。 出席签约仪式的有清华大学副校长
    的头像 发表于 02-18 14:11 1060次阅读

    清华大学自动系学子走进华砺智行研学交流

    近日,清华大学自动系的11名学子走进华砺智行研学交流,开展科技前沿探索的社会实践活动。
    的头像 发表于 02-13 10:03 696次阅读

    一体行业2024年回顾与2025年展望

    2024年,大模型技术的迅猛发展成为人工智能领域的核心驱动力,其对硬件力和存储效率的极致需求,促使一体技术在全球范围内迎来前所未有的关注与突破。随着模型参数规模的持续膨胀和应用场
    的头像 发表于 01-23 11:24 1677次阅读

    文看懂5G通感一体化

    一体化是链接物理世界和数字世界的桥梁。 数多用:创造新价值 通感一体获取的数据,通过不同力建模,进行数据加工,提供给不同客户。 价值变现:引发商用模式变更 以基站为平台,构建通感
    的头像 发表于 01-16 17:53 2785次阅读
    <b class='flag-5'>一</b>文看懂5G通感<b class='flag-5'>一体化</b>