0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员报告了一种构建光子张量核心的方法

倩倩 来源:百度粉丝网 2020-09-11 13:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

乔治华盛顿大学的研究人员报告了一种构建光子张量核心的方法,该方法利用相变光子存储器来实现神经网络(NN)。他们的新颖架构已于上周在《 AIP应用物理评论》(AIP Applied Physics Review)上在线报道,与传统的GPU和其他张量核心设备相比,有望实现性能提升和功耗优势。虽然已经探索了几种光子神经网络设计,但用于执行张量操作的光子张量核心尚未实现。

光子学[i]涵盖了广泛的光技术,涵盖了通过混合光电技术跨越光纤的各种技术。例如,光学互连技术是提高内存到处理器乃至处理器到处理器带宽的重要研究领域。高带宽和低功耗是光子学的吸引力。

在他们的 论文中, 用于机器学习的光子张量核心,Mario Miscuglio和Volker Sorger认为,在异构计算时代,基于光子的专用处理器具有增强电子系统的巨大潜力,并且可能在网络边缘设备以及其他设备中表现出色5G通信。例如,用于推理的预训练光子张量核心神经网络将消耗很少的功率。

Miscuglio告诉 HPCwire:“除了可以直接在光域中工作而增加的速度和带宽之外,还可以利用光纤中传输的信号的固有光学特性,使用光子架构的优势是执行推理的功耗更低这对于智能光学低功耗传感器很有用。”

广义上讲,神经网络大量使用矩阵向量乘法。毫不奇怪,在这种计算方式下,最新的GPU和TPU比CPU更好。研究人员在论文中很好地总结了挑战:

“对于提供高计算灵活性的通用处理器,这些矩阵运算是串行(即一次一次)进行的,同时需要连续访问高速缓存,因此产生了所谓的”冯·诺依曼瓶颈”。已经设计出了用于神经网络的专用架构,例如图形处理单元(GPU)和张量处理单元(TPU),以减少冯·诺依曼瓶颈的影响,从而实现尖端的机器学习模型。这些架构的范例是提供域特定性,例如对卷积进行优化或与CPU不同的是执行并行运算的矩阵向量乘法(MVM),从而并行部署 脉动算法

“ GPU具有针对矩阵数学运算而优化的数千个处理核心,可提供数十至数百个TFLOPS(层级浮点运算)的性能,这使GPU成为基于深度NN的AI和ML应用程序的显而易见的计算平台。GPU和TPU相对于CPU尤其有利,但是当用于对大型二维数据集(例如图像)实施深度NN执行推理时,它们非常耗电,并且需要更长的计算时间(》几十毫秒)。此外,用于不太复杂的推理任务的较小矩阵乘法[例如,美国国家标准与技术研究院数据库(MNIST)的手写数字的分类]仍然受到不可忽略的延迟的挑战,

他们提出了一种在光子学中实现的张量核心单元,它依赖于光子复用(WDM,波分复用)​​信号,“经过滤波后,使用基于在 波导上构图的Ge 2 Sb 2 Se 5导线的工程化多态光子存储器进行加权后加权。通过使用钨电极引起的焦耳热的电热切换,通过有选择地改变导线的相(非晶/晶体)来对光子存储器进行重新编程。如果需要,可以并行(几微秒)实现光子存储器编程,或者,该光子张量核心可以作为具有预设置内核矩阵的无源系统来运行。”

Miscuglio说,相变存储技术是一项至关重要的进步,“我们大脑中的每个神经元同时存储和处理数据。同样,在我们的体系结构中,我们使用的存储单元可以通过电子方式写入,并且可以存储多位权重,并且可以通过简单地让光线与材料相互作用来光学读取。我们的光子存储器依赖宽带透明相变材料,与其他基于更成熟的GST(锗-锑-碲)的实现方式不同,其特点是在电信波长下的非晶态损耗可忽略不计。”

“这很重要,因为它支持更深的架构,无需使用额外的激光源或放大器就可以解决更复杂的任务。我们还提出了一种多状态光子存储器(4位)架构,该架构可以使用电热加热器轻松擦除并写在芯片上。与依赖于片上或片外的繁琐的光学写入/擦除的其他实现方式不同,所有存储器均具有专用电路并可以并行写入。

Miscuglio说,该体系结构未映射特定的网络体系结构,而是神经网络的更通用的加速器。利用其模块化架构,可以“直接将光子TPU用于一系列操作,包括但不限于矩阵矩阵乘法,例如矢量矩阵乘法,卷积。这些代数运算是许多复杂的科学和社会问题的关键运算。”

“我们认为,从长期来看,数据中心将从这种架构中受益匪浅,因为它们处理的许多信息已经在光域中。我们认为它不会取代超级计算机,但可用作预处理单元,可与超级计算机协同工作,处理靠近网络边缘的数据,从而对信号进行分类和关联,以寻找特定的数据或模式块,从而减少数据流量。”

在撰写本文时,他们已经测试了多态低损耗光子存储设备,“显示出的性能与仿真非常吻合”。Miscuglio说:“我们开发了执行4×4矩阵乘法的单光子核心架构,目前正在开发第一代光子张量核心。关于时间表,我们计划在六个月至一年内对单核进行实验演示,并在未来几年内对功能齐全的多核张量处理器进行演示。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247045
  • 存储器
    +关注

    关注

    39

    文章

    7714

    浏览量

    170836
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106781
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    化工厂人员定位技术从系统架构到核心功能详解(

    化工厂人员定位技术以UWB高精度定位为核心,融合物联网与大数据,构建五层系统架构,实现人员实时定位、电子围栏预警、键SOS报警及应急联动,
    的头像 发表于 12-05 16:44 449次阅读
    化工厂<b class='flag-5'>人员</b>定位技术从系统架构到<b class='flag-5'>核心</b>功能详解(<b class='flag-5'>一</b>)

    研究人员复兴针孔相机技术以推动下代红外成像发展

    研究人员运用具有数百年历史的针孔成像原理,开发出一种无需透镜的高性能中红外成像系统。这种新型相机能够在大范围距离内和弱光条件下拍摄极其清晰的照片,使其在传统相机难以应对的场景中发挥重要作用。 研究
    的头像 发表于 11-17 07:40 57次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    进行量子态编码和量子比特构建。 优点:受环境影响小、抗噪声、相干时间长,可在室温下运行。 缺点:由于光子损耗,误差率高,难以集成。 ⑥金刚石色心法 利用金刚石中一种特殊形式的色心--氮空位中心(NV中心
    发表于 09-12 17:30

    在TR组件优化与存算体架构中构建技术话语权

    补偿 某国家级实验室的准入制度要求,核心研究人员必须通过\"量子信息工程师\"能力评估。这种认证确保了技术路线的可行性。 4.2 生物电子学交叉创新 在脑机接口领域,关键技术包括
    发表于 08-26 10:40

    一种无序超均匀固体器件的网格优化方法

    近日,天津大学精密仪器与光电子工程学院的光子芯片实验室研发了一种无序超均匀固体器件的网格优化方法,成果获中国发明专利(ZL202410659505.2)授权。
    的头像 发表于 07-28 16:10 727次阅读
    <b class='flag-5'>一种</b>无序超均匀固体器件的网格优化<b class='flag-5'>方法</b>

    无刷直流电机双闭环串级控制系统仿真研究

    Madlab进行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人员提出采用节点电流法对电机控制系统进行分析,通过列写m函数,建立BLDC控制系统真模型,这种方法实质上是一种
    发表于 07-07 18:36

    应用介绍 | 单光子计数拉曼光谱

    计数拉曼光谱?拉曼光谱作为一种强大的分析技术,能够通过研究光散射现象揭示样品的分子组成、化学结构及化学环境。当激光照射样品时,大多数光子发生弹性(瑞利)散射,仅有极
    的头像 发表于 05-20 16:07 623次阅读
    应用介绍 | 单<b class='flag-5'>光子</b>计数拉曼光谱

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出个模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 731次阅读

    光子 AI 处理器的核心原理及突破性进展

    电子发烧友网(文 / 李弯弯)光子 AI 处理器,作为一种借助光子执行信息处理与人工智能(AI)计算的新型硬件设备,正逐渐崭露头角。与传统基于晶体管的电子 AI 处理器(如 GPU、TPU)截然不同
    的头像 发表于 04-19 00:40 3633次阅读

    一种分段气隙的CLLC变换器平面变压器设计

    一种路径,采用磁集成方法,对1MHz双向CLLC变换器的变压器进行研究、设计与测试,通过优化PCB绕线方法、进行仿真优化,提出了一种分段气隙
    发表于 03-27 13:57

    一种永磁电机用转子组件制作方法

    。 本文着重阐述了这种电机转子使用胶粘剂对磁钢和芯轴直接粘接的制造方法,不需要进行同轴度机加工,并为这种制造方法提供了一种自动调心定位机构;并研究了磁钢零件的同轴度与产品最终装配后组件
    发表于 03-25 15:20

    EastWave应用:自动计算光子晶体透反率

    本案例使用“自动计算透反率模式”研究光子晶体的透反率,将建立简单二维光子晶体结构以说明透反率的计算方法。 模型示意图: 预览网格划分效果如下: 观察到下面的实时场: 记录得到数据
    发表于 02-28 08:46

    IEEE新突破:数学解法引领光子晶体激光器创新

    研究人员推导出用于评估PCSELs效率的方程式 电气电子工程师学会(IEEE)研究人员推导出光子晶体表面的二维耦合波方程,推动高效激光器的开发。 激光二极管利用半导体材料发光并通过不断反射(即“光学
    的头像 发表于 02-20 09:16 1072次阅读

    加州理工学院:研究一种无创监测女性激素的可穿戴生物传感器

    、摘要     女性激素(尤其是雌二醇)的个性化监测在生育和女性健康领域备受关注。然而,现有的方法通常需要侵入性血液抽取和/或大型分析实验室设备,难以在家中实施。在此, 作者报告了一种
    的头像 发表于 01-22 09:22 2094次阅读
    加州理工学院:<b class='flag-5'>研究</b><b class='flag-5'>一种</b>无创监测女性激素的可穿戴生物传感器

    研究人员利用激光束开创量子计算新局面

    演示设备 威特沃特斯兰德大学(Wits)的物理学家利用激光束和日常显示技术开发出了一种创新的计算系统,标志着在寻求更强大的量子计算解决方案方面取得了重大飞跃。 该大学结构光实验室的研究人员取得的这
    的头像 发表于 12-18 06:24 580次阅读
    <b class='flag-5'>研究人员</b>利用激光束开创量子计算新局面