0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用光速实现深度学习,探讨光学神经网络的应用

DPVg_AI_era 来源:未知 作者:胡薇 2018-09-09 10:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

UCLA研究人员利用3D打印打造“全光学深度衍射神经网络”,利用光的衍射路径识别目标,可实现实时的目标识别和分类任务,而且准确率相当高,网络构建成本不足50美元。

如果说GPU养大了深度学习,那么如今深度学习的胃口早已经超越了GPU。

当然,GPU在不断发展,也出现了TPU、IPU、MLU来满足这头巨兽。

深度学习对算力的需求没有止境,但受制于能耗和物理极限,基于硅基的电子元件虽然现在还能支撑,但远处那堵几乎不可逾越的高墙已然显现。

怎么办?

光速深度学习!

今天,Science发表了加州大学洛杉矶分校(UCLA)研究人员的最新研究:All-optical machine learning using diffractive deep neural networks,他们使用 3D 打印打造了一套 “全光学” 人工神经网络,可以分析大量数据并以光速识别目标。

论文地址:http://science.sciencemag.org/content/361/6406/1004

这项技术名为衍射深度神经网络(diffractive deep neural network,D²NN),它使用来自物体的光散射来识别目标。该技术基于深度学习的被动衍射层设计。

研究团队先用计算机进行模拟,然后用 3D 打印机打造出 8 平方厘米的聚合物层。每个晶圆表面都是不平整的,目的是为了衍射来自目标的光线。

衍射深度神经网络由一系列聚合物层组成,每层大约 8 平方厘米。利用网络区域内的光的衍射传播路径来识别目标。

研究人员使用 THz 级频率的光穿透 3D 打印的网络层。每一层网络由数万个像素组成,光可以通过这些像素传播。

研究人员为每类的目标分配像素,来自目标的光被衍射到已分配给该目标类型的像素上。这样,衍射深度神经网络就能够识别目标,其耗时与计算机 “看到” 目标所花费的时间相仿。

的。

D²NN: 光速实时学习,成本不到 50 美元

而随着来自不同目标的光通过 D²NN, 研究人员利用深度学习训练神经网络,以学习每个目标产生的衍射光图案。

“我们使用逐层制造的无源元件,并通过光的衍射将这些层相互连接起来,打造一个独特的全光平台,可以以光速执行机器学习任务。” 该研究团队负责人,加州大学洛杉矶分校教授 Aydogan Ozcan 表示。

“这就像一个由玻璃和镜子构成的复杂迷宫。光进入衍射网络,并在迷宫周围反射,直到其离开该区域为止。系统能够根据某目标产生的大部分光最终离开迷宫的路径,确定究竟是哪个目标。”Ozcan 说。

在实验中,研究人员将图像放在 THz 级频率的光源前。 D²NN 通过光学衍射对图像进行观察。研究人员发现,该设备可以准确识别手写的数字和衣服,这两类对象都是人工智能研究中的常用目标。

图为 D²NN 设备识别文本

在训练中,研究人员还该将设备作为成像的镜头,就像一般的相机镜头一样。

由于 D²NN 的组成可以由 3D 打印制造,成本低廉,可以构建规模更大、数量更多的层,制造出包含数亿个人工神经元(像素)的设备。规模较大的设备可以同时识别更多的目标,执行更复杂的数据分析。

D²NN 的组件成本低廉。研究人员表示,他们使用的 D²NN 设备成本不到 50 美元。

虽然这项研究使用的是 Thz 级光谱中的光,但 Ozcan 表示,也可以打造使用可见光、红外线或其他频率光谱的神经网络。他表示,除 3D 打印外,D²NN 也可以使用光刻或其他印刷技术打造。

全光学衍射深度神经网络(D²NN)的 3D 打印衍射板

D²NN的设计和性能:MNIST分类准确率达到91.75%

在论文中,研究人员介绍了D²NN框架的技术细节、实验和测试性能。

在D²NN全光学深度学习框架中,神经网络物理上由多层衍射表面(diffractive surfaces)形成,这些衍射表面协同工作以光学地执行网络可以统计学习的任意功能。虽然这个物理网络的推理和预测机制都是光学的,但其学习部分是通过计算机完成的。

研究者将这个框架称为衍射深度神经网络( diffractive deep neural network,D²NN),并通过模拟和实验证明了其推理能力。D²NN可以通过使用几个透射和/或反射层进行物理创建,其中给定层上的每个点都传输或反射进来的光波,每个点代表一个人工神经元,通过光学衍射连接到后续的层。如图1A所示。

图1:衍射深度神经网络D²NN

D²NN 中的人工神经元通过由通过振幅和相位调制的次级波连接到下一层的其他神经元。图1D是标准深度神经网络的一个类比,可以将每个点或神经元的传输或反射系数视为一个“bias”项,这是一个可学习的网络参数,在训练过程中使用误差反向传播方法进行迭代调整。

经过这一数值训练阶段, D²NN的设计就固定了,并且确定了各层神经元的传输或反射系数。这种 D²NN设计可以以光速执行所训练的特定任务,仅使用光学衍射和无源光学器件(passive optical components)或无需功率的层,从而创建一种高效、快速的方式来实现机器学习任务。

一般来说,每个神经元的相位和振幅可以是可学习的参数,在每一层提供复值调制(complex-valued modulation),这改善了衍射网络的推理性能。 对于phase-only调制的同调传输网络,每层可以近似为一个薄的光学元件(图1)。通过深度学习,在输入层馈送训练数据并通过光学衍射计算网络输出,每一层的神经元的phase value迭代调整(训练)来执行一个特定的函数。

在计算目标输出误差的基础上,通过误差反向传播算法优化网络结构及其神经元相位值。误差反向传播算法基于传统深度学习中的随机梯度下降法。

D²NN性能:MNIST手写数字数据集

为了演示 D²NN框架的性能,我们首先将其训练成一个数字分类器,对从0到9的手写数字进行自动分类(图1B)。

为了完成这项任务,我们设计了一个五层的D²NN,其中包含来自MNIST手写数字数据集的5.5万张图像(5000张验证图像)。我们将输入数字编码到D²NN输入域的幅值中,训练衍射网络将输入数字映射到10个检测器区域,每个检测器区域对应一个数字。分类标准是寻找具有最大光信号的检测器,相当于网络训练过程中的损失函数。

在训练之后,使用来自MNIST测试数据集的10000个图像(未用作训练或验证图像集)对D²NN数字分类器进行数值测试,并且实现了91.75%的分类精度(图3C)。

根据这些数值结果,我们将这个5层的D²NN 设计3D打印出来(下图),每一层的面积为8cm×8cm,然后在衍射网络的输出平面定义10个检测器区域(图1B)。

图2:3D打印的D²NN的实验测试

然后,我们使用0.4 THz的连续波光照来测试网络的推理性能(图2,C和D)。

每一层神经元的相位值用3D打印神经元的相对厚度进行物理编码。对这个5层的D²NN设计的数值测试显示,在 ~10000幅测试图像中,分类准确率达到91.75%(图3C)。

图3: D²NN手写数字识别器的性能

D²NN性能:Fashion-MNIST数据集

接下来,为了测试D²NN框架的分类性能,研究者使用了一个更复杂的图像数据集——Fashion-MNIST数据集,其中包含10个类别的时尚产品。

D²NN对Fashion-MNIST数据集的分类结果如下图所示。具有N = 5个衍射层的phase-only和complex valued的D²NN的分类精度分别达到81.13%和86.33%。

通过将衍射层的数量增加到N = 10,并将神经元的总数增加到40万,D²NN的分类精度提高到86.60%。对比而言,在已有研究中,基于卷积神经网络的标准深度学习,使用~890万可学习参数和~250万个神经元,Fashion-MNIST分类准确度的最高性能为96.7%。

光学神经网络的应用

光学电路深度学习是一项重大突破,而且其现实应用已经逐渐

根据光学领域权威期刊Optica的报道,美国斯坦福大学的研究人员已经证明,可以直接在光学芯片上训练人工神经网络。这一重大突破表明,光学电路可以实现基于电子的人工神经网络的关键功能,从而可以以更便宜、更快速和更节能的方式执行语音识别、图像识别等复杂任务。

不仅如此,斯坦福的另一组研究人员还研究出一套小型AI成像系统,采用双层光学-电子混合计算技术,成像精度和速度均达到电子计算处理器水平。具体说,研究人员在电子计算之前加上一层光学计算,这种AI成像系统在低光照条件下具备更强的成像能力,每个立体像素上的光电子密度最高可达几十个,同时节约了大量本该用于计算的时间和成本。

具体到这项研究,UCLA的研究团队表示,他们的 D²NN 设备可用于全光学图像分析、特征检测和对象分类任务,还可以实现使用 D²NN 执行任务的新相机设计和光学组件。

例如,使用该技术的无人驾驶汽车可以立即对停车标志作出反应,一旦收到从标志衍射来的光,D²NN 就可以读取标志信息。该技术还可用于对大量目标的分类任务,比如在数百万细胞样本中寻找疾病的迹象。

“这项研究为基于人工智能的被动设备提供了新机会,可以对数据和图像进行实时分析,并对目标进行分类。”Ozcan 说。“这种光学人工神经网络设备直观地模拟了大脑处理信息的方式,具备很高的可扩展性,可以应用到新的相机设计和独特的光学组件设计中,也可用于医疗技术、机器人、安全等领域。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4844

    浏览量

    108195
  • 深度学习
    +关注

    关注

    73

    文章

    5610

    浏览量

    124646

原文标题:Science重磅!用光速实现深度学习,跟GPU说再见

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    面向嵌入式部署的神经网络优化:模型压缩深度解析

    1.为什么需要神经网络模型压缩? 神经网络已经成为解决复杂机器学习问题的强大工具。然而,这种能力往往伴随着模型规模和计算复杂度的增加。当输入维度较大(例如长时序窗口、高分辨率特征空间)时,模型需要
    的头像 发表于 02-24 15:37 5482次阅读
    面向嵌入式部署的<b class='flag-5'>神经网络</b>优化:模型压缩<b class='flag-5'>深度</b>解析

    神经网络的初步认识

    日常生活中的智能应用都离不开深度学习,而深度学习则依赖于神经网络实现。什么是
    的头像 发表于 12-17 15:05 470次阅读
    <b class='flag-5'>神经网络</b>的初步认识

    自动驾驶中常提的卷积神经网络是个啥?

    在自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像处理中尤其常见,因为图像本身就可以看作是由像
    的头像 发表于 11-19 18:15 2267次阅读
    自动驾驶中常提的卷积<b class='flag-5'>神经网络</b>是个啥?

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别的神经网络
    发表于 10-22 07:03

    CICC2033神经网络部署相关操作

    在完成神经网络量化后,需要将神经网络部署到硬件加速器上。首先需要将所有权重数据以及输入数据导入到存储器内。 在仿真环境下,可将其存于一个文件,并在 Verilog 代码中通过 readmemh 函数
    发表于 10-20 08:00

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的神经结构,尽管这种微生物的
    的头像 发表于 09-28 10:03 1587次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、类脑芯片

    AI芯片不仅包括深度学细AI加速器,还有另外一个主要列别:类脑芯片。类脑芯片是模拟人脑神经网络架构的芯片。它结合微电子技术和新型神经形态器件,模仿人脑神经系统机选原理进行设计,
    发表于 09-17 16:43

    神经网络的并行计算与加速技术

    随着人工智能技术的飞速发展,神经网络在众多领域展现出了巨大的潜力和广泛的应用前景。然而,神经网络模型的复杂度和规模也在不断增加,这使得传统的串行计算方式面临着巨大的挑战,如计算速度慢、训练时间长等
    的头像 发表于 09-17 13:31 1311次阅读
    <b class='flag-5'>神经网络</b>的并行计算与加速技术

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    上来先来几个专有名词: ANN:人工神经网络 SNN:脉冲神经网络DNN:深度神经网络 神经网络设计灵感都是来自人类的大脑结构,都是由
    发表于 09-12 17:30

    如何在机器视觉中部署深度学习神经网络

    图 1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。 在讨论人工智能(AI)或深度学习时,经常会出现“神经网络
    的头像 发表于 09-10 17:38 1065次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>神经网络</b>

    无刷电机小波神经网络转子位置检测方法的研究

    摘要:论文通过对无刷电机数学模型的推导,得出转角:与三相相电压之间存在映射关系,因此构建了一个以三相相电压为输人,转角为输出的小波神经网络实现转角预测,并采用改进遗传算法来训练网络结构与参数,借助
    发表于 06-25 13:06

    神经网络专家系统在电机故障诊断中的应用

    摘要:针对传统专家系统不能进行自学习、自适应的问题,本文提出了基于种经网络专家系统的并步电机故障诊断方法。本文将小波神经网络和专家系统相结合,充分发挥了二者故障诊断的优点,很大程度上降低了对电机
    发表于 06-16 22:09

    神经网络RAS在异步电机转速估计中的仿真研究

    众多方法中,由于其结构简单,稳定性好广泛受到人们的重视,且已被用于产品开发。但是MRAS仍存在在低速区速度估计精度下降和对电动机参数变化非常敏感的问题。本文利用神经网络的特点,使估计更为简单、快速
    发表于 06-16 21:54

    基于FPGA搭建神经网络的步骤解析

    本文的目的是在一个神经网络已经通过python或者MATLAB训练好的神经网络模型,将训练好的模型的权重和偏置文件以TXT文件格式导出,然后通过python程序将txt文件转化为coe文件,(coe
    的头像 发表于 06-03 15:51 1520次阅读
    基于FPGA搭建<b class='flag-5'>神经网络</b>的步骤解析