0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于光学神经网络的机器视觉系统的缺点与应用

中科院长春光机所 来源:中国光学 作者:李竞曦 2021-04-08 11:43 次阅读

在自动化和智能技术发展日益成熟的今天,机器视觉系统(名词解释)在许多领域被广泛应用,包括自动驾驶汽车、智能制造、自动化手术和生物医学成像等。

这些机器视觉系统大多使用基于普通光学镜头模组的相机,在拍摄通常高达具有数百万像素的图像或视频后,通常将其馈送到如GPU等数字逻辑处理单元从而来执行一定的机器学习任务,例如物体识别、分类和场景分割等。

艺术效果图:基于光学神经网络的机器视觉系统

这种经典的机器视觉架构具有如下几个方面的缺点:

第一,高像素传感器拍摄带来大量信息使其难以实现极高速的图像或视频数字化存储和分析,尤其在使用移动设备和电池供电的设备时更是带来了能耗和性能的平衡问题;

第二,所捕获的图像通常包含许多对机器学习任务无用的冗余信息,带来了后端处理器某种程度上的性能负担,和资源浪费,从而导致在功耗和内存需求方面效率低下。

第三,在可见光的波长以外的电磁波段制造高像素数图像传感器(如手机相机中的传感器)具有很大的挑战性,且其成本十分昂贵,因而也限制了机器视觉系统在更长波段(如太赫兹)上的应用。

最近,加州大学洛杉矶分校(UCLA)的研究人员开发了一种新的单像素机器视觉系统,通过引入光学神经网络(名词解释)的方式规避了传统机器视觉系统的诸多缺点。

图1 来自加州大学洛杉矶分校的研究人员发明了一个新型单像素机器视觉系统,该系统可以将物体的空域信息编码为功率谱,从而实现对图像进行分类和重建。

该成果以Spectrally encoded single-pixel machine vision using diffractive networks为题发表在Science Advances。

研究人员借助深度学习技术,设计了一个由多个衍射层组成的衍射光学神经网络(Diffractive Optical Neural Networks)(拓展阅读),这些衍射层由计算机自动优化设计,可将经过的输入光场调制成一定的目标分布,从而能够执行计算和统计推断任务。

与常规的基于镜头模组的相机不同,该衍射光学神经网络以被宽带光照明的物体作为其输入,将物体的空域特征信息提取并编码到衍射光的光谱上,而后光谱信号由具有频谱探测能力的单像素超快传感器所收集。通过将物体对应的不同的类别分配给不同波长的光频谱分量,该系统仅使用单像素传感器探测到的输出光谱即可自动对输入对象完成分类,从而无需图像传感器阵列和后端数字处理。这种框架实现了全光学推理和机器视觉,在帧速率、内存需求和功耗效率方面具有明显优势,这些特点对于移动计算(名词解释)应用而言尤为重要。

图2. 该系统使用宽带光对物体进行照明。系统分类结果取决于单像素传感器测得的输出光功率谱上10个波长位置上最强的信号,其波长对应的类别即是分类预测结果。功率谱信号还可以输入到数字神经网络中被用于重建物体本身的图像。

为验证这一概念,研究人员通过使用单像素传感器和3D打印的衍射层对使用手写数字图像数据集(MNIST)的所构建的物体进行分类,在实验中证明了该框架在太赫兹波段下的性能。研究者基于提前选定的10个波长对实验系统进行了设计,这10个波长被逐一分配给输入物的不同类别(对应手写数字的0到9),对物的分类结果取决于传感器输出功率谱上10个波长位置上信号最强者的波长对应的类别。

实验系统中的单像素探测方案基于太赫兹时域光谱术实现,照明光为极短的太赫兹脉冲,网络的推理以光速在瞬时间完成。

最终,该系统在手写数字分类任务中实现了超过96%的分类精度,实验结果也与数值模拟非常吻合,证明了该单像素机器视觉框架在构建低延迟、高效的机器学习系统方面的可行性。除物体分类外,研究人员还将此衍射神经网络的输出与一个简单的全连接数字神经网络相连接,仅通过功率谱上10个波长处的信号强度来快速重建此输入物的图像,从而实现了图像的重建或“解压缩”。

总而言之,这种单像素对象分类和图像重建框架可以为新的机器视觉系统的开发铺平道路。该系统具有低像素数、低延迟、低功耗和低成本的特点,以高效、节省资源的独特优势通过将物体信息进行频谱编码来实现特定的推理任务,有望广泛应用于移动计算、边缘计算(名词解释)等领域。

此外,该新框架还可以扩展到各种光谱域测量系统,例如光学相干断层扫描、红外波段成像等,有助于构建基于衍射神经网络的光谱和空间信息编码集成的新型3D传感和成像方式。
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98720
  • 机器视觉系统

    关注

    1

    文章

    66

    浏览量

    18762
  • 深度学习
    +关注

    关注

    73

    文章

    5236

    浏览量

    119900

原文标题:机器视觉技术 | 基于光谱编码的传感与成像

文章出处:【微信号:cas-ciomp,微信公众号:中科院长春光机所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    神经网络算法怎么去控制温控系统,为什么不用PID控制?

    神经网络算法怎么去控制温控系统,为什么不用pid控制
    发表于 10-27 06:10

    卷积神经网络的经典模型和常见算法

    卷积神经网络是一种运用卷积和池化等技术处理图像、视频等数据的神经网络。卷积神经网络的工作原理类似于人类视觉系统,它通过层层处理和过滤,逐渐抽象出数据的特征,并基于这些特征进行分类或者回
    发表于 08-22 18:25 842次阅读

    人工神经网络和bp神经网络的区别

    人工神经网络和bp神经网络的区别  人工神经网络(Artificial Neural Network, ANN)是一种模仿人脑神经元网络结构和功能的计算模型,也被称为
    的头像 发表于 08-22 16:45 3428次阅读

    卷积神经网络模型的优缺点

    卷积神经网络模型的优缺点  卷积神经网络(Convolutional Neural Network,CNN)是一种从图像、视频、声音和一系列多维信号中进行学习的深度学习模型。它在计算机视觉
    的头像 发表于 08-21 17:15 2312次阅读

    卷积神经网络和深度神经网络的优缺点 卷积神经网络和深度神经网络的区别

    深度神经网络是一种基于神经网络机器学习算法,其主要特点是由多层神经元构成,可以根据数据自动调整神经元之间的权重,从而实现对大规模数据进行预
    发表于 08-21 17:07 2314次阅读

    卷积神经网络算法的核心思想

    广泛应用的神经网络模型。本文将从以下几个方面详细介绍CNN的核心思想和算法原理。 一、CNN简介 CNN是一种类似于人类视觉系统神经网络模型,它利用卷积层、池化层、全连接层等多个层次对输入数据进行处理和特征提取,最终实现特定目
    的头像 发表于 08-21 16:50 878次阅读

    卷积神经网络算法的优缺点

    卷积神经网络算法的优缺点 卷积神经网络是一种广泛应用于图像、语音等领域的深度学习算法。在过去几年里,CNN的研究和应用有了飞速的发展,取得了许多重要的成果,如在图像分类、目标识别、人脸识别、自然语言
    的头像 发表于 08-21 16:50 6390次阅读

    卷积神经网络算法是机器算法吗

    卷积神经网络算法是机器算法吗  卷积神经网络算法是机器算法的一种,它通常被用于图像、语音、文本等数据的处理和分类。随着深度学习的兴起,卷积神经网络
    的头像 发表于 08-21 16:49 517次阅读

    卷积神经网络层级结构 卷积神经网络的卷积层讲解

    卷积神经网络层级结构 卷积神经网络的卷积层讲解 卷积神经网络(Convolutional Neural Network,CNN)是一种基于深度学习的神经网络模型,在许多
    的头像 发表于 08-21 16:49 4382次阅读

    卷积神经网络三大特点

    是一种基于图像处理的神经网络,它模仿人类视觉结构中的神经元组成,对图像进行处理和学习。在图像处理中,通常将图像看作是二维矩阵,即每个像素点都有其对应的坐标和像素值。卷积神经网络采用卷积
    的头像 发表于 08-21 16:49 3577次阅读

    卷积神经网络概述 卷积神经网络的特点 cnn卷积神经网络的优点

    卷积神经网络概述 卷积神经网络的特点 cnn卷积神经网络的优点  卷积神经网络(Convolutional neural network,CNN)是一种基于深度学习技术的
    的头像 发表于 08-21 16:41 1931次阅读

    一套简单的机器视觉系统包括哪些部分?

    要回答这个问题,我们可以分解一下机器视觉系统,来逐个分析。一套最简单的机器视觉系统包括:视觉成像部分;图像处理部分;运动控制部分。1.
    的头像 发表于 08-21 08:08 762次阅读
    一套简单的<b class='flag-5'>机器</b><b class='flag-5'>视觉系统</b>包括哪些部分?

    卷积神经网络原理:卷积神经网络模型和卷积神经网络算法

    一。其主要应用领域在计算机视觉和自然语言处理中,最初是由Yann LeCun等人在20世纪80年代末和90年代初提出的。随着近年来计算机硬件性能的提升和深度学习技术的发展,CNN在很多领域取得了重大的进展和应用。 一、卷积神经网络模型 (一)卷积层(Convolution
    的头像 发表于 08-17 16:30 913次阅读

    机器视觉系统包括哪些

    机器视觉系统包括哪些 机器视觉系统就是利用机器代替人眼来作各种测量和判断。它是计算机学科的一个重要分支,它综合了
    发表于 06-29 11:33 586次阅读

    光学设计是机器视觉系统的关键

    机器视觉系统具有极大的吸引力,因为它能避免重复的测量,同时又能提高产量,增加响应时间。
    发表于 05-23 09:40 215次阅读
    <b class='flag-5'>光学</b>设计是<b class='flag-5'>机器</b><b class='flag-5'>视觉系统</b>的关键