0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

UCR学者用漩涡实现混合计算机视觉系统

新机器视觉 来源:机器之心 作者:机器之心 2020-12-31 09:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在本文中,来自加州大学河滨分校机械工程系的研究者通过应用光学漩涡证明了混合计算机视觉系统的可行性。该研究为光子学在构建通用的小脑混合神经网络和开发用于大数据分析的实时硬件方面的作用提供了新见解。

从医学诊断到自动驾驶再到人脸识别,图像分析在现代技术中无处不在。使用深度学习卷积神经网络的计算机彻底改变了计算机视觉。但卷积神经网络(convolutional neural network,CNN)通过从预训练数据中学习来对图像进行分类,然而这些数据通常会记住或发展某些偏见。此外,数据还易于受到对抗性攻击(以极细微且几乎察觉不到的图像扭曲出现)的干扰,从而导致做出错误的决策。这些缺点限制了卷积神经网络的用途。 提升图像处理算法能效和可靠性的一种方法是将常规计算机视觉与光学预处理器结合起来。这种混合系统可以用最少的电子硬件工作。由于光在预处理阶段即可完成数学函数而不会耗散能量,因此使用混合计算机视觉系统可以节省大量时间和能源。这种新方法能够克服深度学习的缺点,并充分利用光学和电子学的优势。

今年 8 月份,在一篇发表于 Optica 的论文中,加州大学河滨分校机械工程系助理教授 Luat Vuong 和博士生 Baurzhan Muminov 通过应用光学漩涡(具有深色中心点的旋绕光波),证明了混合计算机视觉系统的可行性。光学漩涡可以比喻为光绕着边缘和角落传播时产生的流体动力漩涡。

论文链接:https://www.osapublishing.org/optica/fulltext.cfm?uri=optica-7-9-1079&id=437484 研究表明,光学预处理可以降低图像计算的功耗,而电子设备中的数字信号识别相关性,提供优化并快速计算可靠的决策阈值。借助混合计算机视觉,光学器件具有速度和低功耗计算的优势,并且比 CNN 的时间成本降低了 2 个数量级。通过图像压缩,则有可能从存储和计算复杂性两方面大幅减少电子后端硬件。 Luat Vuong 表示:「本研究中的漩涡编码器表明,光学预处理可以消除对 CNN 的需求,比 CNN 更具鲁棒性,并且能够泛化逆问题的解决方法。

例如当混合神经网络学习手写数字的形状时,它可以重建以前从未见过的阿拉伯或日语字符。」 该论文还表明,将图像缩小为更少的高强度像素能够实现极弱光线条件下的图像处理。该研究为光子学在构建通用的小脑混合神经网络和开发用于大数据分析的实时硬件方面的作用提供了新见解。 论文内容简述 深度学习卷积神经网络通常涉及具有较高计算成本的多层、前向 - 后向传播机器学习算法。所以,在本文中,研究者展示了卷积神经网络的替代方案,该方案从其光学预处理、傅里叶编码模式中重建原始图像。该方案对计算的需求少得多,并且具有更高的噪声鲁棒性,因此适用于高速和弱光照条件下的成像。 具体而言,该研究引入带有微透镜阵列的漩涡相位变换,以及浅层密集的「小脑」神经网络结合。单次编码孔径方法利用了傅里叶变换螺旋相位梯度的相干衍射、紧凑表征和边缘增强。使用漩涡编码可以训练小脑对图像进行去卷积操作,其速度比使用随机编码方案快 5 至 20 倍,且在存在噪声的情况下获得了更大的优势。

一旦训练完成,小脑就可以从 intensity-only 的数据中重建对象,从而解决了逆映射问题,而无需在每个图像上执行迭代,也无需深度学习方案。通过漩涡傅立叶编码,研究者在 15W CPU 上以每秒几千帧的速度重建以低光通量(5nJ / cm^2)照明的 MNIST Fashion 对象。最终,研究者证明了使用漩涡编码器进行傅立叶光学预处理在达到相似准确率的情况下,速度比卷积神经网络快 2 个数量级。 漩涡的知识可以扩展为理解任意波型。当带有漩涡时,光学图像数据会以突出显示并混合光学图像不同部分的方式实现传播。研究者指出,使用浅层「小脑」神经网络进行的漩涡图像预处理(仅需运行几层算法)就可以代替 CNN 发挥作用。 Vuong 还表示:「光学漩涡的独特优势在于其数学和边缘增强功能。在本文中,我们证明了,光学漩涡编码器能够以类似于一种小脑神经网络从其光学预处理模式快速重建原始图像的方式生成目标强度数据。」 方法

图 1 描述了该研究的成像方案,其中对象 F(r,Φ) 的多个图像被收集到傅立叶域中:透过每个微透镜的光由不同的漩涡和透镜 mask 模式 M_m(r,Φ) 调制;摄像机检测到菲涅耳(Fresnel)传播、漩涡傅里叶变换(vortex-Fourier-transformed)强度模式的缩放模平方图像

。 其中,m 是漩涡拓扑电荷,r 和Φ是实域柱面坐标,而 u 和 v 是傅里叶平面笛卡尔坐标。漩涡傅里叶强度模式 F^~ 集中在相对较小的区域中,但随着 m 的增加,通常会呈越来越宽的甜甜圈形(图 1(b))。对象「实域」中的漩涡相位在空间上编码并破坏了傅立叶变换强度模式的平移不变性,如图 1(c) 所示。 此外,该研究将一些小图像数据集视为对象输入,并比较 F(r,Φ) 中的不同表征。对于每个正实值数据集图像 X,相位变化的映射如下公式所示:

其中,α_0 是对象相位移动的动态范围。这种映射很方便,因为信号功率不随选择的 X 改变。研究者还考虑了 X 闭塞或吸收信号时不透明对象,即,这会产生相似的趋势。 归根结底,该研究有三项主要创新:(1)用漩涡透镜进行光谱特征的边缘增强;(2)在没有相似学得数据集的情况下对图像进行快速逆重建;(3)取决于层激活的抗噪声能力。

原文标题:光学预处理与计算机视觉结合,UCR学者用漩涡实现混合计算机视觉系统

文章出处:【微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106891
  • 计算机
    +关注

    关注

    19

    文章

    7769

    浏览量

    92751
  • 机器视觉
    +关注

    关注

    163

    文章

    4739

    浏览量

    125168

原文标题:光学预处理与计算机视觉结合,UCR学者用漩涡实现混合计算机视觉系统

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    上海计算机视觉企业行学术沙龙走进西井科技

    12月5日,由中国图象图形学学会青年工作委员会(下简称“青工委”)、上海市计算机学会计算机视觉专委会(下简称“专委会”)联合主办,上海西井科技股份有限公司、江苏路街道商会承办的“上海计算机
    的头像 发表于 12-16 15:39 170次阅读

    使用代理式AI激活传统计算机视觉系统的三种方法

    当前的计算机视觉系统擅长于识别物理空间与流程中的事件,却难以诠释场景细节及其意义,也无法推理后续可能发生的情况。
    的头像 发表于 12-01 09:44 388次阅读

    机器视觉系统中工业相机的常用术语解读

    1、机器视觉系统机器视觉系统machinevisionsystem是通过对声波、电磁辐射等时空模式进行探测及感知,对所获取的图像进行自动处理、分析和测量,做出定性解释和定量分析,得到有关目标物体
    的头像 发表于 10-31 17:34 1019次阅读
    机器<b class='flag-5'>视觉系统</b>中工业相机的常用术语解读

    STM32计算机视觉开发套件:B-CAMS-IMX摄像头模块技术解析

    STMicroelectronics用于 STM32开发板的B-CAMS-IMX摄像头模块提供强大的硬件集,可处理多种计算机视觉场景和例。该模块具有高分辨率500万像素IMX335LQN
    的头像 发表于 10-20 09:46 833次阅读
    STM32<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>开发套件:B-CAMS-IMX摄像头模块技术解析

    机器视觉系统工业相机的成像原理及如何选型

    机器视觉系统是一种模拟人类视觉功能,通过光学装置和非接触式传感器获取图像数据,并进行分析和处理,以实现对目标物体的识别、测量、检测和定位等功能的智能化系统。其目的是让机器能够理解和解释
    的头像 发表于 08-07 14:14 1062次阅读
    机器<b class='flag-5'>视觉系统</b>工业相机的成像原理及如何选型

    利用边缘计算和工业计算机实现智能视频分析

    IVA的好处、实际部署应用程序以及工业计算机如何实现这些解决方案。一、什么是智能视频分析(IVA)?智能视频分析(IVA)集成了复杂的计算机视觉,通常与卷积神经网
    的头像 发表于 05-16 14:37 652次阅读
    利用边缘<b class='flag-5'>计算</b>和工业<b class='flag-5'>计算机</b><b class='flag-5'>实现</b>智能视频分析

    计算机网络入门指南

    计算机网络是指将地理位置不同且具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统、网络管理软件及网络通信协议的管理和协调下,实现资源共享和信息传递的
    的头像 发表于 04-22 14:29 1889次阅读
    <b class='flag-5'>计算机</b>网络入门指南

    工业相机与采集卡配套方案:构建高性能机器视觉系统的核心要素

    ,采集卡则负责将相机采集到的图像数据传输到计算机进行分析和处理。二者的配合效率和兼容性直接影响着整个机器视觉系统的性能和稳定性。因此,选择合适的工业相机与采集卡配套方案
    的头像 发表于 03-31 15:53 666次阅读
    工业相机与采集卡配套方案:构建高性能机器<b class='flag-5'>视觉系统</b>的核心要素

    曦智科技全球首发新一代光电混合计算

    2025年3月25日,曦智科技正式发布全新光电混合计算卡“曦智天枢”。曦智科技创始人兼首席执行官沈亦晨博士在发布现场表示:“曦智天枢首次实现了光电混合计算在复杂商业化模型中的应用,是曦智科技光电
    发表于 03-25 15:43 484次阅读
    曦智科技全球首发新一代光电<b class='flag-5'>混合计算</b>卡

    工业相机采集卡:机器视觉系统的关键枢纽

    工业相机采集卡,作为机器视觉系统中的核心组成部分,扮演着将图像传感器捕捉到的模拟或数字图像数据高效、可靠地传输至计算机进行后续处理的关键角色。其性能直接影响到整个系统的图像采集速度、图像质量、
    的头像 发表于 03-17 16:04 921次阅读
    工业相机采集卡:机器<b class='flag-5'>视觉系统</b>的关键枢纽

    基于玻色量子相干光量子计算机混合量子经典计算架构

    近日,北京玻色量子科技有限公司(以下简称“玻色量子”)与北京师范大学、中国移动研究院组成的联合研究团队提出一种基于相干光量子计算机混合量子-经典计算架构,结合量子计算范式和经典
    的头像 发表于 03-10 15:43 970次阅读
    基于玻色量子相干光量子<b class='flag-5'>计算机</b>的<b class='flag-5'>混合</b>量子经典<b class='flag-5'>计算</b>架构

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    等多种应用中。然而,这些计算机视觉应用可能很难实现最优化的延迟性能和处理速度,特别是在内存大小、电池容量和处理能力有限的移动设备上难度更高。 而 Arm KleidiCV 便能在其中大显身手。该开源库利用了最新 Arm CPU
    的头像 发表于 02-24 10:15 909次阅读

    AR和VR中的计算机视觉

    ):计算机视觉引领混合现实体验增强现实(AR)和虚拟现实(VR)正在彻底改变我们与外部世界的互动方式。即便是在引人入胜的沉浸式
    的头像 发表于 02-08 14:29 2181次阅读
    AR和VR中的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>

    棱镜——机器视觉系统中常见的重要配件

    棱镜——机器视觉系统中常见的重要配件
    的头像 发表于 01-15 17:36 864次阅读
    棱镜——机器<b class='flag-5'>视觉系统</b>中常见的重要配件

    云端超级计算机使用教程

    云端超级计算机是一种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在一起,通过网络向用户提供按需的计算服务。下面,AI部落小编为
    的头像 发表于 12-17 10:19 1015次阅读