0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何在机器视觉中部署深度学习神经网络

半导体芯科技SiSC 来源:半导体芯科技SiSC 作者:半导体芯科技SiS 2025-09-10 17:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

wKgZPGjBRySAT-H0AACMrEScqoo003.jpg

图 1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。

在讨论人工智能AI)或深度学习时,经常会出现“神经网络”、“黑箱”、“标注”等术语。这些概念对非专业人士而言往往难以理解,人们也常常误以为需要扎实的编程技能才能真正掌握并合理使用这项技术。事实上,这种印象忽视了该技术为机器视觉(乃至生产自动化)带来的潜力,因为深度学习并非只属于计算机科学家或程序员

从头开始:什么是深度学习?

作为机器学习的子集,深度学习基于多层神经网络,它们能够逼真地模拟人脑的复杂结构和过程,并独立做出决策。在全面的训练过程中,深度学习模型通过分析数据学习识别特定模式和关系。

那么,深度学习技术为何在机器视觉领域如此成功呢?因为机器视觉会产生海量的图像数据,这为神经网络的有效训练提供了完美基础。与此同时,用户也能从深度学习技术中获益:深度学习能提供的识别率达到了新的质量水平,这也使得全新的机器视觉自动化应用成为可能。

整体而言,深度学习为机器视觉注入了新的发展动力,因此越来越多人认为深度学习值得使用。许多大大小小的公司都在考虑引入AI或深度学习,但往往因某些顾虑而迟迟未有行动。实际上,使用该技术并不像他们想象的那么复杂,目前也有工具能简化深度学习的应用流程。

适配不同应用的深度学习方法

在落地实践中,最核心的问题是:你究竟想自动化什么任务?集成商、工厂运营商、机器制造商可使用的深度学习方法,正在不断增多。

(1)异常检测

异常检测能快速轻松地识别缺陷,使质量管理流程中的缺陷检测效率大大提高。其最大的优势在于:传统深度学习方法相比,该技术需要更少的训练数据—— 完整的训练只需 20~100 张图像。而且,异常检测仅需“正常图像”即可满足要求,这使训练数据集的生成速度大大加快。基于正常图像训练的异常检测模型,能够识别与训练图像的结构偏差(即异常),从而检测出此前未知的缺陷形态。

(2)全局背景异常检测

全局背景异常检测更进一步,它能识别全新的异常类型,如部件缺失、变形或排列错误。因此,缺陷检测不再局限于结构缺陷,还涵盖了逻辑异常,这为半导体制造中的印刷电路板检测、印刷验证等全新场景开辟了道路。

wKgZO2jBRySAVtLAAACWkm6oWiM192.jpg

编辑

图2:基于深度学习的全局上下文异常检测技术,可以实现半导体生产中印刷电路板的可靠检测。

(3)分类

分类利用图像数据将对象归属于特定类别或等级,例如“合格品”或“不良品”。这使得每张图像都能以一定概率确定其所属类别。

(4)目标检测

基于深度学习的目标检测技术,能定位目标的位置并识别其类别。该过程能够识别不同目标类别和实例的各种目标实体,包括它们在图像中的位置。

(5)分割

基于深度学习的分割有两种类型:语义分割和实例分割。

· 语义分割:对经过训练的目标、结构和缺陷进行像素级精确定位。在此过程中,图像中的每个像素都会被分配类别标签,并基于训练数据“教导”模型,使其能够对新图像中的每个像素的所属类别进行高概率预测。这种方法使得执行此前无法实现或仅能通过大量编程工作才能完成的检测任务成为可能。

· 实例分割:结合了语义分割和目标检测的双重优势,能以像素级精度为不同目标分配类别标签。该技术特别适用于物体紧密排列、相互接触或重叠的应用场景,典型应用包括从料箱中随机抓取散放工件(料箱随机抓取),以及识别和测量自然生长的结构。

(6)边缘提取

这是一种基于深度学习的可靠的创新性边缘提取方法,它能够从图像中大量可见的边缘中精准地提取目标边缘。该技术即使在低对比度或强噪声环境下也能稳定识别边缘,可提取传统边缘识别滤波器无法识别的边缘。该技术通常与基于规则的机器视觉方法结合使用。

wKgZPGjBRySAdRr4AABa3vfZRs4618.jpg

图 3A:使用深度学习的光学字符识别(OCR)示例,即深度 OCR。

wKgZO2jBRyWAV8N1AABXDhO3pqc035.jpg

图3B:未使用深度学习时,光学字符识别(OCR)的结果精度低于深度 OCR。

(7)深度 OCR(光学字符识别)

基于深度学习算法的 OCR 被称为深度 OCR,即使在挑战性条件下(如识别倾斜文本、变形字符、印在或蚀刻在反光表面上的字符,或高纹理彩色背景上的字符)也能输出可靠结果。深度 OCR 可以自动对字符分组以识别单词,避免相似字符的误判,从而提升识别性能。

(8)深度计数

深度计数可快速定位和计数大量目标,不仅基于部件形状,还通过深度学习整合颜色、图案或纹理等其他特征。其显著优势在于,即使目标由高反光或无定形材料制成,也能实现可靠计数,还能可靠记录大量相互接触或部分重叠的目标。因此,该技术非常适合食品饮料行业中各类产品的计数,以及螺母、螺栓等小物件的精准包装核验。

深度学习的最佳应用场景在哪里?

深度学习开辟了全新的应用领域,让更多不熟悉机器视觉或不愿自己编写算法的人,也能使用机器视觉。AI系统通常可通过自有图像文件进行设置,其优势在于:通过训练神经网络,AI系统往往能比传统算法输出更可靠的检测结果。例如,当所有目标外观完全相同时,传统的匹配算法才表现良好;但当数据存在大量变化时(如果蔬的自然差异,此时很难提前明确定义传统特征,如怎样的表面算合格?),AI系统则更具优势。AI系统的另一个应用场景是对质量标准要求极高的生产制造领域。

wKgZPGjBRyWARpIMAACGhmmYRGM863.jpg

图 4:深度计数可用于快速且可靠地对大量目标(如玻璃瓶)进行计数。

某些企业的生产线几乎零缺陷,因此无法为基于规则的系统提供缺陷样本图像——毕竟瑕疵可能万中无一,且缺陷形态事前无法预知。基于AI的异常检测技术此时便能大显身手:该技术无需预知缺陷特征,仅需学习良品特征即可建立检测模型。这类应用在传统规则编程框架下是无法实现的。

然而,实现完美机器视觉应用的最佳途径,在于将深度学习算法与基于规则的机器视觉技术双剑合璧。典型应用场景如下:企业利用AI进行预分类,以精准定位待测兴趣区域(ROI),再通过传统方法在该区域内执行高精度测量。这种协同策略不仅能提升整体检测效率,也能获得更准确的检测结果。

如何在机器视觉中启用深度学习?

要在机器视觉应用中部署深度学习,首先要构建经典的机器视觉硬件:包含工业相机、适配的光源及高性能计算设备(如配备高性能 CPUGPU的工控机)。而整套系统的核心是强大的机器视觉软件,这可以从 MVTec 等多家公司获取。

(1)深度学习训练中的图像数据优化准备

实施深度学习应用需首先完成训练图像的标注——即在图像中标记出模型应输出的目标信息,包括图像类别或物体位置坐标。配备直观用户界面的标注软件,即使是不具备编程技能的初学者也能轻松操作。进行数据准备时需注意:图像数据必须经过优化处理。

值得注意的是,某些深度学习技术(如异常检测等无监督方法)仅需“正常图像”即可训练,通常获取20至100幅良品图像即可满足需求(具体数量需视被检物体状态而定)。训练过程更可一键启动。

(2)窥探深度学习的“黑箱”

尽管深度学习常因决策过程不透明而受到诟病,但是一些最新的技术进展正在逐步揭示神经网络的内在运作机制。例如,通过热力图工具高亮图像中的决策关键区域(如图5),这是追踪或影响深度学习算法行为的一种方式。

wKgZO2jBRyWAeZIsAAAy8F3RnaU097.jpg

图5:热力图通过高亮图像中的决策依据区域,有效提升深度学习推理的透明度。

借助“分布外检测”(OOD)技术,可以在运行过程中识别由错误分类导致的意外行为,并采取相应措施。使用深度学习分类器时,系统通常会将未知目标分配到已学习的类别中,这可能会存在问题,尤其是在遇到之前从未见过的错误类型或异物时。这项新的深度学习功能,会在将未知目标分类到训练数据中未包含的范围时提醒用户。例如,若系统仅针对带红色标签或黄色标签的瓶子训练,当出现带绿色标签的瓶子时,会显示“分布外”消息,并附带 OOD 分数,以显示目标与已训练类别的偏离程度。

此外,还可以借助阈值来影响深度学习的结果。例如,为了进行异常检测,可以将阈值设置得很高,在这种情况下,你只会得到“正常”的结果。如果将阈值设置得较低,系统相应地会输出越来越少的 “正常” 结果,从而避免漏检。这使用户能够灵活且个性化地调整模型对异常情况的响应灵敏度。

在机器视觉中开启深度学习之路

如果企业想利用深度学习的诸多优势,就需要制定周全的策略,以目标导向的方式落地并长期应用这项技术。然而,与所有人工智能方法一样,深度学习也伴随着一定的复杂性。事实证明,机器视觉是这一背景下的关键技术——在该领域中,被证实的深度学习方法能够被高效且可获利地应用部署。

来源:半导体芯科技


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108180
  • 机器视觉
    +关注

    关注

    166

    文章

    4829

    浏览量

    126506
  • 深度学习
    +关注

    关注

    73

    文章

    5608

    浏览量

    124635
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能-Python深度学习进阶与应用技术:工程师高培解读

    深度学习的工程化落地,早已不是纸上谈兵的事。从卷积神经网络到Transformer,从目标检测到大模型私有化部署,技术栈不断延伸,工程师面临的知识体系也越来越庞杂。现根据中际赛威工程师
    的头像 发表于 04-21 11:01 319次阅读
    人工智能-Python<b class='flag-5'>深度</b><b class='flag-5'>学习</b>进阶与应用技术:工程师高培解读

    人工智能多模态与视觉大模型开发实战 - 2026必会

    大模型通常采用深度神经网络,尤其是卷积神经网络(CNN)及其变体。CNN 具有强大的特征提取能力,能够自动从图像中学习到不同层次的特征,从简单的边缘、纹理到复杂的物体形状和语义信息。通
    发表于 04-15 16:06

    面向嵌入式部署神经网络优化:模型压缩深度解析

    1.为什么需要神经网络模型压缩? 神经网络已经成为解决复杂机器学习问题的强大工具。然而,这种能力往往伴随着模型规模和计算复杂度的增加。当输入维度较大(例如长时序窗口、高分辨率特征空间)
    的头像 发表于 02-24 15:37 5453次阅读
    面向嵌入式<b class='flag-5'>部署</b>的<b class='flag-5'>神经网络</b>优化:模型压缩<b class='flag-5'>深度</b>解析

    穿孔机顶头检测仪 机器视觉深度学习

    顶头状态。 检测顶头算法 引入人工智深度学习技术,通过Keras实现卷积神经网络(CNN),用Numpy实现采集数据的训练,得到符合现场需求的模型,进一步提升检测的准确性和现场的适应性。 应用范围
    发表于 12-22 14:33

    神经网络的初步认识

    日常生活中的智能应用都离不开深度学习,而深度学习则依赖于神经网络的实现。什么是神经网络
    的头像 发表于 12-17 15:05 460次阅读
    <b class='flag-5'>神经网络</b>的初步认识

    自动驾驶中常提的卷积神经网络是个啥?

    在自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像处理中尤其常见,因为图像本身就可以看作是由像
    的头像 发表于 11-19 18:15 2249次阅读
    自动驾驶中常提的卷积<b class='flag-5'>神经网络</b>是个啥?

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别的神经网络
    发表于 10-22 07:03

    CICC2033神经网络部署相关操作

    在完成神经网络量化后,需要将神经网络部署到硬件加速器上。首先需要将所有权重数据以及输入数据导入到存储器内。 在仿真环境下,可将其存于一个文件,并在 Verilog 代码中通过 readmemh 函数
    发表于 10-20 08:00

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的神经结构,尽管这种微生物的
    的头像 发表于 09-28 10:03 1568次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    神经网络的并行计算与加速技术

    随着人工智能技术的飞速发展,神经网络在众多领域展现出了巨大的潜力和广泛的应用前景。然而,神经网络模型的复杂度和规模也在不断增加,这使得传统的串行计算方式面临着巨大的挑战,如计算速度慢、训练时间长等
    的头像 发表于 09-17 13:31 1299次阅读
    <b class='flag-5'>神经网络</b>的并行计算与加速技术

    无刷电机小波神经网络转子位置检测方法的研究

    摘要:论文通过对无刷电机数学模型的推导,得出转角:与三相相电压之间存在映射关系,因此构建了一个以三相相电压为输人,转角为输出的小波神经网络来实现转角预测,并采用改进遗传算法来训练网络结构与参数,借助
    发表于 06-25 13:06

    神经网络专家系统在电机故障诊断中的应用

    摘要:针对传统专家系统不能进行自学习、自适应的问题,本文提出了基于种经网络专家系统的并步电机故障诊断方法。本文将小波神经网络和专家系统相结合,充分发挥了二者故障诊断的优点,很大程度上降低了对电机
    发表于 06-16 22:09

    何在CentOS系统中部署ELK日志分析系统

    功能,使用户能够快速获取关键业务洞察。本文将详细介绍如何在 CentOS 系统中部署 ELK 日志分析系统,
    的头像 发表于 05-08 11:47 1167次阅读
    如<b class='flag-5'>何在</b>CentOS系统<b class='flag-5'>中部署</b>ELK日志分析系统

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    视觉巡线,展示了如何从数据采集、模型训练到机器人部署的完整流程。 值得注意的是,深度学习模型的实时性对机器人计算资源提出了较高要求,优化模型
    发表于 05-03 19:41