如何在OpenCV中使用基于深度学习的边缘检测-电子发烧友网

导读

分析了Canny的优劣，并给出了OpenCV使用深度学习做边缘检测的流程，文末有代码链接。

在这篇文章中，我们将学习如何在OpenCV中使用基于深度学习的边缘检测，它比目前流行的canny边缘检测器更精确。边缘检测在许多用例中是有用的，如视觉显著性检测，目标检测，跟踪和运动分析，结构从运动，3D重建，自动驾驶，图像到文本分析等等。

什么是边缘检测？

边缘检测是计算机视觉中一个非常古老的问题，它涉及到检测图像中的边缘来确定目标的边界，从而分离感兴趣的目标。最流行的边缘检测技术之一是Canny边缘检测，它已经成为大多数计算机视觉研究人员和实践者的首选方法。让我们快速看一下Canny边缘检测。

Canny边缘检测算法

1983年，John Canny在麻省理工学院发明了Canny边缘检测。它将边缘检测视为一个信号处理问题。其核心思想是，如果你观察图像中每个像素的强度变化，它在边缘的时候非常高。

在下面这张简单的图片中，强度变化只发生在边界上。所以，你可以很容易地通过观察像素强度的变化来识别边缘。

现在，看下这张图片。强度不是恒定的，但强度的变化率在边缘处最高。(微积分复习：变化率可以用一阶导数(梯度)来计算。)

Canny边缘检测器通过4步来识别边缘：

去噪：因为这种方法依赖于强度的突然变化，如果图像有很多随机噪声，那么会将噪声作为边缘。所以，使用5×5的高斯滤波器平滑你的图像是一个非常好的主意。

梯度计算：下一步，我们计算图像中每个像素的强度的梯度(强度变化率)。我们也计算梯度的方向。

梯度方向垂直于边缘，它被映射到四个方向中的一个(水平、垂直和两个对角线方向)。

非极大值抑制：现在，我们想删除不是边缘的像素(设置它们的值为0)。你可能会说，我们可以简单地选取梯度值最高的像素，这些就是我们的边。然而，在真实的图像中，梯度不是简单地在只一个像素处达到峰值，而是在临近边缘的像素处都非常高。因此我们在梯度方向上取3×3附近的局部最大值。

迟滞阈值化：在下一步中，我们需要决定一个梯度的阈值，低于这个阈值所有的像素都将被抑制(设置为0)。而Canny边缘检测器则采用迟滞阈值法。迟滞阈值法是一种非常简单而有效的方法。我们使用两个阈值来代替只用一个阈值：

高阈值 = 选择一个非常高的值，这样任何梯度值高于这个值的像素都肯定是一个边缘。

低阈值 = 选择一个非常低的值，任何梯度值低于该值的像素绝对不是边缘。

在这两个阈值之间有梯度的像素会被检查，如果它们和边缘相连，就会留下，否则就会去掉。

迟滞阈值化

Canny 边缘检测的问题：

由于Canny边缘检测器只关注局部变化，没有语义(理解图像的内容)理解，精度有限(很多时候是这样)。

Canny边缘检测器在这种情况下会失败，因为没有理解图像的上下文

语义理解对于边缘检测是至关重要的，这就是为什么使用机器学习或深度学习的基于学习的检测器比canny边缘检测器产生更好的结果。

OpenCV中基于深度学习的边缘检测

OpenCV在其全新的DNN模块中集成了基于深度学习的边缘检测技术。你需要OpenCV 3.4.3或更高版本。这种技术被称为整体嵌套边缘检测或HED，是一种基于学习的端到端边缘检测系统，使用修剪过的类似vgg的卷积神经网络进行图像到图像的预测任务。

HED利用了中间层的输出。之前的层的输出称为side output，将所有5个卷积层的输出进行融合，生成最终的预测。由于在每一层生成的特征图大小不同，它可以有效地以不同的尺度查看图像。

网络结构：整体嵌套边缘检测

HED方法不仅比其他基于深度学习的方法更准确，而且速度也比其他方法快得多。这就是为什么OpenCV决定将其集成到新的DNN模块中。以下是这篇论文的结果：

在OpenCV中训练深度学习边缘检测的代码

OpenCV使用的预训练模型已经在Caffe框架中训练过了，可以这样加载：

shdownload_pretrained.sh

网络中有一个crop层，默认是没有实现的，所以我们需要自己实现一下。

classCropLayer(object): def__init__(self,params,blobs): self.xstart=0 self.xend=0 self.ystart=0 self.yend=0 #Ourlayerreceivestwoinputs.Weneedtocropthefirs tinputblob #tomatchashapeofthesecondone(keepingbatchsizeandnumberofchannels) defgetMemoryShapes(self,inputs): inputShape,targetShape=inputs[0],inputs[1] batchSize,numChannels=inputShape[0],inputShape[1] height,width=targetShape[2],targetShape[3] self.ystart=(inputShape[2]-targetShape[2])//2 self.xstart=(inputShape[3]-targetShape[3])//2 self.yend=self.ystart+height self.xend=self.xstart+width return[[batchSize,numChannels,height,width]] defforward(self,inputs): return[inputs[0][:,:,self.ystart:self.yend,self.xstart:self.xend]]

现在，我们可以重载这个类，只需用一行代码注册该层。

cv.dnn_registerLayer('Crop',CropLayer)

现在，我们准备构建网络图并加载权重，这可以通过OpenCV的dnn.readNe函数。

net=cv.dnn.readNet(args.prototxt,args.caffemodel)

现在，下一步是批量加载图像，并通过网络运行它们。为此，我们使用cv2.dnn.blobFromImage方法。该方法从输入图像中创建四维blob。

blob=cv.dnn.blobFromImage(image,scalefactor,size,mean,swapRB,crop)

其中：

image：是我们想要发送给神经网络进行推理的输入图像。

scalefactor：图像缩放常数，很多时候我们需要把uint8的图像除以255，这样所有的像素都在0到1之间。默认值是1.0，不缩放。

size：输出图像的空间大小。它将等于后续神经网络作为blobFromImage输出所需的输入大小。

swapRB：布尔值，表示我们是否想在3通道图像中交换第一个和最后一个通道。OpenCV默认图像为BGR格式，但如果我们想将此顺序转换为RGB，我们可以将此标志设置为True，这也是默认值。

mean：为了进行归一化，有时我们计算训练数据集上的平均像素值，并在训练过程中从每幅图像中减去它。如果我们在训练中做均值减法，那么我们必须在推理中应用它。这个平均值是一个对应于R, G, B通道的元组。例如Imagenet数据集的均值是R=103.93, G=116.77, B=123.68。如果我们使用swapRB=False，那么这个顺序将是(B, G, R)。

crop：布尔标志，表示我们是否想居中裁剪图像。如果设置为True，则从中心裁剪输入图像时，较小的尺寸等于相应的尺寸，而其他尺寸等于或大于该尺寸。然而，如果我们将其设置为False，它将保留长宽比，只是将其调整为固定尺寸大小。

在我们这个场景下：

inp=cv.dnn.blobFromImage(frame,scalefactor=1.0,size=(args.width,args.height), mean=(104.00698793,116.66876762,122.67891434),swapRB=False, crop=False)

现在，我们只需要调用一下前向方法。

net.setInput(inp) out=net.forward() out=out[0,0] out=cv.resize(out,(frame.shape[1],frame.shape[0])) out=255*out out=out.astype(np.uint8) out=cv.cvtColor(out,cv.COLOR_GRAY2BGR) con=np.concatenate((frame,out),axis=1) cv.imshow(kWinName,con)

结果：

中间的图像是人工标注的图像，右边是HED的结果

文中的代码：https://github.com/sankit1/cv-tricks.com/tree/master/OpenCV/Edge_detection

英文原文：https://cv-tricks.com/opencv-dnn/edge-detection-hed/

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

边缘检测

边缘检测

+关注

关注
0

文章
91

浏览量
18099
OpenCV

OpenCV

+关注

关注
29

文章
611

浏览量
40762
深度学习

深度学习

+关注

关注
73

文章
5226

浏览量
119870

原文标题：基于OpenCV深度学习的边缘检测

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

如何在测试中使用ChatGPT

Dimitar Panayotov 在 2023 年 QA Challenge Accepted 大会上分享了他如何在测试中使用 ChatGPT。

发表于 02-20 13:57 •366次阅读

如何在Linux中使用htop命令

本文介绍如何在 Linux 中使用 htop 命令。

发表于 12-04 14:45 •532次阅读

如<b class='flag-5'>何在</b>Linux<b class='flag-5'>中使</b>用htop命令

深度学习技术与边缘学习技术的不同之处

如今，AI技术的广泛应用已经成为推动制造和物流领域自动化的核心驱动力。康耐视所推出的深度学习和边缘学习技术，这两种基于AI的技术，在工业自动化领域有着广泛的应用前景。然而，由于这两种技

发表于 11-17 10:44 •276次阅读

对于形状近似矩形但边缘有规则起伏的情况，可以使用OpenCV库中的approxPolyDP函数进行多边形拟合和矩形检测。

对于形状近似矩形但边缘有规则起伏的情况，可以使用OpenCV库中的approxPolyDP函数进行多边形拟合和矩形检测。 approxPolyDP函数通过在给定的点集上使用动态规划算法，计算出近似

发表于 11-01 09:23

openCV边缘检测原理是什么？

openCV是通过什么原理来实现边缘检测的

发表于 10-10 06:21

迅为RK3568开发板Scharr滤波器算子边缘检测

和边缘检测的三个图像进行展示实验步骤：首先进入到 ubuntu 的终端界面将“iTOP-3568 开发板\\\\03_【iTOP-RK3568 开发板】指南教程\\\\04_OpenCV 开发

发表于 10-09 11:03

迅为iTOP-RK3568开发板Sobel 算子边缘检测

(索贝尔)算子是计算机视觉领域的一种重要处理方法。主要用于获得数字图像的一阶梯度,常见的应用和物理意义是边缘检测。索贝尔算子把图像中每个像素的上下左右四领域的灰度值加权差,在边缘处达到极值从而

发表于 09-18 10:27

OpenCV库在图像处理和深度学习中的应用

本文深入浅出地探讨了OpenCV库在图像处理和深度学习中的应用。从基本概念和操作，到复杂的图像变换和深度学习模型的使用，文章以详尽的代码和解

发表于 08-18 11:33 •482次阅读

深度学习框架pytorch入门与实践

的。PyTorch是一个开源的深度学习框架，在深度学习领域得到了广泛应用。本文将介绍PyTorch框架的基本知识、核心概念以及如何在实践中使

发表于 08-17 16:03 •1189次阅读

OpenCV FFT模糊检测方法

在本教程中，您将学习如何使用OpenCV和快速傅里叶变换(FFT)在图像和实时视流中执行模糊检测。今天的教程是我上一篇关于OpenCV模糊检测

发表于 06-26 10:47 •480次阅读

如何进行图像边缘的检测

本期我们一起看看如何进行图像边缘的检测。边缘检测通常用于理解图像中的对象，帮助机器做出更好的预测。编写边缘

发表于 06-20 15:14 •722次阅读

康耐视深度学习实现高效血清质量检测

本期就为大家详细介绍一则康耐视深度学习技术，在样品前处理以及血液检测仪器上所涉及到的血清质量检测应用案例。当异常血液样本（黄疸、溶血、脂血）等不良血液误入到正常样本测试中，可能会出现污

发表于 05-26 16:21 •596次阅读

如何在OpenCV中使用基于深度学习的边缘检测？

在这篇文章中，我们将学习如何在OpenCV中使用基于深度学习的

发表于 05-19 09:52 •1658次阅读

深度学习边缘计算综述论文阅读笔记

这是一篇关于深度学习和边缘计算基础知识的综述，包含了深度学习DL的几种网络模型的介绍，边缘计算的

发表于 05-18 14:36 •0次下载

如何在OpenCV中使用基于深度学习的边缘检测？

边缘检测是计算机视觉中一个非常古老的问题，它涉及到检测图像中的边缘来确定目标的边界，从而分离感兴趣的目标。

发表于 05-18 10:10 •609次阅读