理解如何处理计算机视觉和深度学习中的图像数据-电子发烧友网

导读

包括了适用于传统图像的数据处理和深度学习的数据处理。

介绍:

在过去几年从事多个计算机视觉和深度学习项目之后，我在这个博客中收集了关于如何处理图像数据的想法。对数据进行预处理基本上要比直接将其输入深度学习模型更好。有时，甚至可能不需要深度学习模型，经过一些处理后一个简单的分类器可能就足够了。

最大化信号并最小化图像中的噪声使得手头的问题更容易处理。在构建计算机视觉系统时，应考虑使用滤波器来增强特征并使图像对光照、颜色变化等更加稳健。

考虑到这一点，让我们探索一些可以帮助解决经典计算机视觉或基于图像的深度学习问题的方法。相关的代码仓库：https://github.com/bikramb98/image_processing。

1. 先简单再深入:

在应用最新和最好的深度学习解决问题之前，请尝试经典的计算机视觉技术。特别是在数据可能稀缺的情况下，就像许多现实世界的问题一样。

检查计算图像像素的统计值（例如均值、峰度、标准差）是否会导致不同类别的统计值不同。然后可以在这些值上训练一个简单的分类器，例如 SVM、KNN，以在不同的类之间进行分类。

2. 增加图像信噪比：

在将它们输入深度学习模型之前，检查预处理技术是否增强了图像的主要特征并提高了信噪比。这将有助于模型获得更好的准确性。

使用阈值处理等技术、腐蚀和膨胀等噪声消除技术、高斯模糊（平滑边缘）和中值模糊（消除椒盐噪声）等模糊技术。

对于不同的问题，不同的运算可能在不同的顺序下有用。

通常的做法是多次使用特定运算符，如果可以增强特征，那就在几个步骤之后再次应用。

找到滤波器、阈值等不同kernel大小的最佳组合（其组合可能达到数百万！），可以产生产生最佳效果的图像，可以通过构建交互式滑块来帮助找到这些值的理想范围。

3. 直方图均衡

增强图像特征的另一种方法是使用直方图均衡化。直方图均衡化提高了图像的对比度。直方图均衡化的目的是使出现频率最高的像素值均匀分布。

让我们看看下面的例子。

可以看出，上图的对比度非常低。在这种情况下，重要的是要提高对比度，使图像的特征更清晰可见。OpenCV 提供了两种这样做的技术 —— 直方图均衡化和对比度受限自适应直方图均衡化 (CLAHE)。

应用直方图均衡化，图像的对比度确实有所提高。但是，它也会增加图像中的噪点，如下图中间所示。

这就是CLAHE 的用武之地。使用这种方法，图像被分成 m x n 网格，然后将直方图均衡应用于每个网格。可以使用交互式滑块找到理想的对比度阈值和网格大小，如下所示。

用于查找最佳阈值和图块大小值的交互式滑块

从左到右：原始图像、直方图均衡图像、CLAHE 后图像

4. 图像的颜色空间变换:

将图像转换到不同的颜色空间，例如 HSV，通常可以提供更好的信息来分割目标，用于目标跟踪等情况。通常，RGB 颜色空间对阴影、光照的轻微变化（影响目标的颜色）不稳健。对于使用经典计算机视觉进行目标跟踪等任务，由于上述原因，在稍有不同的环境中使用时，RGB 空间中经过调试的mask通常会失败。此外，一旦将图像转换为不同的空间（例如 HSV），分离通道通常有助于分割感兴趣的区域并消除噪声。如下图所示，一旦将图像转换为 HSV 空间并拆分通道，就可以更轻松地去除阴影并分割网球。

不同的颜色空间（RGB、HSV）及其分量拆分

5. 归一化图像:

如果将图像输入深度学习模型，则必须使用批归一化等技术对图像进行归一化，这将有助于标准化网络的输入。这将有助于网络学习得更快、更稳定。批量归一化有时也会减少泛化误差。

6. 进行有意义的增强:

在增强图像时，确保应用的增强技术保留图像的类别并且类似于现实世界中遇到的数据。例如，对狗的图像应用裁剪增强可能会导致增强后的图像不像狗。在某些目标使用旋转和翻转进行增强的情况下也是如此。在增强时更改图像属性（例如颜色）时要非常小心。此外，请确保扩充数据不会更改图像的标签。

始终检查增强图像是否有意义并反映现实世界。

随机裁剪等增强如何导致数据损坏的示例

7. 训练集和验证集的数据泄露：

确保相同的图像（比如原始图像和增强图像）不在训练集和验证集中同时出现是很重要的。这通常发生在训练验证集拆分之前就执行数据增强。忽略这一点可能会导致给出错误的模型指标，因为它会在训练期间从非常相似的图像中学习，这些图像也存在于验证集中。

8. 在测试集合验证集上需要包括所有类别：

确保测试集和验证集包含所有标签样本。这样模型指标反映的才是模型的真实表现。

以其中一个标签的样本数量明显较少的情况为例。执行随机训练集测试集拆分可能会导致更少标签的类根本不会出现在验证/测试集中。当训练好的模型被测试时，它不会在那个特定的类上被测试，模型指标也不会反映其性能的真实表现。

9. 后处理完整性检查:

模型训练好之后，执行一些完整性检查也很重要：

确保在多类分类器的情况下所有类的输出总和为 1。

确保在测试或部署模型时也应用训练期间应用于图像的预处理。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

计算机视觉

计算机视觉

+关注

关注
8

文章
1600

浏览量
45616
深度学习

深度学习

+关注

关注
73

文章
5237

浏览量
119910

原文标题：理解如何处理计算机视觉和深度学习中的图像数据

文章出处：【微信号：机器视觉沙龙，微信公众号：机器视觉沙龙】欢迎添加关注！文章转载请注明出处。

【我是电子发烧友】七步带你认识计算机视觉（Computer Vision）

以前不曾注意过的细节。 计算机视觉的实现基本过程为：计算机从图片中生成数学模型计算机图形在模型中对图像

发表于 06-14 21:06

计算机视觉/深度学习领域常用数据集汇总

、定位、检测等研究工作大多基于此数据集展开。Imagenet数据集文档详细，有专门的团队维护，使用非常方便，在计算机视觉领域研究论文中应用非常广，几乎成为了目前

发表于 08-29 10:36

图像处理与计算机视觉相关的书籍有哪些

图像处理与计算机视觉相关的书籍

发表于 05-20 13:58

请问计算机视觉与深度学习要看什么书？

计算机视觉与深度学习，看这本书就够了

发表于 05-21 12:43

用于计算机视觉训练的图像数据集介绍

用于计算机视觉训练的图像数据集

发表于 02-26 07:35

深度学习在计算机视觉领域图像应用总结精选资料下载

简单的回顾的话，2006年Geoffrey Hinton的论文点燃了“这把火”，现在已经有不少人开始泼“冷水”了，主要是AI泡沫太大，而且深度学习不是包治百病的药方。计算机视觉不是

发表于 07-28 08:22

深度学习与传统计算机视觉简介

文章目录1 简介1.1 深度学习与传统计算机视觉1.2 性能考量1.3 社区支持2 结论3 参考在计算机

发表于 12-23 06:17

深度学习是否会取代传统的计算机视觉？

理解传统的计算机视觉实际上真的有助于你更好的使用深度学习。例如，计算机

发表于 04-02 10:37 •5994次阅读

深度学习不能取代计算机视觉技术背后的真正原因

深度学习只是一种 计算机视觉工具，而不是包治百病的良药，不要因为流行就一味地使用它。传统的计算机视觉

发表于 04-05 11:37 •4552次阅读

深度学习在计算机视觉上的四大应用

计算机视觉中比较成功的深度学习的应用，包括人脸识别，图像问答，物体检测，物体跟踪。

发表于 08-24 16:16 •4073次阅读

用于计算机视觉训练的图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉

发表于 12-31 09:33 •2064次阅读

用于计算机视觉训练的图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉

发表于 02-12 16:13 •1164次阅读

机器学习和计算机视觉的前20个图像数据集

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉

发表于 01-28 07:40 •5次下载

计算机视觉中的九种深度学习技术

计算机视觉中仍有许多具有挑战性的问题需要解决。然而，深度学习方法正在针对某些特定问题取得最新成果。在最基本的问题上，最有趣的不仅仅是深度

发表于 08-21 09:56 •360次阅读

计算机视觉：AI如何识别与理解图像

计算机视觉是人工智能领域的一个重要分支，它致力于让机器能够像人类一样理解和解释图像。随着深度学习

发表于 01-12 08:27 •643次阅读