一文搞懂图像二值化算法-电子发烧友网

传统的机器视觉通常包括两个步骤：

预处理和物体检测。而沟通二者的桥梁则是图像分割（Image Segmentation）[1]。图像分割通过简化或改变图像的表示形式，使得图像更易于分析。

举个例子，食品加工厂新进了一批肉鸡，想通过视觉检测其美味程度。机器在预处理优化完图像之后，要先把图像中的鸡肉和背景分开，并对感兴趣的区域单独进行分析，才能做出快速准确的判断。

食品加工厂的视觉处理

然而，图像分割对愚蠢的AI来说并不容易。聪明的人类一眼就能看出下图中哪些东西能吃、哪些不能吃。但计算机要把这些东西分开却得花费一番功夫。

原图

图像分割结果

最简单的图像分割方法是二值化（Binarization）。

图像二值化（ Image Binarization）就是将图像上的像素点的灰度值设置为0或255，也就是将整个图像呈现出明显的黑白效果的过程。二值图像每个像素只有两种取值：要么纯黑，要么纯白。

彩色图、灰度图、二值图对比

由于二值图像数据足够简单，许多视觉算法都依赖二值图像。通过二值图像，能更好地分析物体的形状和轮廓。二值图像也常常用作原始图像的掩模（又称遮罩、蒙版，Mask）：它就像一张部分镂空的纸，把我们不感兴趣的区域遮掉。进行二值化有多种方式，其中最常用的就是采用阈值法（Thresholding）进行二值化。

在计算机视觉里，一般用矩阵来表示图像。也就是说，无论你的图片看上去多么好吃，对计算机来说都不过是个矩阵而已。

在这个矩阵里，每一个像素就是矩阵中的一个元素。在三通道的彩色图像中，这个元素是由三个数字组成的元组。

彩色三通道图像

而对于单通道的灰度图像来说，这个元素就是一个数字。这个数字代表了图像在这个点的亮度，数字越大像素点也就越亮，在常见的八位单通道色彩空间中，0代表全黑，255代表全白。

单通道的灰度图

阈值法是指选取一个数字，大于它就视为全白，小于它就视为全黑。就像教室里的灯管开关，我们轻轻地推动它，如果突然间超过了某个阈值，灯就啪的一声亮了。

根据阈值选取方式的不同，可以分为全局阈值和局部阈值。

全局阈值，指的是对整个图像中的每一个像素都选用相同的阈值。我们可以在Photoshop的图像—调整—阈值里体验这一操作：

Photoshop里的阈值

可以看到阈值色阶从1到255的移动过程中，图像变黑的区域越来越多。当阈值数字在某个特定范围内的时候，红米肠的轮廓清晰可辨。

正确的二值化使红米肠轮廓清晰可辨

在生产线环境下，光照是已知的，常常会设定一个固定的数字来作为全局阈值。但是在室外或者机器人比赛中，光照条件往往更加复杂。

同样是奥利奥冰激凌，在白天和晚上，摄像头看到的画面可能不太一样，常数阈值无法同时适应这两种情况。

明暗不同的画面

对于画面比较暗的晚上，我们需要一个比较低的阈值，比如说设定阈值为50，它在晚上能很清楚地把黑白两种颜色分开，但是到了白天就是一片白（左边）；如果我们把阈值设置得比较高，比如说172，在白天能顺利分割，但在晚上就是一片黑（右边）。我们需要能够适应复杂环境的算法。

左边阈值=50，右边阈值=172

其实，稍作分析我们可以发现，这张图像中的颜色差异还是比较明显的，只有深浅两种颜色。因此，无论是在白天还是黑夜，它的色阶直方图都应该是两个明显的波峰，分别代表深色和浅色的区域。只是色阶直方图在白天会整体向右偏移，而在夜晚整体向左偏移。

图像的色阶直方图

如果选择两个波峰之间的波谷作为阈值，就能轻松地把这两类像素分开。但是图像的直方图往往是不连续的，有非常多尖峰和抖动，要找到准确的极值点十分困难。

日本工程师大津展之为这个波谷找到了一个合适的数学表达，并于1979年发表[2]。这个二值化方法称为大津算法（Otsu’s method）。大津算法类似于一维Fisher判别分析的离散化模拟。通过穷举法找到一个阈值数字，把这些像素切成两类，使得这两类像素的亮度的类内方差最小。类内方差指的是两类像素的方差的加权和，这里权指的是这类像素点数量占整个图像像素点数量的比值。

也许你的画面不会只有两坨差异较大的颜色，比如这款雪糕的就有三个尖峰。

三色雪糕（取雪糕部位的直方图）

这时候，只需对大津算法稍加扩展也可以完成。对大津算法的多级推广成为多大津算法（multi Otsu method）[3]。

局部阈值（Local Method）又称自适应阈值（Adaptive Thresholding）。

比赛中常常会有聚光灯照在一个特定区域，产生局部受光、局部不受光的画面。

局部受光的图像

对于局部受光的图像进行全局阈值，可能会出现“无论设置什么阈值参数，都无法满足全图要求”的尴尬。比如上面这幅图像，直接进行全局阈值时，左上半边的寿司全都显露出来时，右下半边还是一片黑色。

局部受光图像的全局阈值处理

这个时候我们就要用到局部阈值来处理了。其实，人的眼睛也是自带了这一步操作的。我们判定一个东西颜色深浅，往往会受到物体周边的颜色影响，这也就是为什么黑人的牙齿看上去更白。

局部阈值法假定图像在一定区域内受到的光照比较接近。它用一个滑窗扫描图像，并取滑窗中心点亮度与滑窗内其他区域（称为邻域, neighborhood area）的亮度进行比较。如果中心点亮度高于邻域亮度，则将中心点标记为白色，否则标记为黑色。

局部阈值的滑窗

这里提到的是局部阈值的基本方法，对于实际使用中常见的其他局部阈值方法，请参阅Chow-Kaneko自适应阈值法[4]。

局部阈值的应用非常广泛，特别是对白纸黑字的处理非常有效。光学字符识别（OCR）和二维码扫描的算法中，很多都用了局部阈值操作。

比如下面这张二维码就是一张典型的局部受光图像：

局部受光的二维码

如果对这张图片采用全局阈值（例如下图采用大津算法进行分割），是无论如何都无法正确分割的。

全局方法不能处理局部受光图像

而采用局部阈值方法就能很好地分割图像。从图片里可以明显观察到，局部阈值方法对于一大片干净区域的细节比较敏感，所以纸面上多出了很多我们原本注意不到的斑点。

局部方法分割二维码

实际运用中，我们要根据需求选择不同的二值化方法，没有哪个方法是绝对完美的。

例如，在识别敌方机器人时，由于装甲片灯条是自发光物体，受环境光影响较小，为了提高程序运行效率，我们采用固定数字作为全局阈值：

基地自动反击

在能量机关的识别中，由于能量机关只有黑白两种颜色，我们采用了大津算法及其多种变体：

大能量机关各区域的二值图

而在空中机器人读取基地区二维码的时候又用到了局部阈值方法：

空中机器人识别基地

除了基于阈值的图像分割方法外，常用的分割方法还可以基于边缘（如Yanowitz-Bruckstein自适应阈值方法[5]）、区域（如区域生长算法[6]）等，它们在卫星图像处理、交通控制系统、工业生产监控、医疗影像等领域发挥着巨大的作用。

脑部组织图像分割

本文所述阈值方法的OpenCV实现，请参见博客：Python+OpenCV图像处理实验

项目效果

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4450

浏览量
90740
机器视觉

机器视觉

+关注

关注
160

文章
4039

浏览量
118271
二值化

二值化

+关注

关注
0

文章
13

浏览量
4199

原文标题：一文搞懂图像二值化算法

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

算法系列：基于 FPGA 的图像边缘检测系统设计（sobel算法）

，用这样的均值算法，可以把锐度降低。使得图像看上去更加自然，下面就有几幅图我们可以看出一些端倪：原图：平滑处理后：这里还是可以明显的感觉到不同的，没有好坏之分，就是第

发表于 03-26 16:40

一文带你了解FPGA直方图操作

是左边图像的直方图统计。实际用FPGA实现的时候一般会用到归一化的直方图，即不关心实际每个灰度值的具体值而是出现的概率。具体为假定

发表于 01-10 15:07

基于TIC6000的DSP教学实验箱操作教程：5-18 RGB24图像灰度转换（LCD显示）

用红（R）、绿（G）、蓝（B）三原色的组合来表示每个像素的颜色。一般情况下，RGB彩色图像灰度化有三种转化方案：（1）加权平均法（2）平均值法：对彩色图像的每个像素中的R、G、B三

发表于 01-04 15:04

FPGA图像处理之CLAHE算法

在FPGA图像处理--CLAHE算法(一)中介绍了为啥要用CLAHE算法来做图像增强。

发表于 01-04 12:23 •1465次阅读

FPGA图像处理-CLAHE算法介绍(一)

在介绍CLAHE算法之前必须要先提一下直方图均衡化，直方图均衡化算法是一种常见的图像增强算法，可以让像素的亮度分配的更加均匀从而获得一个比较好的观察效果。

发表于 01-02 13:32 •965次阅读

四轴PID算法：单环和串级，你搞懂了吗？

上述角度单环PID控制算法仅仅考虑了飞行器的角度信息，如果想增加飞行器的稳定性(增加阻尼)并提高它的控制品质，我们可以进一步的控制它的角速度，于是角度/角速度-串级PID控制算法应运而生。

发表于 12-11 17:35 •422次阅读

一张图搞懂为什么去耦电容要好几种容值？

一张图搞懂为什么去耦电容要好几种容值？

发表于 11-27 15:47 •240次阅读

了解这些就可以搞懂 IGBT

了解这些就可以搞懂 IGBT

发表于 11-24 15:47 •481次阅读

搞懂什么是电容器的等效串联电阻

搞懂什么是电容器的等效串联电阻

发表于 11-23 16:14 •851次阅读

FPGA图像处理算法有哪些

早之前的朋友知道我发过一个用chatgpt分析出来的 FPGA图像处理的知识树，里面包含了从色域，镜头，接口和算法。然后我就发现这个算法部分chatgpt 给我整理的比较乱，查询了一番，确实发现

发表于 09-12 09:59 •605次阅读

图像分割算法原理及工作流程

基于深度学习的图像分割算法属于图像处理领域最高层次的图像理解范畴。所谓图像分割就是把图像分割成具

发表于 08-18 15:48 •977次阅读

一文详解CNN

1 CNN简介 CNN即卷积神经网络(Convolutional Neural Networks)，是一类包含卷积计算的神经网络，是深度学习（deep learning）的代表算法之一，在图

发表于 08-18 06:56

遗传算法的基本原理基于遗传算法的图像分割

　　摘要：遗传算法是对生物进化论中自然选择和遗传学机理中生物进化过程的模拟来计算最优解的方法。遗传算法具有众多的优点，如鲁棒性、并行性、自适应性和快速收敛，可以应用在图像处理技术领域中图像

发表于 07-18 16:04 •1次下载

荐读：FPGA设计经验之图像处理

当前来的灰度值做为读RAM地址，读出RAM中对应灰度值的的统计值；第二步将读出结果加一并回写回RAM的当前地址中；第三步重复操作至当前

发表于 06-08 15:55

CMOS图像传感器的ISP算法

ISP，也称为图像信号处理器（Image Signal Processor），在CMOS图像传感器（如相机）中起着重要的作用。ISP从图像传感器接收原始图像数据（通常是在像素级别），然

发表于 05-28 11:39 •2129次阅读