0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是图像分割?图像分割的体系结构和方法

INDEMIND 来源:INDEMIND 2023-08-18 10:34 次阅读

图像分割(Image Segmentation)是计算机视觉领域中的一项重要基础技术,是图像理解中的重要一环。前端时间,数据科学家Derrick Mwiti在一篇文章中,就什么是图像分割、图像分割架构、图像分割损失函数以及图像分割工具和框架等问题进行了讨论,让我们一探究竟吧。

01 什么是图像分割?

顾名思义,这是将一个图像分割成多个片段的过程。在这个过程中,图像中的每个像素都与一个对象类型相关联。图像分割主要有两种类型:语义分割和实例分割。

在语义分割中,同一类型的所有对象都使用一个类标签进行标记,而在实例分割中,相似的对象使用各自独立的标签。

02 图像分割的体系结构

图像分割的基本结构包括编码器和解码器。

编码器通过过滤器从图像中提取特征。解码器负责生成最终的输出,通常是一个包含对象轮廓的分割掩码。大多数体系结构都有这种结构或其变体,看几个例子:

U-Net

U-Net是最初用于分割生物医学图像的卷积神经网络。可视化时,其架构看起来像字母U,因此名称为U-Net。

它的体系结构由两部分组成,左边部分是收缩路径,右边部分是扩展路径。收缩路径的目的是捕获上下文,而扩展路径的作用是帮助精确定位。

7abfd2a6-3cde-11ee-ac96-dac502259ad0.jpg

U-Net由右边的扩展路径和左边的收缩路径组成。收缩路径由两个3×3的卷积组成,卷积之后是一个整流的线性单元和一个用于降采样的两乘二最大池计算。

FastFCN —Fast Fully-connected network

在这种结构中,联合金字塔上采样(JPU)模块被用来代替扩展卷积,因为它们消耗大量的内存和时间。它的核心是一个全连接网络,同时使用JPU进行上采样。JPU将低分辨率特征图提升为高分辨率特征图。

Gated-SCNN

该架构由双流CNN架构组成。在此模型中,一个单独的分支用于处理图像形状信息。形状流用于处理边界信息。

你可以通过检查这里的代码来实现

DeepLab

在这种结构中,卷积与上采样滤波器用于涉及密集预测的任务。多个对象的分割是通过空间金字塔池来完成的。最后,用DCNNs改进对象边界的定位。通过插入零点或对输入特征图进行稀疏采样来对滤波器进行上采样,从而实现空洞卷积。

可以在PyTorch或TensorFlow上尝试其实现。

Mask R-CNN

在这种体系结构中,使用bounding box和语义分割对对象进行分类和定位,并将每个像素分类为一组类别。每个感兴趣的区域都有一个分割掩码,最终的输出是一个类标签和一个bounding box。该体系结构是Faster R-CNN的扩展,Faster R-CNN由提出区域的深度卷积网络和利用区域的检测器组成。

这是在COCO测试集上得到的结果的图像

03 图像分割损失函数

语义分割模型在训练过程中通常使用一个简单的交叉熵损失函数。但是,如果对获取图像的粒度信息感兴趣,则必须恢复到稍微高级一些的损失函数,来看几个例子:

Focal Loss

这种损失是对标准交叉熵准则的改进。这是通过改变其形状来实现的,使得分配给分类良好的示例的损失权重降低了。最终,确保不存在类不平衡。

在这个损失函数中,交叉熵损失是会随着缩放系数衰减为零而缩,训练时,比例因数自动降低了简单示例的权重,并将重点放在困难示例上。

7b7bfdc8-3cde-11ee-ac96-dac502259ad0.png

Dice loss

该损失是通过计算平滑dice coefficient函数获得的。这种损失是最常用的损失,是分割

问题。

7b98513a-3cde-11ee-ac96-dac502259ad0.png

Intersection over Union (IoU)-balanced Loss

IoU平衡分类损失的目的是增加高IoU样本的梯度,降低低IoU样本的梯度。从而提高了机器学习模型的定位精度。

7bb0f37a-3cde-11ee-ac96-dac502259ad0.png

Boundary loss

Boundary loss的一种变体应用于具有高度不平衡分段的任务。

这种损失的形式是空间轮廓而非区域上的距离度量。通过这种方式,它解决了高度不平衡的分割任务的区域损失所带来的问题。

7bd48fce-3cde-11ee-ac96-dac502259ad0.png

Weighted cross-entropy

在交叉熵的一个变体中,所有正例均按一定系数加权。它用于涉及类不平衡的方案。

7bea244c-3cde-11ee-ac96-dac502259ad0.png

Lovász-Softmaxloss

该损失基于子模块损失的convex Lovasz扩展,对神经网络中的intersection-over-union loss进行了直接优化。

7c05f906-3cde-11ee-ac96-dac502259ad0.png

其他值得一提的损失有:

TopK loss:其目标是确保网络在训练过程中专注于困难样本。

Distance penalized CE loss:它将网络引向难以分割的边界区域。

Sensitivity-Specificity (SS) loss:计算特异性和敏感性的均方差的加权和。

Hausdorff distance(HD) loss:可从卷积神经网络估计Hausdorff距离。

这些是在图像分割中使用的一些损失函数。了解更多,请查看

04 图像分割的数据集

Common Objects in COntext—Coco Dataset

COCO是一个大型的对象检测、分割和字幕数据集。数据集包含91个类。它有25万人,都有自己的关键点。它的下载大小是37.57 GiB。它包含80个对象类别。它在Apache 2.0的许可下可用,可以从这里下载。

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有20个不同的类,9963张图片。训练/验证集是一个2GB的tar文件。数据集可以从官方网站下载。

The Cityscapes Dataset

这个数据集包含城市场景的图像。该方法可用于评价视觉算法在城市场景中的性能。数据集可以从这里下载。

The Cambridge-driving Labeled Video Database — CamVid

这是一个基于动作的分割和识别数据集。它包含32个语义类。以下链接包含数据集的进一步说明和下载链接。

05 图像分割框架

如果准备好了数据集,那么来谈谈一些可用于入门的工具/框架。

FastAI库:给定一个图像,该库能够为图像中的对象创建掩码。

Sefexa图像分割工具:可用于半自动图像分割,图像分析和创建地面实况。

Deepmask:Facebook Research的Deepmask是DeepMask和SharpMask的Torch实现。

MultiPath:这是一个Torch实现,从“用于目标检测的多路径网络”中提取目标检测网络。

OpenCV :这是一个开放源代码的计算机视觉库,具有2500多种优化算法。

MIScnn:医学图像分割开源库。它允许在几行代码中使用最新的卷积神经网络和深度学习模型建立管道。

Fritz:提供了多种计算机视觉工具,包括用于移动设备的图像分割工具。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1073

    浏览量

    40158
  • 编码器
    +关注

    关注

    41

    文章

    3360

    浏览量

    131539
  • 计算机
    +关注

    关注

    19

    文章

    6649

    浏览量

    84534
  • 图像分割
    +关注

    关注

    4

    文章

    173

    浏览量

    17862
  • 函数
    +关注

    关注

    3

    文章

    3868

    浏览量

    61309

原文标题:干货丨没有想的那么难,10分钟了解图像分割方法及原理

文章出处:【微信号:gh_c87a2bc99401,微信公众号:INDEMIND】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于改进遗传算法的图像分割方法

    基于改进遗传算法的图像分割方法提出一种应用于图像分割的改进遗传算法,算法中引入了优生算子、改进的变异算子和新个体,避免了局部早熟,提高了收敛
    发表于 09-19 09:36

    图像的亮度矩和阈值分割

    图像的亮度矩和阈值分割:简要介绍图像的亮度矩以及在保持图像亮度矩不变的条件下对图像进行两级阉值分割
    发表于 10-26 11:22 22次下载

    PCB缺陷检测中图像分割算法

    图像分割图像处理中占有重要的地位,分割结果的好坏直接影响图像的后续处理。本文介绍了4种常用的图像
    发表于 06-16 15:31 0次下载
    PCB缺陷检测中<b class='flag-5'>图像</b><b class='flag-5'>分割</b>算法

    浅谈图像阈值分割技术

    图像分割是一种关键的图像技术,在理论研究和实际应用中都得到了人们的广泛重视。图像分割方法和种类
    发表于 01-08 16:11 0次下载

    图像分割—基于图的图像分割

    图像分割—基于图的图像分割图像分割—基于图的图像
    发表于 11-19 16:17 0次下载

    基于Matlab图像分割的研究

    图像分割图像处理过渡到图像分析这个过程中起着非常重要的作用,它是图像工程的核心,图像
    发表于 01-04 15:10 0次下载

    图像分割基础算法及实现实例

    图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的
    发表于 12-18 18:19 9117次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>分割</b>基础算法及实现实例

    图像分割评价方法研究

     阀值分割法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和
    发表于 12-19 09:13 3.1w次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>分割</b>评价<b class='flag-5'>方法</b>研究

    图像分割图像边缘检测

     图像分割的研究多年来一直受到人们的高度重视,至今提出了各种类型的分割算法。Pal把图像分割算法分成了6类:阈值
    发表于 12-19 09:29 1w次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>分割</b>和<b class='flag-5'>图像</b>边缘检测

    图像分割技术的原理及应用

    图像分割至今尚无通用的自身理论。随着各学科许多新理论和新方法的提出,出现了许多与一些特定理论、方法相结合的图像
    发表于 12-19 15:00 4w次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>分割</b>技术的原理及应用

    图像分割的基本方法解析

    本文详细介绍了图像分割的基本方法有:基于边缘的图像分割方法、阈值
    发表于 12-20 11:06 10.8w次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>分割</b>的基本<b class='flag-5'>方法</b>解析

    基于内容的图像分割方法综述

    方法、基于像素聚类的方法和语义分割方法这3种类型并分别加以介绍对每类方法所包含的典型算法,尤其是最近几年利用深度网络技术的语义
    发表于 01-02 16:52 2次下载
    基于内容的<b class='flag-5'>图像</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>综述

    深度学习中图像分割方法和应用

    介绍使图像分割方法,包括传统方法和深度学习方法,以及应用场景。 基于人工智能和深度学习方法的现
    的头像 发表于 11-27 10:29 2899次阅读

    机器视觉(六):图像分割

    基于阈值的分割方法是一种应用十分广泛的图像分割技术,其实质是利用图像的灰度直方图信息获取用于分割
    的头像 发表于 10-22 11:34 519次阅读
    机器视觉(六):<b class='flag-5'>图像</b><b class='flag-5'>分割</b>

    机器视觉图像分割方法有哪些?

    现有的图像分割方法主要分以下几类:基于阈值(threshold)的分割方法、基于区域的分割
    发表于 11-02 10:26 376次阅读
    机器视觉<b class='flag-5'>图像</b><b class='flag-5'>分割</b>的<b class='flag-5'>方法</b>有哪些?