0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

图像分割的背景知识

新机器视觉 来源:新机器视觉 作者:新机器视觉 2020-12-28 14:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

一个很好的入门小短文,内容很全,适合上手。

在这篇文章中,我们将进入使用深度学习进行图像分割的世界。我们将讨论:

图像分割是什么以及图像分割的两种主要类型

图像分割结构

图像分割中使用的损失函数

你可以使用的框架

就让我们一探究竟吧。

什么是图像分割?

顾名思义,这是将图像分割为多个部分的过程。在这个过程中,图像中的每个像素都与一个对象类型相关联。图像分割主要有两种类型:语义分割和实例分割。

在语义分割中,所有相同类型的对象都使用一个类标签进行标记,而在实例分割中,相似的对象使用各自的标签。

图像分割结构

图像分割的基本结构包括编码器和解码器。

编码器通过滤波器从图像中提取特征。解码器负责生成最终输出,该输出通常是包含对象轮廓的分割掩码。大多数架构都有这种架构或它的变体。

让我们来看几个例子。

U-Net

U-Net是一种卷积神经网络,最初是为分割生物医学图像而开发的。当它被可视化的时候,它的架构看起来像字母U,因此被命名为U-Net。其体系结构由两部分组成,左侧为收缩路径,右侧为扩展路径。收缩路径的目的是获取上下文,而扩展路径的作用是帮助精确定位。

U-Net是由右侧的扩张路径和左侧的收缩路径组成的。收缩路径由两个3乘3的卷积组成。卷积之后是一个ReLU和一个2x2的最大池计算用于下采样。

你可以在这里找到U-Net的完整实现:https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/。

FastFCN —Fast Fully-connected network

在这个架构中,使用一个联合金字塔上采样(JPU)模块来替换膨胀卷积,因为它们消耗大量的内存和时间。在应用JPU进行上采样时,其核心部分采用全连接网络。JPU将低分辨率的feature map采样到高分辨率feature map。

如果你想动手实现一些代码,看这里:https://github.com/wuhuikai/FastFCN。

Gated-SCNN

这个架构由一个 two-stream CNN架构组成。在该模型中,使用一个单独的分支来处理图像的形状信息。利用形状流来处理边界信息。

实现参考代码:https://github.com/nv-tlabs/gscnn

DeepLab

在这种架构中,上采样滤波器的卷积用于涉及密集预测的任务。多尺度的目标分割是通过空间金字塔池实现的。最后,利用DCNNs来改进目标边界的定位。通过对滤波器插入零进行上采样或对输入特征图进行稀疏采样来实现卷积。

实现参考代码:https://github.com/fregu856/deeplabv3,https://github.com/sthalles/deeplab_v3

Mask R-CNN

在这个架构中,使用边界框和语义分割将每个像素划分为一组类别,对对象进行分类和局部化。对每个感兴趣的区域得到一个分割掩码,生成一个类标签和一个边界框作为最终输出。该架构是Faster R-CNN的扩展。Faster R-CNN由regions proposer和深度卷积网络和利局部检测器组成。

这里是COCO测试集中的一张图像的结果:

图像分割损失函数

语义分割模型在训练过程中通常使用一个简单的交叉分类熵损失函数。但是,如果你对获取图像的细粒度信息感兴趣,那么你需要用到稍微高级一点的损失函数。

我们来看看其中的几个。

Focal Loss

这种损失是对标准交叉熵的改进。这是通过改变它的形状来实现的,这样分配给分类良好的样本的损失就降低了。最终,这确保了没有类别不平衡。在这个损失函数中,交叉熵损失被缩放,随着对正确类的置信度的增加,缩放因子衰减为零。在训练时,比例因子会自动降低简单样本的权重,并聚焦于困难样本。

30040146-29d7-11eb-a64d-12bb97331649.png

Dice loss

这个损失是通过计算smooth dice coefficient得到的。这种损失是最常用的分割损失。

30239088-29d7-11eb-a64d-12bb97331649.png

Intersection over Union (IoU)-balanced Loss

IoU平衡分类损失的目的是增加高IoU样本的梯度,降低低IoU样本的梯度。这样提高了机器学习模型的定位精度。

3043a8c8-29d7-11eb-a64d-12bb97331649.png

Boundary loss

边界损失的一种变体应用于分割高度不平衡的任务。这种损失的形式是空间等高线上的距离度量,而不是区域。这种方法解决了高度不平衡的分割任务中区域损失的问题。

30610a12-29d7-11eb-a64d-12bb97331649.png

Weighted cross-entropy

在交叉熵的一种变体中,所有正样本都用一定的系数进行加权。它用于类别不平衡的场景。

30773f26-29d7-11eb-a64d-12bb97331649.png

Lovász-Softmax loss

该损失是对基于子模块损失凸Lovasz扩展的神经网络平均IoU损失的直接优化。

309a68fc-29d7-11eb-a64d-12bb97331649.png

其他值得一提的损失包括:

TopK loss,其目的是确保网络在训练过程中聚焦于困难样本上。

距离惩罚交叉熵损失,引导网络难以分割的边界地区。

敏感性-特异性(SS)损失,计算特异性和敏感性的均方差的加权和。

Hausdorff distance(HD) loss,估计了卷积神经网络的Hausdorff距离。

这只是在图像分割中使用的几个损失函数。想了解更多内容,看这里:https://github.com/JunMa11/SegLoss。

图像分割数据集

从哪里可以得到一些数据集来开始?让我们来看几个例子。

Common Objects in COntext — Coco Dataset

COCO是一个大型物体检测、分割和图像描述数据集。数据集包含91个类。它有25万个人标注了关键点。它的大小是37.57 GiB。它包含80个物体类别。它遵循Apache 2.0许可,下载链接:http://cocodataset.org/#download

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有9963个图像和20个不同的类。训练/验证集是一个2GB的tar文件。数据集下载:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/。

The Cityscapes Dataset

此数据集包含城市场景的图像。它可以用来评估城市场景中视觉算法的性能。数据集下载:https://www.cityscapes-dataset.com/downloads/。

The Cambridge-driving Labeled Video Database — CamVid

这是一个基于运动的分割和识别数据集。它包含32个语义类。数据集下载:http://mi.eng.cam.ac.uk/research/projects/VideoRec/CamVid/。

图像分割框架

现在你已经有了数据集,让我们介绍一些工具/框架,你可以使用它们来开始。

FastAI library- 给定一幅图像,该库能够创建该图像中对象的mask。

Sefexa Image Segmentation Tool - Sefexa是一个免费的工具,可以用于半自动图像分割,图像分析,创建ground truth

Deepmask- Deepmask由Facebook Research开发,是Deepmask和SharpMask的Torch实现。

MultiPath- 这是来源于A MultiPath Network for Object Detection的物体检测网络的Torch实现。

OpenCV- 这是一个开源的计算机视觉库,有超过2500个优化算法。

MIScnn- 这是一个医学图像分割开源库。它使用最先进的卷积神经网络和深度学习模型建立管道,只需几行代码。

Fritz- Fritz提供多种计算机视觉工具,包括用于移动设备的图像分割工具。

总结

本文为你提供了一些图像分割的背景知识,并为你提供了一些工具和框架,可以用于入门。

我们讨论了:

什么是图像分割,

图像分割架构,

图像分割损失,

图像分割工具和框架。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106809
  • 图像分割
    +关注

    关注

    4

    文章

    182

    浏览量

    18678
  • 数据集
    +关注

    关注

    4

    文章

    1230

    浏览量

    26047

原文标题:图像分割2020总结:结构,损失函数,数据集和框架

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    图像采集卡终极指南:从原理到选型

    视觉系统的运行效率。本文将从技术原理、核心分类、关键参数、主流应用到实操选型,全方位拆解图像采集卡,帮你形成完整的知识体系与选型逻辑。一、底层原理:图像采集卡如何
    的头像 发表于 11-19 15:54 214次阅读
    <b class='flag-5'>图像</b>采集卡终极指南:从原理到选型

    使用Otsu阈值算法将灰度图像二值化

    还是纯白,即利用此阈值将原图像分成前景、背景两个图象。不同阈值对于前景和背景图象的划分不同,一般来说,前景和背景图象的差别越大,表明划分的效果越好。在 Otsu 算法中,以类间方差来衡
    发表于 10-28 06:49

    手机板 layout 走线跨分割问题

    初学习layout时,都在说信号线不可跨分割,但是在工作中为了成本不能跨分割似乎也非绝对。 在后续工作中,跨分割的基础都是相邻层有一面完整的GND参考,跨分割发生在相邻的另外一层。 但
    发表于 09-16 14:56

    迅为RK3576开发板摄像头实时推理测试-ppseg 图像分割

    迅为RK3576开发板摄像头实时推理测试-ppseg 图像分割
    的头像 发表于 07-11 14:31 705次阅读
    迅为RK3576开发板摄像头实时推理测试-ppseg <b class='flag-5'>图像</b><b class='flag-5'>分割</b>

    如何将32个步进伺服驱动器塞进小型板材分割机中?

    板材分割机是工业制造中常见的装备。机器的内部空间狭小,如何将多达32个步进伺服驱动器安装在其中显得非常困难。本文将通过基于EtherCAT总线的插板式步进伺服驱动器剖析其破解之法!传统铣刀式板材分割
    的头像 发表于 07-08 11:37 360次阅读
    如何将32个步进伺服驱动器塞进小型板材<b class='flag-5'>分割</b>机中?

    【正点原子STM32MP257开发板试用】基于 DeepLab 模型的图像分割

    【正点原子STM32MP257开发板试用】图像分割 本文介绍了正点原子 STM32MP257 开发板基于 DeepLab 模型实现图像分割的项目设计。 DeepLab 模型 DeepL
    发表于 06-21 21:11

    【AIBOX 应用案例】通过 U²-Net 实现背景移除

    设计,高效散热,保障在高温运行状态下的运算性能和稳定性,满足各种工业级的应用需求。应用案例:背景移除BackgroundRemoval(背景移除)技术已成为图像处理
    的头像 发表于 06-11 16:32 516次阅读
    【AIBOX 应用案例】通过 U²-Net 实现<b class='flag-5'>背景</b>移除

    多光谱图像技术在苗期作物与杂草识别中的研究进展

    、劳动强度大、完全依赖人工主体的经验与知识,在大面积杂草苗情观测上,人工识别是无能为力的。遥感识别法则克服了人工监测的诸多弊端,可以在短时间内获得作物大范围的图像,自动识别田间杂草。 但是,由于遥感图像的空间和
    的头像 发表于 06-10 18:13 280次阅读

    基于LockAI视觉识别模块:C++图像采集例程

    本文主要演示如何使用LockAI视觉识别模块进行视频流的读取,同时使用Edit模块进行图像传输。基础知识讲解1.1OpenCV简介OpenCV(OpenSourceComputerVisionLibra
    的头像 发表于 04-30 18:23 564次阅读
    基于LockAI视觉识别模块:C++<b class='flag-5'>图像</b>采集例程

    国产替代进口图像采集卡:机遇、挑战与策略

    展现出独特的优势。本文将深入探讨国产替代进口图像采集卡的背景、机遇、挑战以及相应的应对策略,旨在为推动该领域的发展提供参考。一、国产替代的背景与必要性多年来,进口
    的头像 发表于 04-07 15:58 786次阅读
    国产替代进口<b class='flag-5'>图像</b>采集卡:机遇、挑战与策略

    labview调用yolo目标检测、分割、分类、obb

    labview调用yolo目标检测、分割、分类、obb、pose深度学习,支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    发表于 03-31 16:28

    安森美SiC Cascode JFET的背景知识和并联设计

    )关键参数和并联振荡的分析,以及设计指南。本文为第一篇,聚焦Cascode产品介绍、Cascode背景知识和并联设计。
    的头像 发表于 02-27 14:10 1540次阅读
    安森美SiC Cascode JFET的<b class='flag-5'>背景</b><b class='flag-5'>知识</b>和并联设计

    图像采集卡:现代图像处理技术的关键组件

    在现代科技快速发展的背景下,图像处理技术已成为信息技术领域不可或缺的一部分。图像采集卡,作为连接计算机与各种图像采集设备的重要硬件组件,扮演着至关重要的角色。它不仅涉及
    的头像 发表于 02-20 10:42 936次阅读
    <b class='flag-5'>图像</b>采集卡:现代<b class='flag-5'>图像</b>处理技术的关键组件

    FPGA上的图像处理算法集成与优化

    本文详细介绍了多种图像处理技术,包括RG/GB单通道提取、亮度和对比度调整、图像反转、均值滤波、高斯滤波、图像锐化、中值滤波、阈值分割、边缘检测(Sobel算子)、
    的头像 发表于 02-14 13:46 1160次阅读
    FPGA上的<b class='flag-5'>图像</b>处理算法集成与优化

    背景抑制光电开关的设计及应用

    和目标物体特性。 ·信号采集与分析 :接收电路中的光敏元件将反射光信号转换为电信号后,XD08M3232 单片机通过其模拟输入接口按一定时间间隔采集这些信号,并存储在数组或缓冲区中。然后运用背景抑制
    发表于 01-11 13:43