0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么需要分割?U-Net能提供什么?U-Net和自编码器的区别

新机器视觉 来源:新机器视觉 2023-11-25 11:38 次阅读

U-Net是一种卷积神经网络(CNN)方法,由Olaf Ronneberger、Phillip Fischer和Thomas Brox于2015年首次提出,它可以更好的分割生物医学图像。

一、为什么需要分割?U-Net 能提供什么?

大体说来,分割就是将一幅图像分割为若干个部分的过程,这可以让我们把图像中的目标或纹理分割出来。因此分割常常被用于遥感影像或者肿瘤检测等应用中。

传统上有很多方法可以实现这一过程,例如点、线和边缘检测方法,阈值分割法,基于区域的聚类,基于像素的聚类,形态学的方法等等。目前也出现很多利用卷积神经网络进行分割的方法,对于那些需要进行图像分割处理的更高级的任务,这种方法是不可或缺的。在本篇文章中,我们将仔细研究这样一个架构:U-Net。

我们知道,深度学习需要大量数据集来训练模型。但这有一定的难度,对于像目标分类这样问题我们常常不能提供足够的数据量。这里的“不能”,往往意味着时间、金钱以及硬件设备。

例如,我们不可能去用手机摄像头来收集生物医学图像,而是需要复杂系统的方法来收集;此外在数据标记过程中,仅仅依靠开发人员/工程师是不够的 , 更需要大量具备专业知识和经验的人员对相关图像进行分类,对于医疗诊断等高度专业化的领域尤其如此。

相比于传统模型,U-Net在架构和基于像素的图像分割方面更成功;特别地,它在有限数据集图像上更加有效。下面,我们通过对生物医学图像分析来实现该体系结构。

二、U-Net 的独特之处

我们知道,在模型中会使用池化层来对高和宽进行降维处理,简单来说池化就是用一个像素来代表一组元素,从而实现图像降维。

3c784274-8ace-11ee-939d-92fbcf53809c.jpg

最大和平均池。注意:池化可以有不同的方法,包括Max、Avg Pooling等。

3c8a68e6-8ace-11ee-939d-92fbcf53809c.jpg  

U-Net模型结构 U-Net,如上图所示,它的命名源自它的结构——网络结构可视化的结果正如一个字母“U”。U-Net 由收缩路径(左侧)和扩展路径(右侧)两部分组成!它的特殊之处在于结构后半部分的扩展路径。

此外,该网络没有使用全连接层,只采用了卷积层,每个标准的卷积层后面都紧跟着一个Relu激活函数层。

下面是conv 3×3+ReLU的具体过程:

3ca4d00a-8ace-11ee-939d-92fbcf53809c.jpg

下面是up-conv 2×2的具体过程:

3cb94cd8-8ace-11ee-939d-92fbcf53809c.jpg

需要注意,这里要在图像四周的边界区域中对称地添加像素,以便可以实现连续分割图像;使用这种策略,可以将图像完全分割。此外,填充(添加像素)方法对于将U-Net模型应用于大图像上也具有重要意义;如果不这样,GPU内存容量将限制分辨率。下图显示了我提到的镜像填充和分割的结果:

3cc9b4ec-8ace-11ee-939d-92fbcf53809c.jpg

三、U-Net 和自编码器的区别

为了理解UNet独特的结构,我们将传统的分割方法“自编码器”(autoencoder)架构与Unet进行简单地比较。 在传统的自动编码器结构中,输入信息的大小逐层递减。

3cdd5fa6-8ace-11ee-939d-92fbcf53809c.jpg

自编码器的模型 在这个结构中,编码器部分完成之后,解码器部分开始。线性特征表示也是在解码器部分学习的,特征的大小将逐渐增大,到了解码器的末尾,输出图像大小等于输入图像相等。

这种体系结构在保持输出大小方面是理想的,但有一个问题是,它对输入进行线性压缩,从而导致所有特性都无法传输的瓶颈。

这就是U-Net的不同之处。U-Net在解码器部分(网络的后半部分)采用反卷积,这种结构可以克服自编码器在特征传递过程中产生的特征丢失问题。

四、继续学习 U-Net

我们回到生物医学图像分割的案例。 生物医学图像中组织影像最常见的变化是变形(deformation)。我们可以模拟实际中的变形,通过弹性变形方法可以帮助我们扩充数据集,从而提高学习效果。

3cee86c8-8ace-11ee-939d-92fbcf53809c.jpg

弹性变形的可视化表示 此外,当同一类别的某些部分相互接触时,往往很难确定边界。因此,推荐使用 loss 函数中具有较大权重的值,同时也先从背景中分离要分割的信息。 由DIC(Differential Interference Contrast,差分干涉对比度)显微镜记录的HeLa细胞。a) 原始图像;b) 标记的分割结果,用不同的颜色标识 HeLa 细胞的不同个体;c) 创建的分割蒙版(黑白);d) 以像素为单位的权重损失图,以便于网络学习边缘像素。

五、Loss函数

Loss可以通过标准二值交叉熵(binary cross-entropy)和 Dice 损失计算,这是评估生物医学图像分割成功与否的常用性能标准。

3d0e6e20-8ace-11ee-939d-92fbcf53809c.png

3d2647d4-8ace-11ee-939d-92fbcf53809c.png

二值交叉熵和 Dice 损失 交并比(IoU) 是基于像素的评价标准,通常用于评估分割性能。这里考虑了目标矩阵与结果矩阵之间的不同像素比。这个度量与Dice计算也有关。

3d3a59fe-8ace-11ee-939d-92fbcf53809c.png

下面是IOU的可视化:

3d4975c4-8ace-11ee-939d-92fbcf53809c.jpg 

下面是输入的图像和标签

3d5cbad0-8ace-11ee-939d-92fbcf53809c.jpg

我们来看看与其他方法相比,U-Net在EM图像分割方面的表现:

3d7da100-8ace-11ee-939d-92fbcf53809c.png

下面这是U-Net在PhC-U373 (a-b)和DIC-HeLa (c-d) 数据集上的分割,看起来还是比较成功的:

3d9ceaa6-8ace-11ee-939d-92fbcf53809c.jpg

在这两个数据集的结果以及与先前研究的比较如下:

3dc5c570-8ace-11ee-939d-92fbcf53809c.png

当然,分割不仅仅用于医学图像。地球科学或卫星图像的遥感系统也使用分割,无人驾驶系统也是如此。毕竟,到处都有“模式”。

六、其他应用

1、TGS盐鉴定挑战

在地球各地区,地表下有大量的油气和盐层。不幸的是,很难知道大型盐矿藏在哪里。

专业的地震成像图需要专家来判断是否有盐体存在。这往往存在极大的主观性,不同专家往往会给出不同的结果。

TGS(地质学数据公司)有精确的地震图像和三维成像图,他们希望Kaggle的机器学习社区能够创建一种算法来自动地、准确地确定地下目标是否是盐,因此他们举办了一个TGS Salt Identification Challenge。

下面这就是U-Net在这个挑战赛中成功应用的案例:

3ddc8846-8ace-11ee-939d-92fbcf53809c.jpg

2、地图挑战-利用分割构建缺失地图

利用卫星影像确定地图区域是U-Net另一个应用领域。事实上,可以说,随着这一领域的发展而出现的应用将极大地促进测绘和环境工程师的工作。 这种方法不仅适用于国防工业,也适用于城市区域规划。例如,在建筑物检测竞赛中,U-Net取得平均精度0.943,平均灵敏度0.954的结果。

3df9cb7c-8ace-11ee-939d-92fbcf53809c.jpg3e13d364-8ace-11ee-939d-92fbcf53809c.jpg

地图挑战赛中Neptune.ML的结果

3、U-Net对其他深度学习方法的启示

U-Net对不同体系结构以及其他计算机视觉深度学习模型也具有极大的启发意义。 例如,ResNet的ResNet(RoR)概念就是一个例子。该结构可定义为U-Net体系结构的后半部分,适用于经典残差网络中的跳跃连接(skip connections)。

3e34b2b4-8ace-11ee-939d-92fbcf53809c.png

原始ResNet(左)-RoR方法(右) 从经典的ResNet模型架构可以看出,每个蓝色块都有一个跳过连接。在RoR 方法中,通过前面的连接将新的连接从输入添加到输出。在ResNet中有不同版本的RoR。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    41

    文章

    3360

    浏览量

    131537
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130562
  • 卷积神经网络

    关注

    4

    文章

    284

    浏览量

    11713

原文标题:图像分割中的深度学习:U-Net 体系结构

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    van-自然和医学图像的深度语义分割:网络结构

    :医学影像是具有多种模态的;可解释性:医生需要进一步指导病灶在哪一层,哪一层的哪个位置,分割结果求体积么?而且U-Net在自然图像分割也取
    发表于 12-28 11:03

    van-自然和医学图像的深度语义分割:网络结构

    :医学影像是具有多种模态的;可解释性:医生需要进一步指导病灶在哪一层,哪一层的哪个位置,分割结果求体积么?而且U-Net在自然图像分割也取
    发表于 12-28 11:06

    基于MLP的快速医学图像分割网络UNeXt相关资料分享

    1、基于MLP的快速医学图像分割网络UNeXt  方法概述  之前我们解读过基于 Transformer 的 U-Net变体,近年来一直是领先的医学图像分割方法,但是参数量往往不乐观,计算复杂,推理
    发表于 09-23 14:53

    一种基于Deep U-Net的多任务学习框架

    提出了一种基于Deep U-Net的多任务学习框架,用于GE-MRI左心房分割,该框架同时执行心房分割和消融前后分类。虽然论文已经很老了,但是改论文提出的多任务和后处理方法到现在还是可以
    发表于 11-10 15:35

    主要语义分割网络:FCN,SegNet,U-Net以及一些半监督方法

    我们将当前分类网络(AlexNet, VGG net 和 GoogLeNet)修改为全卷积网络,通过对分割任务进行微调,将它们学习的表征转移到网络中。然后,我们定义了一种新架构,它将深的、粗糙的网络层语义信息和浅的、精细的网络层的表层信息结合起来,来生成精确的
    的头像 发表于 06-03 09:53 10.5w次阅读

    一种基于对抗训练的图像翻译技术,为裸女们自动“穿”上比基尼

    化。此外,我们还采用了 U-Net 256 结构的生成器。U-Net 由一个带残余连接的自动编码器构成,它能够在相同的空间维度上进行残余操作。同样地,我们也采用 IN 正则化,并对编码器
    的头像 发表于 07-23 09:11 3419次阅读

    图像分割的背景知识

    U-Net是一种卷积神经网络,最初是为分割生物医学图像而开发的。当它被可视化的时候,它的架构看起来像字母U,因此被命名为U-Net。其体系结构由两部分组成,左侧为收缩路径,右侧为扩展路径。收缩路径的目的是获取上下文,而扩展路径的
    的头像 发表于 12-28 14:22 2281次阅读

    基于改进U-Net网络建立HU-ResNet模型

    针对混凝土结构表观裂缝检测准确率低、细节信息丢失及精度不髙等问题,提出一种利用HU-RεsNet卷积神经网络的混凝土表观裂缝检测方法。基于改进U-Net网络建立HU- Resnet模型,采用
    发表于 03-17 10:12 12次下载
    基于改进<b class='flag-5'>U-Net</b>网络建立HU-ResNet模型

    基于U-Net的多尺度循环卷积神经网络

    喉白斑属于癌前组织病变,准确检测该病灶对癌变预防和病变治疗至关重要,但喉镜图像中病灶边界模糊且表面反光导致其不易分割。为此,提出一种基于U-Net的多尺度循环卷积神经网络(MRU-Net)进行
    发表于 03-24 11:14 5次下载
    基于<b class='flag-5'>U-Net</b>的多尺度循环卷积神经网络

    利用变分推断进行分割置信度的预测

    在目前的文献中主要利用两种技术成功地解决了医学图像的分割问题,一种是利用全卷积网络(FCN),另一种是基于U-Net的技术。FCN体系结构的主要特点是在最后没有使用已成功用于图像分类问题的全连接层。另一方面,U-Net使用一种
    的头像 发表于 03-29 13:46 1719次阅读
    利用变分推断进行<b class='flag-5'>分割</b>置信度的预测

    利用可分离残差卷积和语义补偿的U-Net裂缝分割

    坝面缺陷检测是水利枢纽安全巡检的关键环节,但复杂环境下坝面图像存在干扰噪声大和像素不均衡等冋题造成坝面裂缝难以精细分割。提出一种利用可分离残差卷积和语义补偿的U-Net裂缝分割方法。在U-Ne
    发表于 05-24 16:40 8次下载

    一种高精度的肝脏图像自动分割算法

    在利用卷积神经网络分割肝脏边界较模糊的影像数据时容易丢失位置信息,导致分割精度较低。针对该问题,提出一种基于分水岭修正与U-Net模型相结合的肝脏图像自动分割算法。利用
    发表于 05-27 15:17 2次下载

    基于U-net分割的遥感图像配准方法

    在利用航拍遥感图像进行土地测量与变化检测时,需要对图像进行配准处理。为实现目标区域的高精度匹配,提出一种遥感图像配准方法。对图像进行U-net分割,以适用于小样本数据集的处理,针对不同区域特征的误差
    发表于 05-28 14:41 2次下载

    基于 U-Net 的医学影像分割算法

    分割,可以为疾病的精准识别、详细分析、合理诊断、预测与预防等方面提供非常重要的意义和价值。 在医学影像分割任务中,目前主要存在以下几个难点: 标注数据少。造成该问题的一个重要的原因是收集标注困难,手工标注医学影像是一个
    的头像 发表于 08-25 17:36 4273次阅读

    UNet++与Ronneberger的U-Net进行比较

          导读   使用一系列的网格状的密集跳跃路径来提升分割的准确性。   在这篇文章中,我们将探索UNet++: A Nested U-Net Architecture for Medical
    的头像 发表于 05-31 11:36 1053次阅读
    UNet++与Ronneberger的<b class='flag-5'>U-Net</b>进行比较