0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语义分割方法发展过程

新机器视觉 来源:新机器视觉 作者:新机器视觉 2020-12-28 14:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

语义分割

目的:给定一张图像,我们要对这张图像上的每个pixel逐一进行分类,结果展示如下图:

上图中的实例分割是语义分割的延伸,要区别出相同类别的不同个体。

应用场景:无人驾驶、辅助医疗等。

语义分割方法发展过程:

1.灰度分割(Gray Level Segmentation)

语义分割的最简单形式是对一个区域设定必须满足的硬编码规则或属性,进而指定特定类别标签. 编码规则可以根据像素的属性来构建,如灰度级强度(gray level intensity). 基于该技术的一种分割方法是 Split and Merge 算法. 该算法是通过递归地将图像分割为子区域,直到可以分配标签;然后再合并具有相同标签的相邻子区域。

这种方法的问题是规则必须是硬编码的. 而且,仅使用灰度级信息是很难表示比如人类等复杂类别的. 因此,需要特征提取和优化技术来正确地学习复杂类别的特征表示。

2.条件随机场(Conditional Random Fields)

CRFs 是一类用于结构化预测的统计建模方法. 不同于分类算法,CRFs 在进行预测前,会考虑像素的邻近信息(neighboring context),如像素间的关系. 这使得 CRFs 成为语义分割的理想候选者. 这里介绍下 CRFs 在语义分割中的应用.

图像中的每个像素都是与有限的可能状态集相关. 在语义分割中,target 类别标签就是可能状态集. 将一个状态(或,label u) 分配给的单个像素 x 的成本(cost) 被称为一元成本(unary cost). 为了对像素间的关系进行建模, 还进一步考虑将一对标签(labels (u, v)) 分配给一对像素 (x, y),其被成为成对成本(pairwise cost). 可以采用直接相邻的像素对作为像素对(Grid CRF);也可以采用图像中所有的像素构建像素对(Denser CRF)。

图像中所有 unary cost 和 pairwise cost 的相加和作为 CRF 的能量函数(或损失函数,loss). 求解最小化即可得到较好的分割输出。

深度学习极大地简化了语义分割的流程(pipeline),并得到了较高质量的分割结果

3.FCN

FCN方法的提出成功的将深度学习方法成功的引入到了语义分割领域,由于要预测的图像是一个二维的表示,因此提出了全卷积网络用来抽取图像中的特征,将得到的高级语义特征上采样到指定的维度,从而得到了最终的预测结果,从而自然的形成了Encoder-Decoder框架,这也成为了语义分割领域中通用框架之一。

具体的模型图如下:

由于在Encoder中获取到图像的高级语义,但是其并不是最终分割的结果,因此作者采用转置卷积的方法将该高级特征上采样到指定的维度,从而得到最终的分割结果。由于直接上采样之后的结果并不好,因此在改论文中引入了跳跃模型就是将不同卷积层下获取到的特征相融合,从而改善模型的效果,其具体结构如下所示:

4.U-NET, SegNet 等

为了改善FCN中的弊端,随后提出了很多模型最经典的是U-Net,SegNet,但是他们的本质上并没有改变Encoder-Decoder模型的架构。

5.DeepLab系列

DeepLab的出现带来了一个新的方法就是扩展卷积(空洞卷积)方法,卷积层引入了一个称为 “扩张率(dilation rate)”的新参数,该参数定义了卷积核处理数据时各值的间距。其目的是为了扩大模型的感受野,使其能够感受到更大范围下的特征信息。具体的体现如下所示:

扩展卷积方法的提出让人们可以去除Encoder-Decoder框架的限制。随后deeplab算法的改进也提出了例如多尺度学习的通则红描述方法(ASPP等)

6.NOW

面对监督式方法---最近的方法大家更注重于实时的语义分割任务,也就是轻量级的语义分割网络的设计。当然还有一些其他的方法,例如针对不同的领域设计不同的语义分割网络、改进上采样方法等。

面对弱监督方法---目前出现了很多弱监督方法,就是通过学习图像分类的数据集(image-level tag)中的信息,来完成语义分割这种密度预测的任务。当然还有使用框架注释来标注数据(bounding-boxes tag)的。

语义分割领域中困难的地方:

1、数据问题:分割不像检测等任务,只需要标注一个类别就可以拿来使用,分割需要精确的像素级标注,包括每一个目标的轮廓等信息,因此使得制作数据集成本过高;

2、计算资源问题:现在想要得到较高的精度的语义分割模型就需要使用类似于ResNet101等深网络。同时,分割预测了每一个像素,这就要求feature map的分辨率尽可能的高,这都说明了计算资源的问题,虽然也有一些轻量级的网络,但精度还是太低了;

3、精细分割:目前的方法中对于图像中的大体积的东西能够很好的分类,但是对于细小的类别,由于其轮廓太小,从而无法精确的定位轮廓,造成精度较低;

4、上下文信息:分割中上下文信息很重要,否则会造成一个目标被分成多个part,或者不同类别目标分类成相同类别;

评价指标:

1、执行时间:速度或运行时间是一个非常有价值的度量,因为大多数系统需要保证推理时间可以满足硬实时的需求。然而在通常的实验中其影响是很不明显的,并且该指标非常依赖硬件设备及后台实现,致使一些比较是无用的。

2、内存占用:在运行时间相同的情况下,记录系统运行状态下内存占用的极值和均值是及其有价值的。

3、精确度:这里指的是逐像素标记的精度测量,假设共有k个类(从l0到lk其中有一个类别是属于背景的。),Pij表示本属于i类但是被预测为j类的像素个数,Pii表示为真正分对类的数量,而Pij与Pji分别被称为假正样本和假负样本。

1)Pixel Accuracy(PA,像素精度):标记正确的像素占总像素的比例

0c3ae84c-29d7-11eb-a64d-12bb97331649.jpg

2)Mean Pixel Accuracy(MPA,平均像素精度):计算每个类内被正确分类像素数比例,之后求所有类的平均数。

0c5ff542-29d7-11eb-a64d-12bb97331649.jpg

3)Mean Intersection over Union(MIoU,均交并比):为语义分割的标准度量,其计算两个集合的交集和并集之比,这两个集合分别为ground truth 与predicted segmentation,在每个类上计算IoU,之后将其求平均。

-----IoU即真正样本数量/(真正样本数量+假正样本数量+假负样本数量)

0c815476-29d7-11eb-a64d-12bb97331649.jpg

4)Frequency weighted Intersection over Union(FWIoU,频权交并):是MIoU的一种提升,这种方法根据每个类出现的频率为期设置权重。

0ca6d228-29d7-11eb-a64d-12bb97331649.jpg

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1097

    浏览量

    42517
  • 函数
    +关注

    关注

    3

    文章

    4423

    浏览量

    68117
  • 分割
    +关注

    关注

    0

    文章

    17

    浏览量

    12156

原文标题:语义分割入门的总结

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    全面掌握ComfyUI系统教程|94节从入门到进阶实战清单

    ComfyUI 则将其解耦为独立的节点操作。在背景替换的初始阶段,核心任务是多模态语义分割。技术实现上,这通常依赖于专门的语义分割模型节点(如 SAM Segmentor 或 Rem
    发表于 03-29 16:17

    半导体存储器的发展过程和主要分类

    从打孔卡到纳米芯片,存储技术跨越三个世纪。本文系统回顾存储器演进史,详解易失与非易失性存储的分类逻辑,重点剖析现代科技“心脏”——DRAM。从1T1C单元结构到读写刷新的电荷流转机制,深度解码海量数据如何在微观电容中精准定格。
    的头像 发表于 03-16 15:20 691次阅读
    半导体存储器的<b class='flag-5'>发展过程</b>和主要分类

    Actian推出对话式分析解决方案,依托智能生成的语义基础,提供可信洞见

    HCLSoftware旗下的数据与人工智能部门Actian今日推出Actian AI Analyst(原名Wobby)。该对话式分析解决方案搭载Steward Agent,能够智能生成并持续维护语义
    的头像 发表于 03-14 11:38 842次阅读

    RDMA设计46:RoCE v2原语功能:单边语义

    验证测试项与测试步骤 (2)单边语义验证测试步骤3的关键波形如图1所示,当提交队列非空时,RoCE v2发送模块提取提交队列条目、组装数据包并发送,符合设计预期,验证通过。图1 SEND数据包组装
    发表于 03-01 23:14

    大模型实战(SC171开发套件V3)2026版

    部署案例----基于广和通自研FiboSeg语义分割模型 4分22秒 https://t.elecfans.com/v/28533.html *附件:文档:自研模型部署案例----基于广和通自研FiboSeg语义
    发表于 01-15 12:05

    AI功能(SC171开发套件V3)2026版

    分割(deeplabv3)案例----基于SC171开发套件V3 8分02秒 https://t.elecfans.com/v/28529.html *附件:文档:图像语义分割(deeplabv3
    发表于 01-15 11:18

    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南

    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南
    的头像 发表于 12-12 14:30 6536次阅读
    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与<b class='flag-5'>语义</b><b class='flag-5'>分割</b>一站式部署指南

    滚珠螺杆如何成为制造业的核心精密传动部件?

    在工业精密传动领域的发展过程中,滚珠螺杆的作用不可或缺。
    的头像 发表于 10-22 17:52 1461次阅读
    滚珠螺杆如何成为制造业的核心精密传动部件?

    充电桩上液晶显示应用发展过程

    随着新能源汽车大规模普及,充电桩的缺口越来越大,特别是可以实现快速充电充电桩站越来越多,对于显示的需求也越来越不一样,纵观充电桩显示的迭代的整个过程,刚开始,国内的直流桩大部分以国网为主体发展
    发表于 10-09 09:37

    手机板 layout 走线跨分割问题

    初学习layout时,都在说信号线不可跨分割,但是在工作中为了成本不能跨分割似乎也非绝对。 在后续工作中,跨分割的基础都是相邻层有一面完整的GND参考,跨分割发生在相邻的另外一层。 但
    发表于 09-16 14:56

    基于黄金分割搜索法的IPMSM最大转矩电流比控制

    摘 要:在矢量控制理论的基础上,研究了内嵌式永磁同步电机(IPMSM)基于黄金分割搜索法实现最大转矩电流比控制(MTPA)的方法。该方法利用对理论最优电流矢量角表达式进行多项式拟合所得值作为搜索
    发表于 07-29 16:11

    北京迅为itop-3588开发板NPU例程测试deeplabv3 语义分割

    北京迅为itop-3588开发板NPU例程测试deeplabv3 语义分割
    的头像 发表于 07-22 15:51 1222次阅读
    北京迅为itop-3588开发板NPU例程测试deeplabv3 <b class='flag-5'>语义</b><b class='flag-5'>分割</b>

    如何将32个步进伺服驱动器塞进小型板材分割机中?

    板材分割机是工业制造中常见的装备。机器的内部空间狭小,如何将多达32个步进伺服驱动器安装在其中显得非常困难。本文将通过基于EtherCAT总线的插板式步进伺服驱动器剖析其破解之法!传统铣刀式板材分割
    的头像 发表于 07-08 11:37 746次阅读
    如何将32个步进伺服驱动器塞进小型板材<b class='flag-5'>分割</b>机中?

    【正点原子STM32MP257开发板试用】基于 DeepLab 模型的图像分割

    是谷歌团队提出的一种用于语义分割的深度学习模型,属于 DeepLab 系列模型的第三代版本。它在图像语义分割任务中表现优异,能够高效地捕获图像的多尺度上下文信息,并生成高分辨率的
    发表于 06-21 21:11

    凡亿Allegro Skill布线功能-检查跨分割

    在进行高速PCB设计的过程中,高速信号线需要进行阻抗控制,那么参考平面的完整性对于高速信号的完整性和稳定性至关重要。然而,如果仅仅依赖于肉眼去检查参考平面的完整性,往往容易遗漏一些关键的细节,这可
    的头像 发表于 06-19 11:50 2582次阅读
    凡亿Allegro Skill布线功能-检查跨<b class='flag-5'>分割</b>