0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何缩小弱监督信号与密集预测之间的差距

新机器视觉 来源:极市平台 作者:PaperWeekly 2022-07-13 10:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读本文围绕非完全监督下的图像分割方法最新综述,讲述用于解决“如何缩小弱监督信号与密集预测之间的差距”的四种通用的启发式先验。

前言

0f48f706-01ec-11ed-ba43-dac502259ad0.jpg

论文链接:https://arxiv.org/abs/2207.01223团队介绍:https://shenwei1231.github.io/上海交通大学人工智能研究院杨小康、沈为团队联合华为田奇团队共同发布了非完全监督(即标签有限)下的图像分割方法最新综述 “A Survey on Label-efficient Deep Segmentation: Bridging the Gap between Weak Supervision and Dense Prediction”。该工作由人工智能研究院沈为副教授主持,全文包含170余篇文献,全面总结了不同类型的监督标签在不同分割任务上的进展情况:包括无监督、弱监督、半监督、部分监督、域迁移等多种设置下的语义、实例、全景分割问题,并以统一视角--“如何缩小弱监督信号与密集预测之间的差距”进行分析,总结出用于解决这个问题的四种通用的启发式先验:① cross-label constraint (跨标签约束);② cross-pixel similarity(跨像素相似性);③ cross-view consistency(跨视图一致性);④ cross-image relation(跨图像关系)。

0f6192e8-01ec-11ed-ba43-dac502259ad0.jpg

▲不同模态的数据会被分别经过“连续向量路径”和“离散词路径”,分别为连续向量和离散词向量作为其的特征;最终的特征为二者的向量和。

背景与问题

图像分割是计算机视觉领域最古老最广泛的研究任务之一。它的目标是对给定的图像来生成密集的预测,根据预测的类型决定具体的分割方向,例如:给每个像素分配一个预定义的类别标签为语义分割;为每个像素预测一个对象实例标签为实例分割;或前两者的预测结果的组合为全景分割。无论哪种具体分割方向,其都能使语义相似的像素组成有意义的概念,如动态对象(人、猫、球等)和静态物体(道路、天空、水等)。在过去的近十年里,深度学习的出现极大地带动了图像分割领域的研究进展,特别是随着全卷积网络(FCN)的发展,诸如DeepLab系列,Mask RCNN系列等方法凭借卷积网络强大的密集特征表征能力以及独特的设计在图像分割领域大放异彩,取得了非常好的分割效果。然而这些方法也存在着一个共同的缺点,即往往分割效果与具有可用的密集标注的图像的数量是成正比的,对像素级的标签的需求量非常大。但是人为地给每一张图像做像素级的标注却非常地耗费时间与精力,这不仅限制了深度学习的进一步发展,而且限制了图像分割在真实工业场景中的应用。近年来,设计基于非完全监督信号来减少对密集标签依赖的分割方法越来越受到关注,非完全监督下的图像分割方法的数量呈爆发式增长,由于缺少对这些方法进行系统地归纳总结,这给研究者学习跟进最新研究进展带来不小的挑战。 然而,目前仅有个别几篇相关的调研论文,且它们仅仅关注于一个特定的分割任务,并仅包含个别类型的弱标签,无法做到全面的总结。

本文工作

本文研究人员旨在提供一个面向于非完全监督下图像分割领域的全面的综述,分析语义分割、实例分割、全景分割三类使用弱监督信号(标签)来解决分割问题的方法之间的统一性与关联性。为了达到该目的,研究人员需要想好两个问题:

如何对这些方法建立合适分类与关联?

如何从统一的角度总结这些方法所使用的策略?

研究人员注意到,弱标签的类型是设计非完全监督图像分割方法的关键,决定了可用信息的多少,因此试图从弱标签信号差异的角度来回答上述两个问题。针对第一个问题,本综述首先总结出层次化的非完全监督信号的分类,具体类型包括如下所示:

无监督信号:即训练集中的图像没有任何标注信号(图 2a)。

粗粒度监督信号:即训练集中的图像有标注信号,但这些信号不是像素级的,无法为每一个像素提供类别信息或者实例信息。(图2b)在该类型下主要包括:

图像级别的标注

检测框级别的标注

涂鸦级别的标注

不完全监督信号:即训练集中的一部分图像有像素级的标注信号(图2c)。在该类型下主要包括:

半监督标签,即属于同域的另一部分图像没有任何标签

特定域的标签,即另一部分图像属于另一个域,其没有任何标注

部分密集标签,即属于同域的另一部分图像有检测框级别的弱标注

带噪监督信号:即有像素级别的标注,但是这些标注并不一定全部准确(图 2d)。

根据这些分类,再结合不同的任务类型,整理出来了如图 1 所示的分类表,也标注了不同任务不同标签类型下已有的代表性工作和待开发的领域。

0f7359e2-01ec-11ed-ba43-dac502259ad0.jpg

▲图2. 每一种弱监督信号的示意图。第一列为完全密集监督信号的例子。针对第二个问题,本综述结合不同弱监督信号之间的关联以及对 170 余篇论文进行归纳提炼后,总结出了四种通用的启发式先验:

cross-label constraint,即跨标签约束:弱标签与密集标签之间具有一些约束关系,如给定图像的类别标签,我们可以知道图中必有至少一个像素属于该类别。

cross-pixel similarity,即跨像素相似性:具有诸如颜色,纹理,高层次特征相似性的像素点很可能是同类像素或者同对象像素。

cross-view consistency,即跨视图一致性:同一张图的不同的视角具有强关联性/预测一致性。

cross-image relation,即跨图像关系:不同图像中属于同一类别的实例具有相同的语义关系。

通过下列表1的代表性方法的核心做法归纳中可以看到,在各种监督信号/各种任务下,这四种先验贯穿每一种任务设定,证明了本综述总结的启发式先验具有通用性。

0f8436ea-01ec-11ed-ba43-dac502259ad0.jpg

▲表1. 多种弱监督信号下的图像分割代表性工作。

0f9e4602-01ec-11ed-ba43-dac502259ad0.jpg

▲表2. 统一的数学描述。本综述几乎对各章节部分(即某种监督信号下的某个任务)都总结了一个具有概括性的流程图,便于研究人员明确当前已有工作的入手点与研究路线,如图 3 所示。

0fb95604-01ec-11ed-ba43-dac502259ad0.jpg

▲图3. 部分论文图示预览

总结

本综述对现有不完全监督下的图像分割方法进行了归纳总结,同时也分析了未来的潜在研究方向,包括:

结合文本监督的零样本图像分割。 多模态技术是未来的主流方向,也更贴近人的认知系统。从文本中获得一定的语义信息可以更好的帮助新类别的识别与分割,利于零样本任务的发展。

利用 Transformer 特性的不完全监督图像分割方法。 当前大部分方法还是基于卷积神经网络来实现的,爆火的 Transformer 在不完全监督下的图像分割领域目前还没有被探索,许多 Transformer 特性可能对该任务具有更有力的优势。

还未开拓的利用其他不完全监督信号的方案。 如图 1 所示,这里依然有很多方向还没有被探索,如带噪监督信号下的实例分割等,研究者可以发掘更多合理的任务设置,充分利用现有的具有多种标注类型的数据集。

原文标题:综述|上海交大&华为:非完全监督下基于深度学习的图像分割方法

文章出处:【微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 像素
    +关注

    关注

    1

    文章

    206

    浏览量

    19189
  • 人工智能
    +关注

    关注

    1813

    文章

    49741

    浏览量

    261553
  • 图像分割算法

    关注

    0

    文章

    3

    浏览量

    6396

原文标题:综述|上海交大&华为:非完全监督下基于深度学习的图像分割方法

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    信号样品在比表面与孔径分析中的数据处理与增强技巧

    在比表面与孔径分析中,信号样品(如低比表面积材料、微量样品或低孔隙率材料)因吸附信号微弱,易被背景干扰掩盖,导致数据精度下降甚至无法准确分析。这类样品的分析核心在于“精准捕捉有效信号
    的头像 发表于 10-29 09:32 130次阅读
    <b class='flag-5'>弱</b><b class='flag-5'>信号</b>样品在比表面与孔径分析中的数据处理与增强技巧

    蜂鸟E203简单分支预测的改进

    ,分别为强不需要跳转、不需要跳转、需要跳转与强需要跳转,当前状态为需要跳转与强需要跳转时,则预测进行跳转,否则不跳转。 两位饱和计数器对于
    发表于 10-24 07:45

    提高条件分支指令预测正确率的方法

    基于全局分支历史的ghare分支预测器 主要构成 分支目标缓冲器BTB 分支历史寄存器BHR 方式历史寄存器PHT 对于某个条件分支指令而言,其全局历史是相对恒定的,让PHT同时保存全局历史
    发表于 10-22 08:22

    基于全局预测历史的gshare分支预测器的实现细节

    的地址位数,虽然BHR位数越多,分支预测器的准确度越高,但正确率提高的代价是PHT消耗的资源呈指数形式迅速地增长,因此我们必须在面积与性能之间进行权衡。。最终经过对各类32位RISC-V开源处理器内核
    发表于 10-22 06:50

    无刷电机磁控制:技术原理与实战应用

    在电机控制领域,磁控制技术一直是备受关注的焦点之一。尤其是对于无刷电机来说,磁控制不仅能够提升其性能,还能拓展其应用范围。今天,就让我们深入探讨一下无刷电机磁控制的奥秘以及它所带来的诸多
    的头像 发表于 08-01 18:05 9054次阅读
    无刷电机<b class='flag-5'>弱</b>磁控制:技术原理与实战应用

    I/O密集型任务开发指导

    使用异步并发可以解决单次I/O任务阻塞的问题,但是如果遇到I/O密集型任务,同样会阻塞线程中其它任务的执行,这时需要使用多线程并发能力来进行解决。 I/O密集型任务的性能重点通常不在于CPU的处理
    发表于 06-19 07:19

    CPU密集型任务开发指导

    CPU密集型任务是指需要占用系统资源处理大量计算能力的任务,需要长时间运行,这段时间会阻塞线程其它事件的处理,不适宜放在主线程进行。例如图像处理、视频编码、数据分析等。 基于多线程并发机制处理CPU
    发表于 06-19 06:05

    国产 vs 进口贴片固态电容:技术差距缩小,本土化替代加速

    差异、市场表现及未来趋势,探讨国产替代的机遇与挑战。   1.性能对比:国产技术迎头赶上   (1)关键参数差距缩小   - ESR(等效串联电阻):早期国产固态电容的ESR较高,影响高频性能,但近年来,如风华高科(FH)、宇阳科技(EYANG)等企业已推出超低ESR系列
    的头像 发表于 05-27 16:25 1021次阅读
    国产 vs 进口贴片固态电容:技术<b class='flag-5'>差距</b><b class='flag-5'>缩小</b>,本土化替代加速

    使用MATLAB进行无监督学习

    监督学习是一种根据未标注数据进行推断的机器学习方法。无监督学习旨在识别数据中隐藏的模式和关系,无需任何监督或关于结果的先验知识。
    的头像 发表于 05-16 14:48 1178次阅读
    使用MATLAB进行无<b class='flag-5'>监督</b>学习

    Deepseek横空出世!中美AI之间差距逆转了吗?

    DeepSeek的横空出世确实在中美AI竞争中引起了巨大反响,但要判断中美AI之间差距是否因此逆转,还需从多个维度进行深入分析。 一、技术性能与成本 DeepSeek以其卓越的性能和低廉的成本
    的头像 发表于 04-15 18:14 755次阅读

    深度对比:全国产电脑替代方案VS进口设备,性能差距缩小至15%的真相

    在工业、金融、能源等领域,进口电脑设备长期占据主导地位,但高昂的成本和技术依赖风险成为企业痛点。如今,以华颉工控机为代表的全国产电脑替代方案,通过CPU、操作系统、芯片组的全面国产化,将性能差距从过去的50%以上缩小至15%以内,同时成本直降40%。
    的头像 发表于 03-27 13:43 2830次阅读
    深度对比:全国产电脑替代方案VS进口设备,性能<b class='flag-5'>差距</b><b class='flag-5'>缩小</b>至15%的真相

    高精度分光——密集波分复用的应用前景

    波分复用技术在光通信领域扮演着日益重要的角色,相比粗波分复用,密集波分复用可以拥有更多的信息通道及更高的通信速度,适用于无关协议的长距离高带宽数据传输。而高精细度滤波器是确保不同波长信号之间有效隔离的关键组件。
    的头像 发表于 01-23 11:01 1123次阅读
    高精度分光——<b class='flag-5'>密集</b>波分复用的应用前景

    如何通过仿真准确的预测信号完整性

    解释完带宽这一概念,我们来考虑如何才能通过仿真准确的预测信号完整性。 信号带宽的确定、器件模型的获取 当我们确定了要分析的信号的信息(包含速率、接口电平、上升时间等等)、以及驱动器和接
    的头像 发表于 01-22 11:51 2453次阅读
    如何通过仿真准确的<b class='flag-5'>预测</b><b class='flag-5'>信号</b>完整性

    CMOS开关和多路复用器中的Ron调制;它是什么及如何预测它对信号失真的影响

    电子发烧友网站提供《CMOS开关和多路复用器中的Ron调制;它是什么及如何预测它对信号失真的影响.pdf》资料免费下载
    发表于 01-15 16:23 1次下载
    CMOS开关和多路复用器中的Ron调制;它是什么及如何<b class='flag-5'>预测</b>它对<b class='flag-5'>信号</b>失真的影响

    snmp口令及安全加固

    snmp口令及安全加固 口令检测   nmap –sU –p161 –script=snmp-brute ip //查找snmp口令   口令利用   nmap -sU -p1
    的头像 发表于 12-17 14:47 2052次阅读