0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何使用DDPM提取特征并研究这些特征可能捕获的语义信息

CVer 来源:咚咚学AI 作者:咚咚 2022-11-29 15:40 次阅读

摘要

背景介绍:去噪扩散概率模型DDPM最近受到了很多研究关注,因为它们优于其他方法,如GAN,并且目前提供了最先进的生成性能。差分融合模型的优异性能使其在修复、超分辨率和语义编辑等应用中成为一个很有吸引力的工具。

研究方法:作者为了证明扩散模型也可以作为语义分割的工具,特别是在标记数据稀缺的情况下。对于几个预先训练的扩散模型,作者研究了网络中执行逆扩散过程马尔可夫步骤的中间激活。结果表明这些激活有效地从输入图像中捕获语义信息,并且似乎是分割问题的出色像素级表示。基于这些观察结果,作者描述了一种简单的分割方法,即使只提供了少量的训练图像也可以使用。

实验结果:提出的算法在多个数据集上显著优于现有的替代方法。

算法

df2211b6-6cda-11ed-8abf-dac502259ad0.png

首先,简要概述DDPM框架。然后,我们描述了如何使用DDPM提取特征,并研究这些特征可能捕获的语义信息。

poYBAGOFt_KAGV57AAIYyJHxg-Y131.jpg

表征分析

作者分析了噪声预测器θ(xt,t)对不同 t 产生的表示。考虑了在LSUN Horse和FFHQ-256数据集上训练的最先进的DDPM checkpoints。

来自噪声预测器的中间激活捕获语义信息:对于这个实验,从LSUN Horse和FFHQ数据集中获取了一些图像,并分别手动将每个像素分配给21和34个语义类中的一个。目标是了解DDPM生成的像素级表示是否有效地捕获了有关语义的信息。为此,训练多层感知器(MLP),以根据特定扩散步骤t上18个UNet解码器块中的一个生成的特征来预测像素语义标签

请注意,只考虑解码器激活图,因为它们还通过跳跃连接聚合编码器激活图。MLP在20张图片上接受训练,并在20张图片上进行评估。预测性能以平均IoU衡量。

dfb99d42-6cda-11ed-8abf-dac502259ad0.png

图2显示了不同解码块和扩散步骤t的预测性能演变。解码块从深到浅依次编号。图2显示了噪声预测器θ(xt,t)产生特征的IoU随不同的块和扩散步骤而变化。

特别是,对应于反向扩散过程后续步骤的特征通常更有效地捕获语义信息。相比之下,早期步骤相对应的特征通常没有什么信息。在不同的解码块中,UNet解码器中间层产生的特征似乎是所有扩散步骤中信息最丰富的。

dfe3315c-6cda-11ed-8abf-dac502259ad0.png

此外,根据标注数据集中的目标的平均面积分别考虑小型和大型语义类。然后,独立评估不同UNet解码块和扩散步骤中这些类的平均IoU。LSUN Horse的结果如图3所示。

正如预期的那样,在相反的过程中,大型对象的预测性能开始提前增长。对于较小的对象,浅层解码块的信息量更大,而对于较大的对象,深层解码块的信息更大。在这两种情况下,最有区别的特征仍然对应于中间块

e0171e18-6cda-11ed-8abf-dac502259ad0.png

图4显示了由FFHQ checkpoint从扩散步骤{50,200,400,600,800}的解码块{6,8,10,12}中提取的特征形成的k-means聚类(k=5),并确认聚类可以跨越连贯的语义对象和对象部分。

在块B=6中,特征对应于粗糙的语义掩码。在另一个极端,B=12的特征可以区分细粒度的面部部位,但对于粗碎片来说,语义意义较小。在不同的扩散步骤中,最有意义的特征对应于后面的步骤。

将这种行为归因于这样一个事实,即在反向过程的早期步骤中,DDPM样本的全局结构尚未出现,因此,在这个阶段几乎不可能预测分段掩码。图4中的掩码定性地证实了这种直觉。对于t=800,掩码很难反映实际图像的内容,而对于较小的t值,掩码和图像在语义上是一致的。

基于DDPM的few-shot语义分割

上述观察到的中间DDPM激活的潜在有效性表明,它们可以被用作密集预测任务的图像表示。图1展示了整体图像分割方法,该方法利用了这些代表的可辨别性。更详细地说,当存在大量未标记图像{X1,…,XN}⊂时,考虑了few-shot半监督设置。

第一步,以无监督的方式对整个{X1,…,XN}训练扩散模型。然后使用该扩散模型提取标记图像的像素级表示。在本工作中,使用UNet解码器中间块B={5,6,7,8,12}的表示,以及反向扩散过程的步骤t={50,150,250}。

实验

e056e0fc-6cda-11ed-8abf-dac502259ad0.pnge0799d2c-6cda-11ed-8abf-dac502259ad0.pnge0996634-6cda-11ed-8abf-dac502259ad0.png





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1073

    浏览量

    40166
  • 感知器
    +关注

    关注

    0

    文章

    32

    浏览量

    11793
  • MLP
    MLP
    +关注

    关注

    0

    文章

    56

    浏览量

    4074

原文标题:ICLR 2022 | 基于扩散模型(DDPM)的语义分割

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于OWL属性特征语义检索研究

    【来源】:《电子设计工程》2010年02期【摘要】:在文献检索中,概念的语义相似度计算直接影响查准率和查全率指标。将本体描述语言OWL(Web Ontology Language)的属性特征有机结合
    发表于 04-24 09:48

    手指静脉图像的特征提取和识别前期研究

    图像处理,手指静脉图像的特征提取和识别前期研究
    发表于 05-11 11:51

    语音特征参数提取的仿真研究

    语音特征参数提取的仿真研究
    发表于 08-20 12:38

    模拟电路故障诊断中的特征提取方法

    故障特征提取是模拟电路故障诊断的关键,而模拟电路由于故障模型复杂、元件参数的容差、非线性、噪声以及大规模集成化等现象使电路故障信息表现为多特征、高噪声、非线性的数据集,且受到特征信号观
    发表于 12-09 18:15

    如何提取颜色特征

    计算机视觉的特征提取算法研究至关重要。在一些算法中,一个高复杂度特征提取可能能够解决问题(进行目标检测等目的),但这将以处理更多数据,需要
    发表于 10-12 06:55

    模式识别中的特征提取研究

    特征提取是模式识别中的关键技术之一,本文提出了一种基于改进ReliefF 算法的主成分特征提取方法,通过该方法进行主特征特征提取可以有效降维,大大减轻了后续的分类器的
    发表于 12-12 13:47 27次下载

    故障特征提取的方法研究

    摘要:针对常规特征提取方法存在着问题不足,提出了基于BP神经网络和基于互信息熵的特征提取方法,并通过特征提取实例加以说明。结果表明这两种方法是可行和有效的。
    发表于 03-11 13:14 1323次阅读
    故障<b class='flag-5'>特征提取</b>的方法<b class='flag-5'>研究</b>

    特征量的选择和提取

    特征量的选择和提取为了有效地分类,希望同类样本之间的距离越小越好,而不同类样本之间的距离则越大越好,本文所使用的特征量尽可能满足取样的要求。
    发表于 03-01 17:49 852次阅读
    <b class='flag-5'>特征</b>量的选择和<b class='flag-5'>提取</b>

    颜色特征提取方法

    计算机视觉的特征提取算法研究至关重要。在一些算法中,一个高复杂度特征提取可能能够解决问题(进行目标检测等目的),但这将以处理更多数据,需要
    发表于 11-16 14:12 4228次阅读

    基于小波脊线的特征提取算法

    捕获问题,并对其特征参数提取算法进行了研究。针对跳频信号的特征提取研究了一种基于小波脊线的
    发表于 01-04 14:04 0次下载
    基于小波脊线的<b class='flag-5'>特征提取</b>算法

    散乱点云数据特征信息提取算法

    随着三维扫描和数字信息化的快速发展,基于点模型的三维信息逆向建模技术已成为当前研究的热点。该技术在模具设计、3D打印、虚拟现实、城市勘测以及文物修复等领域得到广泛应用。在模型重建的过程中,点模型
    发表于 01-30 16:35 0次下载
    散乱点云数据<b class='flag-5'>特征</b><b class='flag-5'>信息提取</b>算法

    结合双目图像的深度信息跨层次特征语义分割模型

    为改善单目图像语义分割网络对图像深度变化区域的分割效果,提出一种结合双目图像的深度信息和跨层次特征进行互补应用的语义分割模型。在不改变已有单目孪生网络结构的前提下,利用该模型分别
    发表于 03-19 14:35 20次下载
    结合双目图像的深度<b class='flag-5'>信息</b>跨层次<b class='flag-5'>特征</b>的<b class='flag-5'>语义</b>分割模型

    一种基于信息熵与综合函数特征提取

    近年来未知的计算机漏洞欻量呈海量増长状态,对于大量的漏洞数据进行及时准确的分析和分类管理,是十分重要且有待解决的问题。因此,提出一种基于信息熵与综合函数(S-C)特征提取,并利用关联了特征
    发表于 04-13 13:51 3次下载
    一种基于<b class='flag-5'>信息</b>熵与综合函数<b class='flag-5'>特征提取</b>

    结合词特征语义特征的网络评价对象识别

    特征语义特征的评价对象识别方法。针对商品评论语料,使用条件随机场进行评价对象识别,在词特征、依存句法特征的基础上引入
    发表于 05-28 11:04 3次下载

    将高级语义信息隐式地嵌入到检测和描述过程中来提取全局可靠的特征

      介绍 以往的特征检测和匹配算法侧重于提取大量冗余的局部可靠特征,这样会导致效率和准确性有限,特别是在大规模环境中挑战性的场景,比如天气变化、季节变化、光照变化等等。 本文将高级语义
    的头像 发表于 06-30 10:49 422次阅读
    将高级<b class='flag-5'>语义</b><b class='flag-5'>信息</b>隐式地嵌入到检测和描述过程中来<b class='flag-5'>提取</b>全局可靠的<b class='flag-5'>特征</b>