0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新的算法StructureFlow重建新算法实现高性能图像修复

nlfO_thejiangme 来源:lq 2019-10-01 16:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

图像修复技术对于众多修图软件来说十分重要,在深度学习的帮助下图像修复算法的功能越来越强大,甚至对于大幅度污损的照片也能轻松修复。但目前的很多算法在进行图像修复时却面临着结构重建问题或细节问题修复问题的困难,修复结果不尽如人意。

为了解决这一问题,来自北大、鹏城实验室和腾讯的研究人员提出了一种新的算法StructureFlow,将图像修复的过程分为边缘保持的低频结构重建和基于结构的高分辨率纹理重建,并利用流的方法充分利用未受损像素的信息实现有效的纹理补全和图像修复。

图像修复的主要目的在于为图像中的有效区域和污损区域生成出视觉效果完整的结构和细节,用户不仅可以利用这一技术修复图像的缺失,还可以将它用于图像编辑和物体去除等任务。图像修复最大的难点在于生成正确完整的结构和视觉效果较为真实的细节纹理。

已有的图像修复方法

现存的方法主要可以分为两大类——基于扩散的方法和基于图像片的方法。

基于扩散的方法主要通过将领域的信息传播到缺失的位置来实现纹理合成,然而这种方法只能处理一些较小的孔洞,对于较大范围的结构缺失则无法有效处理。

而基于图像片的方法则不仅仅只利用缺失位置附近的像素点,这种方法可以有效利用更远位置的信息来恢复缺失区域。基于图像片的方法通过搜索与污损区域结构相似的目标区域,并复制图像片来重建缺失区域,这种方法可以为较大的缺失区域生成视觉效果真实纹理。这种方法一般基于双线性相似性的方法来搜索合适的图像片。

但基于片元的方法主要假设非污损区域包含了与污损区域语义相似的内容,但如人脸检测等任务中这种假设并不成立。这种方法在某些有重复性结构的图像中表现良好,但对于具有特殊结构的图像则无法有效处理。

近年来随着深度学习的发展,很多方法将图像修复问题视为一个条件生成问题,将污损图像作为网络输入得到修复后的图像。基于深度学习方法的优势在于可以将图像中的有效语义信息进行抽取,并生成新的图像。

人们提出了包括基于自编码器架构、处理全局和局部内容的判别器、构建长程相关性、选择性利用有效像素以及边缘修复等方法来进行图像修复但都存在着诸如长程相关性无法有效表示、边缘信息无法有效携带纹理等问题,使得这些方法得到的结果都有这样或那样的不足。

StructureFlow

为了解决先前模型存在的问题,研究人员们提出了一种新颖的两阶段网络模型俩实现高质量的图像修复。这一模型包含了两个部分,分别是结构生成器和纹理细节生成器。

研究人员认为图像的修复过程是一个先生成有效结构再补全真实细节的过程。所以网络的第一部分用于生成有意义的结构,研究人员采用了保边平滑后的图像来表示图像场景的全局结构。

保边平滑方法的主要目标在于移除图像中的高频纹理,同时保持锐利边缘和低频信息(这些信息是图像结构的主要组成部分)。利用保边平滑后的图像进行训练,结构重建器可以集中于恢复全局结构而无需考虑细节和纹理的干扰。

在重建出缺失细节后,纹理生成器就可以基于重建出的结构图来合成高频的细节了。由于图像领域的相似结构具有很强的相关性,所有未被污损的区域可以用于修复缺失区域的纹理。

虽然卷积网络对于长程相关性建模比较困难,但研究人员提出了基于图像外观流(appearance flow,AF)的方法来从相似结构区域采样,为不同区域构建清晰关系。此外研究人员还利用了高斯采样代替了双线性采样来拓展了采样操作的感受野,并引入了新的采样正确性损失函数来训练采样过程,以此得到了性能较高的图像修复模型。

实现细节

在结构重建器中,研究人员将最小化生成的低频结构图像与平滑后原图间的误差。第一阶段的监督信号主要来自于GT图的平滑结果,使用了保边平滑算法RTV来得到保持图像主要结构的图片作为标签。模型的主要结构基于自编码器架构得到,添加了一系列残差块用于特征的优化提取。Gs和Gt分别代表了第一阶段的结构生成器和第二阶段的纹理生成器,而判别器则使用了类似于BicycleGAN的架构,利用了两个不同尺度的PatchGAN来预测不同尺度生成图像的真伪。

值得一提的是,这一模型中使用了流的概念来将未受损区域的纹理信息赋予需要修复区域。但原始的AF方法是以一种非监督的方法,网络无法处理较大的运动和较差的局域最小值。

为了解决这一问题,研究人员提出了利用高斯采样的方法来代替原先的双线性采样方法以扩展感受野,并提出了采样正确性损失来约束可能的收敛结果。采样过程通过输入像素(特征)来计算梯度,如果感受野受限只能有少量像素参与计算。由于相邻像素具有较强的相关性,所以较大的感受野有助于获得较为正确和稳定的梯度。双线性采样的感受野较小,不适合于长程相关性的采样建模。而高斯相关性则可以在较大的感受野中进行采样。下式中的权重aij便是可调整方差的高斯核。

而新提出的采样正确性损失则用于衡量模型的采样是否良好,并约束AF场的信息流动。在实际使用中,研究人员主要使用了VGG19层的特征来计基准特征和采样特征之间的余弦距离,以判断这一采样是否合适。

实验结果

研究人员分别在Place2,Celeba和Paris StreetView数据集上进行了实验,并利用Irregular Masks数据集生成缺失污损的图像。

利用客观的SSIM,PSNR和FID进行客观测评,同时也利用MTurk平台进行了主观质量测试。下图显示了研究人员提出的方法与Contextual Attention(CA),Partial Convolution(PConv)和EdgeConnect等方法的比较。

下表中可以看到在多个数据集上本方法都获得了明显的指标提升。

研究人员还将这一算法用于图像编辑任务中去,将图中不希望出现的物体涂上掩膜,就可以修复出完整高质量的清晰图像。同时也可以在结构图上进行编辑为生成的图像增加新的物体或内容。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4761

    浏览量

    97160
  • 图像
    +关注

    关注

    2

    文章

    1096

    浏览量

    42163
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123920

原文标题:全局细节统统修复——StructureFlow重建新算法实现高性能图像修复

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    8常用的CRC算法分享

    CRC 计算单元可按所选择的算法和参数配置来生成数据流的 CRC 码。有些应用中,可利用 CRC 技术来验证数据的传输和存储的完整性。 8 常用的 CRC 算法,包括: CRC16_IBM
    发表于 11-13 07:25

    SM4算法实现分享(算法原理

    SM4分组加密算法采用的是非线性迭代结构,以字为单位进行加密、解密运算,每次迭代称为轮变换,每轮变换包括S盒变换、非线性变换、线性变换、合成变换。加解密算法与密钥扩展都是采用32轮非线性迭代结构
    发表于 10-30 08:10

    复杂的软件算法硬件IP核的实现

    实现的技术细节,知道这些技术细节将有利于在使用 C 语言编写算法实现些有针对性的优化。 2.1 C to HASM HASM 是一种
    发表于 10-30 07:02

    SM4算法原理及分享1

    SM4算法一种分组密码算法。其分组长度为128bit,密钥长度也为128bit。加密算法与密钥扩展算法均采用32轮非线性迭代结构,以字(
    发表于 10-30 06:54

    查找表与多项式近似算法实现初等函数

    查找表与多项式近似结合算法一种把查找表算法和多项式近似算法综合到起的算法。这种
    发表于 10-28 08:10

    使用Otsu阈值算法将灰度图像二值化

    Otsu 算法是由日本学者OTSU于1979年提出的一种图像进行二值化的高效算法,又称“最大类间方差法”。当我们对个图象进行二值化操作的
    发表于 10-28 06:49

    RISC-V 算法原理及串口通信

    具体方法 算法原理: 由于场景中的目标在运动,目标的影像在不同图像帧中的位置不同。该类算法对时间上连续的两帧或三帧图像进行差分运算,不同帧对应的像素点相减,判断灰度差的绝对值,当绝
    发表于 10-28 06:16

    BLDC与PMSM电机控制算法的联系与区别

    实现。 l应用: 主要用于对性能要求不高的BLDC场景。 矢量控制(FOC)​​ l原理: 一种高性能控制策略。通过复杂的数学变换(坐标变换),将交流电机的控制模拟成直流电机的控制,从
    发表于 10-27 09:23

    国密系列算法简介及SM4算法原理介绍

    保证,而国产密码算法实现了密码算法的自主可控,对于保障我国的国家安全具有重要意义。目前,我国大力推广国密算法的应用,并涌现出系列国家商用密
    发表于 10-24 08:25

    加密算法的应用

    加密是一种保护信息安全的重要手段,近年来随着信息技术的发展,加密技术的应用越来越广泛。本文将介绍加密算法的发展、含义、分类及应用场景。 1. 加密算法的发展 加密算法的历史可以追
    发表于 10-24 08:03

    基于FPGA的CLAHE图像增强算法设计

    CLAHE图像增强算法又称为对比度有限的自适应直方图均衡算法,其算法原理是通过有限的调整图像局部对比度来增强有效信号和抑制噪声信号。
    的头像 发表于 10-15 10:14 409次阅读
    基于FPGA的CLAHE<b class='flag-5'>图像</b>增强<b class='flag-5'>算法</b>设计

    PID控制算法的C语言实现:PID算法原理

    在工业应用中 PID 及其衍生算法是应用最广泛的算法,是当之无愧的万能算法,如果能够熟练掌握 PID 算法的设计与
    发表于 02-26 15:24

    DLPC7540EVM是否支持自定义的图像处理算法,以及如何进行算法的移植?

    是否支持自定义的图像处理算法,以及如何进行算法的移植?
    发表于 02-17 08:25

    FPGA上的图像处理算法集成与优化

    、Tophat形态学滤波、RAW8转RGB888、彩色图像均值滤波、Alpha背景叠加、直方图灰度拉伸算法以及自动白平衡算法。每种算法都提供了实现
    的头像 发表于 02-14 13:46 1160次阅读
    FPGA上的<b class='flag-5'>图像</b>处理<b class='flag-5'>算法</b>集成与优化

    常见的加密算法有哪些?它们各自的优势是什么?

    常见的加密算法及其优势如下: AES(Advanced Encryption Standard): AES是一种对称加密算法,采用分组密码体制,支持128位、192位和256位密钥长度。AES的优势
    的头像 发表于 12-17 15:57 1739次阅读