图像修复与处理经典论文回顾和精读-电子发烧友网

笔者最近在集中时间学习对抗生成网络（GAN），特别是深度生成先验进行多用途图像修复与处理，需要对图像修复与处理经典论文进行回顾和精读。

将从图像修复与处理的经典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》开始，重启精读之路。

DGP提出了一种挖掘GAN中图像先验的方式，在多个任务上揭示了GAN作为一种通用图像先验的潜力。

论文提出了同时插值隐变量和生成器的渐变式图像反演方法，可以应用于复杂图片的对抗防御，在实验中DGP所展现出的强大的像素间空间关系模拟能力也十分有趣。

Deep generative prior的图像复原效果

01深度生成先验

深度图像先验DIP仅依靠输入图像的统计信息，无法应用于需要更一般的图像统计信息的任务，如图像上色和图像编辑。

我们更感兴趣的是研究一种更通用的图像先验，即在大规模自然图像上训练的GAN生成器用于图像合成。具体来说，是一个基于GAN-inversion的图像重构过程。

在实践中，仅仅通过优化隐向量z难以准确重建ImageNet这样的复杂真实图像。训练GAN的数据集(ImageNet)本身是自然图片中很少的一部分，GAN受限于有限的模型性能和mode collapse，其模拟的图片分布与训练集图片分布也存在鸿沟。

即使存在以上限制，GAN仍然学习了丰富的图片信息，为了利用这些信息并且实现精确重建，我们让生成器online地适应于每张目标图片，即联合优化隐向量z和生成器参数。

我们将此新的目标称为深度生成先验(DGP)，DGP显著提高了图像重构的效果。设计合适的距离度量和优化策略非常关键，在重建过程中，生成器原始的生成先验被修改了，输出真实自然图像的能力可能会下降。

02判别器指引的渐进式重建

从 latent space Z 中随机抽取几百个候选的初始 latent code，并选择在度量L下重构效果最好的一个。

在GAN重建中，传统的距离度量方法是 MSE 或 Perceptual loss。优化生成器参数时，将这些传统距离度量用在图像恢复如上色任务中，常常无法准确恢复颜色，并且重建过程中图像会变得模糊，需要设计更好的优化方式来保留生成器的原有信息。

我们在该工作中选择使用与生成器对应的判别器来作为距离度量。与Perceptual loss所采用的VGGNet不同，判别器并非在一个第三方的任务上训练，而是在预训练时就与生成器高度耦合，它天然地适用于调整生成器的输出分布。

使用这种基于判别器的距离度量时，重建的过程更加自然和真实，最终颜色恢复的效果也更好。

其中D(x, i)代表以x作为输入时判别器第i个block输出的特征

虽然改进的距离度量带来了更好的效果，但是图像复原的结果仍存在非自然痕迹，因为生成器在针对目标图片优化时，浅层参数匹配好图片整体布局之前，深层参数就开始匹配细节纹理了。

上面的苹果图是几种训练策略的对比，从三行效果可以看出，有的苹果在训练初期没被染上色后期还是没被染上色，我们把这种现象称作“信息滞留”。

对策就是：使用渐进式重建的策略，即在微调生成器时，先优化浅层，再逐渐过渡到深层，让重建过程“先整体后局部”。

与非渐进策略相比，这种渐进策略更好地保留了缺失语义和现有语义之间的一致性。

03重建结果

使用BigGAN模型，基于ImageNet进行训练，使用ImageNet验证集中的1000张图像进行实验，取每类的第一张，相比于其他方法，DGP取得了非常高的PSNR和SSIM，视觉上的重建误差几乎难以察觉。

04实验

因为GAN刻画了自然图像的先验，因此可以完成很多的任务：比如上色、补全、超分辨率等等，还能进行图像处理。下面放一些效果图。

图像上色

使用ResNet50上的分类精度作为定量评估结果，下列方法的精度分别为 51.5%, 56.2%, 56.0%, 62.8%。

图像补全

超分辨率

灵活性

随机扰动

总结

GAN作为图像领域最强大的生成式模型之一，学习到了丰富的自然图像流形，可以对自然图像的恢复和编辑带来巨大帮助。

利用好大规模预训练模型的能力是深度学习目前各个领域的流行前沿，可以减少对训练数据的需求，整合相近的研究领域。

未来更强大的生成式模型，将带来更具实际应用价值的图像恢复和编辑应用，有望在更广泛的领域落地

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

GaN

GaN

+关注

关注
19

文章
1766

浏览量
68030
生成器

生成器

+关注

关注
7

文章
302

浏览量
20222
图像修复

图像修复

+关注

关注
0

文章
11

浏览量
2247

原文标题：深度学习论文精读[GAN]：利用深度生成先验进行多用途图像修复与处理

文章出处：【微信号：CVSCHOOL，微信公众号：OpenCV学堂】欢迎添加关注！文章转载请注明出处。

FPGA图像处理之CLAHE算法

在FPGA图像处理--CLAHE算法(一)中介绍了为啥要用CLAHE算法来做图像增强。

发表于 01-04 12:23 •1484次阅读

FPGA<b class='flag-5'>图像</b><b class='flag-5'>处理</b>之CLAHE算法

FPGA图像处理方法

图像在采集和传输的过程中，通常会产生噪声，使图像质量降低，影响后续处理。因此须对图像进行一些图像滤波、图

发表于 12-02 13:15 •613次阅读

常用的图像处理模块是什么？

在实际应用中常用的图像处理模块有哪些

发表于 10-30 06:20

机器视觉之图像增强和图像处理

一、图像处理技术概述1.定义对原始获取图像进行一系列的运算处理，称为图像处理。

发表于 10-26 08:07 •463次阅读

机器视觉之图像增强和图像处理

对原始获取图像进行一系列的运算处理，称为图像处理。图像处理是机器视觉技术的方法基础，包括

发表于 10-23 10:43 •229次阅读

机器视觉：图像处理技术、图像增强技术

对原始获取图像进行一系列的运算处理，称为图像处理。图像处理是机器视觉技术的方法基础，包括

发表于 10-20 10:17 •372次阅读

常用的图像处理算法有哪些？

图像处理 (Image Processing) 图像处理通常是把一幅图像变换成另外一幅图像，也就

发表于 09-19 10:33 •706次阅读

#FPGA #图像处理图像处理（概论）

fpga图像处理

奔跑的小鑫
发布于 :2023年07月27日 10:15:04

如何使用机器学习处理图像

图像处理是利用复杂的算法对图像进行技术分析。在图像处理中，图像是输入，有用的信息是输出。据报道，

发表于 07-24 15:00 •459次阅读

MATLAB图像处理实例详解

　　一、实验目的：　　1. 熟悉图像数据在计算机中的存储方式；　　2. 掌握图像直方图均衡化这一基本处理过程。　　二、实验条件：　　PC微机一台和MATLAB软件。　　三、实验内容：　　1.

发表于 07-18 15:06 •5次下载

STM32 图像处理函式库介绍

STM32 图像处理函式库STM32IPL是由 C 语言所编写的开放原始码软件函式库，提供了图像处理和计算机视觉功能，能加快在意法半导体（ST）的STM32 微控制器上开发视觉分析的应

发表于 07-11 11:39 •834次阅读

基于FPGA的图像处理之直方图均衡

最近一直在用FPGA调图像处理相关的算法，主要是集中在图像增强和增晰方面。

发表于 06-29 09:23 •705次阅读

图像处理与机器视觉

常用的图像增强处理方式包括灰度变换、直方图修正、图像锐化、噪声去除、几何畸变校正、频域滤波和彩色增强等。由于图像增强与感兴趣的物体特性、观察者的习惯和

发表于 06-20 15:41 •3次下载

图像处理的应用

最近有人问我图像处理怎么研究，怎么入门，怎么应用，我竟一时语塞。仔细想想，自己也搞了两年图像方面的研究，做个两个创新项目，发过两篇论文，也算是有点心得，于是总结总结和大家分享，希望能对

发表于 06-16 10:00 •751次阅读

荐读：FPGA设计经验之图像处理

今天和大侠简单聊一聊基于FPGA的图像处理，之前也和各位大侠聊过相关的图像处理，这里面也超链接了几篇，具体如下：图像边缘检测算法体验步

发表于 06-08 15:55