0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

图像修复与处理经典论文回顾和精读

OpenCV学堂 来源:OpenCV学堂 作者:OpenCV学堂 2022-07-13 16:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

笔者最近在集中时间学习对抗生成网络(GAN),特别是深度生成先验进行多用途图像修复与处理,需要对图像修复与处理经典论文进行回顾和精读。

将从图像修复与处理的经典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》开始,重启精读之路。

d4193df6-0283-11ed-ba43-dac502259ad0.png

DGP提出了一种挖掘GAN中图像先验的方式,在多个任务上揭示了GAN作为一种通用图像先验的潜力。

论文提出了同时插值隐变量和生成器的渐变式图像反演方法,可以应用于复杂图片的对抗防御,在实验中DGP所展现出的强大的像素间空间关系模拟能力也十分有趣。

d43f1a1c-0283-11ed-ba43-dac502259ad0.gif

Deep generative prior的图像复原效果

01深度生成先验

深度图像先验DIP仅依靠输入图像的统计信息,无法应用于需要更一般的图像统计信息的任务,如图像上色和图像编辑。

d46d2f42-0283-11ed-ba43-dac502259ad0.png

我们更感兴趣的是研究一种更通用的图像先验,即在大规模自然图像上训练的GAN生成器用于图像合成。具体来说,是一个基于GAN-inversion的图像重构过程。

在实践中,仅仅通过优化隐向量z难以准确重建ImageNet这样的复杂真实图像。训练GAN的数据集(ImageNet)本身是自然图片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模拟的图片分布与训练集图片分布也存在鸿沟。

即使存在以上限制,GAN仍然学习了丰富的图片信息,为了利用这些信息并且实现精确重建,我们让生成器online地适应于每张目标图片,即联合优化隐向量z和生成器参数。

d4926fdc-0283-11ed-ba43-dac502259ad0.png

我们将此新的目标称为深度生成先验(DGP),DGP显著提高了图像重构的效果。设计合适的距离度量和优化策略非常关键,在重建过程中,生成器原始的生成先验被修改了,输出真实自然图像的能力可能会下降。

02判别器指引的渐进式重建

从 latent space Z 中随机抽取几百个候选的初始 latent code,并选择在度量L下重构效果最好的一个。

在GAN重建中,传统的距离度量方法是 MSE 或 Perceptual loss。优化生成器参数时,将这些传统距离度量用在图像恢复如上色任务中,常常无法准确恢复颜色,并且重建过程中图像会变得模糊,需要设计更好的优化方式来保留生成器的原有信息。

我们在该工作中选择使用与生成器对应的判别器来作为距离度量。与Perceptual loss所采用的VGGNet不同,判别器并非在一个第三方的任务上训练,而是在预训练时就与生成器高度耦合,它天然地适用于调整生成器的输出分布。

使用这种基于判别器的距离度量时,重建的过程更加自然和真实,最终颜色恢复的效果也更好。

d4c46f50-0283-11ed-ba43-dac502259ad0.png

其中D(x, i)代表以x作为输入时判别器第i个block输出的特征

虽然改进的距离度量带来了更好的效果,但是图像复原的结果仍存在非自然痕迹,因为生成器在针对目标图片优化时,浅层参数匹配好图片整体布局之前,深层参数就开始匹配细节纹理了。

d4d8fee8-0283-11ed-ba43-dac502259ad0.png

上面的苹果图是几种训练策略的对比,从三行效果可以看出,有的苹果在训练初期没被染上色后期还是没被染上色,我们把这种现象称作“信息滞留”。

对策就是:使用渐进式重建的策略,即在微调生成器时,先优化浅层,再逐渐过渡到深层,让重建过程“先整体后局部”。

与非渐进策略相比,这种渐进策略更好地保留了缺失语义和现有语义之间的一致性。

d4ee357e-0283-11ed-ba43-dac502259ad0.png

03重建结果

使用BigGAN模型,基于ImageNet进行训练,使用ImageNet验证集中的1000张图像进行实验,取每类的第一张,相比于其他方法,DGP取得了非常高的PSNR和SSIM,视觉上的重建误差几乎难以察觉。

d51bea28-0283-11ed-ba43-dac502259ad0.png

04实验

因为GAN刻画了自然图像的先验,因此可以完成很多的任务:比如上色、补全、超分辨率等等,还能进行图像处理。下面放一些效果图。

图像上色

使用ResNet50上的分类精度作为定量评估结果, 下列方法的精度分别为 51.5%, 56.2%, 56.0%, 62.8%。

d56bab58-0283-11ed-ba43-dac502259ad0.png

图像补全

d58cc4f0-0283-11ed-ba43-dac502259ad0.png

超分辨率

d5b1deb6-0283-11ed-ba43-dac502259ad0.png

灵活性

d5c8ecdc-0283-11ed-ba43-dac502259ad0.png

随机扰动

d5e3a16c-0283-11ed-ba43-dac502259ad0.png

总结

GAN作为图像领域最强大的生成式模型之一,学习到了丰富的自然图像流形,可以对自然图像的恢复和编辑带来巨大帮助。

利用好大规模预训练模型的能力是深度学习目前各个领域的流行前沿,可以减少对训练数据的需求,整合相近的研究领域。

未来更强大的生成式模型,将带来更具实际应用价值的图像恢复和编辑应用,有望在更广泛的领域落地

d609a812-0283-11ed-ba43-dac502259ad0.png

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2382

    浏览量

    84328
  • 生成器
    +关注

    关注

    7

    文章

    322

    浏览量

    22790
  • 图像修复
    +关注

    关注

    0

    文章

    11

    浏览量

    2384

原文标题:深度学习论文精读[GAN]:利用深度生成先验进行多用途图像修复与处理

文章出处:【微信号:CVSCHOOL,微信公众号:OpenCV学堂】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    IDT Reon VX:先进图像处理器的卓越之选

    IDT Reon VX:先进图像处理器的卓越之选 在当今的显示应用领域,消费者对于图像质量的要求越来越高。IDT推出的Reon VX先进图像处理
    的头像 发表于 04-13 18:05 334次阅读

    综合图像处理硬件平台设计资料:2-基于6U VPX的双TMS320C6678+Xilinx FPGA K7 XC7K420T的图像信号处理

    FPGA光纤, XCVU9P板卡, 高速图像采集, 基带信号处理, 加速计算卡, 无线仿真平台, 图像信号处理
    的头像 发表于 03-30 14:39 114次阅读
    综合<b class='flag-5'>图像</b><b class='flag-5'>处理</b>硬件平台设计资料:2-基于6U VPX的双TMS320C6678+Xilinx FPGA K7 XC7K420T的<b class='flag-5'>图像</b>信号<b class='flag-5'>处理</b>板

    内孔堆焊激光熔覆修复加工:重塑工业修复的科技标杆‌

     在工业设备高负荷、极端工况的长期运转中,内孔作为齿轮轴、阀座、缸套等关键零部件的核心承载结构,常面临磨损、腐蚀、冲蚀及疲劳裂纹等多重损伤。传统修复技术(如电弧堆焊、电镀、喷涂)要么存在热影响区
    发表于 03-24 14:36

    VF2 Debian image 69 Web 浏览器失败,怎么修复

    只需启动并运行图像 69。 $ ip 一个 显示互联网连接已建立良好。 单击以运行默认的Web浏览器时,会弹出一条错误消息。 “无法执行默认 Web 浏览器。” 输入/输出错误。 有什么提示需要修复吗?
    发表于 03-24 06:54

    多通道兼容图像采集卡:一机搞定多路图像信号处理

    在工业自动化、安防监控、智能检测、医疗影像等领域,随着应用场景的不断升级,单路图像采集已无法满足多路信号同步接入、实时处理的重要需求。多通道兼容图像采集卡应运而生,以“一机集成、多路协同”为重要优势
    的头像 发表于 03-19 14:17 196次阅读
    多通道兼容<b class='flag-5'>图像</b>采集卡:一机搞定多路<b class='flag-5'>图像</b>信号<b class='flag-5'>处理</b>

    慧视光电——全栈图像处理板供应商

    随着AI日益渗透到各行各业,作为支撑平台的图像处理板日益成为人们关注的焦点,由于原来的系统集成商或一级配套单位不具备或者不完全具备图像处理案板的整体研发整理,因此全栈
    的头像 发表于 10-23 18:02 687次阅读
    慧视光电——全栈<b class='flag-5'>图像</b><b class='flag-5'>处理</b>板供应商

    中科亿海微Link-Sea-H6A图像处理套件

    Link-Sea-H6A图像处理套件是中科亿海微基于自研芯片EQ6HL130开发的适用于图像处理应用的开发套件。该套件主要由图像接口板、HL
    的头像 发表于 09-29 15:49 843次阅读
    中科亿海微Link-Sea-H6A<b class='flag-5'>图像</b><b class='flag-5'>处理</b>套件

    光纤图像处理卡设计原理图:520-基于ZU15EG 适配AWR2243的雷达验证底板 XCZU15EG架构高速信号处理

    高速信号处理, FPGA光纤, 光纤图像处理, XCZU15EG架构
    的头像 发表于 08-28 10:39 757次阅读
    光纤<b class='flag-5'>图像</b><b class='flag-5'>处理</b>卡设计原理图:520-基于ZU15EG 适配AWR2243的雷达验证底板 XCZU15EG架构高速信号<b class='flag-5'>处理</b>板

    FPGA 加持,友思特图像采集卡高速预处理助力视觉系统运行提速增效

    图像处理图像处理关键环节,可优化数据传输、减轻主机负担,其算法可在FPGA等硬件上执行。友思特FPGA图像采集卡凭借FPGA特性,能缩短
    的头像 发表于 08-13 17:41 1310次阅读
    FPGA 加持,友思特<b class='flag-5'>图像</b>采集卡高速预<b class='flag-5'>处理</b>助力视觉系统运行提速增效

    【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践,并尽量实现皮肤病理图片的识别,第二阶段

    豪兄重新学习了一下有关的AI论文精读系列,里面有很多model都是比较成熟的,而且子豪兄也给出了相关的代码: https://github.com/TommyZihao
    发表于 06-23 18:37

    HarmonyOS应用图像stride处理方案

    图像存储在内存中时,内存缓冲区可能在每行像素之后包含额外的填充字节。填充字节会影响图像在内存中的存储方式,但不会影响图像的显示方式。stride是内存中一行像素到内存中下一行像素的字节数;如果存在填充字节,则步幅比
    的头像 发表于 06-10 14:17 1343次阅读
    HarmonyOS应用<b class='flag-5'>图像</b>stride<b class='flag-5'>处理</b>方案

    降低液晶面板修复线的信号延迟及液晶线路修光修复

    引言 在液晶面板生产与修复过程中,修复线的信号延迟会严重影响修复效率与质量,同时液晶线路的损伤也需要有效的修复手段。研究降低信号延迟的方法以及液晶线路修光
    的头像 发表于 05-12 15:17 865次阅读
    降低液晶面板<b class='flag-5'>修复</b>线的信号延迟及液晶线路修光<b class='flag-5'>修复</b>

    使用ALINX VD100开发板实现图像处理

    这是一块基于 AMD Versal Edge AI 平台的开发板,功能特别强大,可以用来做图像处理、人工智能等各种高阶应用。
    的头像 发表于 05-12 09:23 1308次阅读
    使用ALINX VD100开发板实现<b class='flag-5'>图像</b><b class='flag-5'>处理</b>