0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于GAN-inversion的图像重构过程

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2022-07-13 14:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

笔者最近在集中时间学习对抗生成网络(GAN),特别是深度生成先验进行多用途图像修复与处理,需要对图像修复与处理经典论文进行回顾和精读。

将从图像修复与处理的经典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》开始,重启精读之路。

DGP提出了一种挖掘GAN中图像先验的方式,在多个任务上揭示了GAN作为一种通用图像先验的潜力。

论文提出了同时插值隐变量和生成器的渐变式图像反演方法,可以应用于复杂图片的对抗防御,在实验中DGP所展现出的强大的像素间空间关系模拟能力也十分有趣。

Deep generative prior的图像复原效果

01深度生成先验

深度图像先验DIP仅依靠输入图像的统计信息,无法应用于需要更一般的图像统计信息的任务,如图像上色和图像编辑。

我们更感兴趣的是研究一种更通用的图像先验,即在大规模自然图像上训练的GAN生成器用于图像合成。具体来说,是一个基于GAN-inversion的图像重构过程。

在实践中,仅仅通过优化隐向量z难以准确重建ImageNet这样的复杂真实图像。训练GAN的数据集(ImageNet)本身是自然图片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模拟的图片分布与训练集图片分布也存在鸿沟。

即使存在以上限制,GAN仍然学习了丰富的图片信息,为了利用这些信息并且实现精确重建,我们让生成器online地适应于每张目标图片,即联合优化隐向量z和生成器参数。

e8a3abdc-026d-11ed-ba43-dac502259ad0.png

我们将此新的目标称为深度生成先验(DGP),DGP显著提高了图像重构的效果。设计合适的距离度量和优化策略非常关键,在重建过程中,生成器原始的生成先验被修改了,输出真实自然图像的能力可能会下降。

02判别器指引的渐进式重建

从 latent space Z 中随机抽取几百个候选的初始 latent code,并选择在度量L下重构效果最好的一个。

在GAN重建中,传统的距离度量方法是 MSE 或 Perceptual loss。优化生成器参数时,将这些传统距离度量用在图像恢复如上色任务中,常常无法准确恢复颜色,并且重建过程中图像会变得模糊,需要设计更好的优化方式来保留生成器的原有信息。

我们在该工作中选择使用与生成器对应的判别器来作为距离度量。与Perceptual loss所采用的VGGNet不同,判别器并非在一个第三方的任务上训练,而是在预训练时就与生成器高度耦合,它天然地适用于调整生成器的输出分布。

使用这种基于判别器的距离度量时,重建的过程更加自然和真实,最终颜色恢复的效果也更好。

e8da5646-026d-11ed-ba43-dac502259ad0.png

其中D(x, i)代表以x作为输入时判别器第i个block输出的特征

虽然改进的距离度量带来了更好的效果,但是图像复原的结果仍存在非自然痕迹,因为生成器在针对目标图片优化时,浅层参数匹配好图片整体布局之前,深层参数就开始匹配细节纹理了。

e8efceea-026d-11ed-ba43-dac502259ad0.png

上面的苹果图是几种训练策略的对比,从三行效果可以看出,有的苹果在训练初期没被染上色后期还是没被染上色,我们把这种现象称作“信息滞留”。

对策就是:使用渐进式重建的策略,即在微调生成器时,先优化浅层,再逐渐过渡到深层,让重建过程“先整体后局部”。

与非渐进策略相比,这种渐进策略更好地保留了缺失语义和现有语义之间的一致性。

e91b971e-026d-11ed-ba43-dac502259ad0.png

03重建结果

使用BigGAN模型,基于ImageNet进行训练,使用ImageNet验证集中的1000张图像进行实验,取每类的第一张,相比于其他方法,DGP取得了非常高的PSNR和SSIM,视觉上的重建误差几乎难以察觉。

04实验

因为GAN刻画了自然图像的先验,因此可以完成很多的任务:比如上色、补全、超分辨率等等,还能进行图像处理。下面放一些效果图。

图像上色

使用ResNet50上的分类精度作为定量评估结果, 下列方法的精度分别为 51.5%, 56.2%, 56.0%, 62.8%。

e9a097ca-026d-11ed-ba43-dac502259ad0.png

图像补全

e9c15870-026d-11ed-ba43-dac502259ad0.png

超分辨率

e9e2b7a4-026d-11ed-ba43-dac502259ad0.png

灵活性

e9f9a248-026d-11ed-ba43-dac502259ad0.png

随机扰动

ea27bb4c-026d-11ed-ba43-dac502259ad0.png

总结

GAN作为图像领域最强大的生成式模型之一,学习到了丰富的自然图像流形,可以对自然图像的恢复和编辑带来巨大帮助。

利用好大规模预训练模型的能力是深度学习目前各个领域的流行前沿,可以减少对训练数据的需求,整合相近的研究领域。

未来更强大的生成式模型,将带来更具实际应用价值的图像恢复和编辑应用,有望在更广泛的领域落地

ea5a7d48-026d-11ed-ba43-dac502259ad0.png

原文标题:深度学习论文精读[GAN]:利用深度生成先验进行多用途图像修复与处理

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2330

    浏览量

    79244
  • 生成器
    +关注

    关注

    7

    文章

    322

    浏览量

    22505
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123907

原文标题:深度学习论文精读[GAN]:利用深度生成先验进行多用途图像修复与处理

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Leadway GaN系列模块的工作温度范围

    Leadway GaN系列模块通过材料创新、工艺优化和严格测试,实现了-40℃至+85℃(部分+93℃)的宽温工作范围,同时兼顾高功率密度(120W/in³)和高效率(≥92%),为工业自动化
    发表于 11-12 09:19

    “芯”品发布 | 高可靠GaN专用驱动器,便捷GaN电源设计

    芯品发布高可靠GaN专用驱动器,便捷GaN电源设计GaN功率器件因为其高工作频率和高转化效率的优势,逐渐得到电源工程师的青睐。然而增强型GaN功率器件的驱动电压一般在5~7V,驱动窗口
    的头像 发表于 11-11 11:46 440次阅读
    “芯”品发布 | 高可靠<b class='flag-5'>GaN</b>专用驱动器,便捷<b class='flag-5'>GaN</b>电源设计

    安森美入局垂直GaNGaN进入高压时代

    电子发烧友网综合报道 近日,安森美发布器垂直GaN功率半导体技术,凭借 GaN-on-GaN 专属架构与多项性能突破,为全球高功率应用领域带来革命性解决方案,重新定义了行业在能效、紧凑性与耐用性上
    的头像 发表于 11-10 03:12 5254次阅读

    北京理工大学与中科曙光成功研发大规模冷冻电镜图像原位重构软件

    冷冻电镜技术是解析生物大分子三维结构的关键手段,曾获2017年诺贝尔化学奖,并在新冠病毒结构解析中发挥重要作用。然而,该技术的数据处理面临图像信噪比低、计算规模巨大、重构耗时长等挑战,尤其在大规模原位结构解析中缺乏高效算法与软件支持。
    的头像 发表于 10-31 14:45 407次阅读

    FPGA的图像采集过程

    0010100100000100,同样根据SPI时序可得到41号传感器的值已经设置为4。在一次使能过程中可将全部需要配置的寄存器配置好,之后传感器可正常工作,再将帧请求信号置高,传感器便可采集图像
    发表于 10-29 06:23

    AES和SM4算法的可重构分析

    相似的实现过程,可以进行可重构设计。同时,这两种算法在加解密过程中会频繁使用寄存器来存储数据 二、可重构S盒设计思路 在GF下,AES的S盒输出公式为 Z=M(X^-1)+V,
    发表于 10-23 07:26

    Leadway GaN系列模块的功率密度

    Leadway GaN系列模块以120W/in³的功率密度为核心,通过材料创新、电路优化与封装设计,实现了体积缩减40%、效率提升92%+的突破。其价值在于为工业自动化、机器人、电动汽车等空间受限
    发表于 10-22 09:09

    GaN HEMT开关过程中振荡机制与驱动设计考量

    增强型GaN HEMT具有开关速度快、导通电阻低、功率密度高等特点,正广泛应用于高频、高效率的电源转换和射频电路中。但由于其栅极电容小,栅极阈值电压低(通常在1V到2V之间)、耐受电压低(通常-5V到7V)等特点,使得驱动电路设计时需格外注意,防止开关过程中因误导通或振荡
    的头像 发表于 08-08 15:33 2522次阅读
    <b class='flag-5'>GaN</b> HEMT开关<b class='flag-5'>过程</b>中振荡机制与驱动设计考量

    增强AlN/GaN HEMT

    一种用于重掺杂n型接触的选择性刻蚀工艺实现了AlN/GaN HEMT的缩小 上图:原位SiN/AlN/GaN HEMT外延堆叠示意图 俄亥俄州立大学的工程师们宣称,他们已经打开了一扇大门,有望制备出
    的头像 发表于 06-12 15:44 698次阅读
    增强AlN/<b class='flag-5'>GaN</b> HEMT

    GaN LLC电源EMC优化技巧

    目录 1,整机线路架构 2,初次极安规Y电容接法 3,PFC校正电路参数选取及PCB布具注意事项 4,LLC环路设计注意事项 5,GaN驱动电路设计走线参考 6,变压器输出整流注意事项 一,整体线路图 获取完整文档资料可下载附件哦!!!!如果内容有帮助可以关注、点赞、评论支持一下哦~
    发表于 05-28 16:15

    一种低翘曲扇出重构方案

    翘曲(Warpage)是结构固有的缺陷之一。晶圆级扇出封装(FOWLP)工艺过程中,由于硅芯片需通过环氧树脂(EMC)进行模塑重构成为新的晶圆,使其新的晶圆变成非均质材料,不同材料间的热膨胀和收缩程度不平衡则非常容易使重构晶圆发
    的头像 发表于 05-14 11:02 1005次阅读
    一种低翘曲扇出<b class='flag-5'>重构</b>方案

    功率GaN的新趋势:GaN BDS

    电子发烧友综合报道 最近多家GaN厂商推出双向GaN功率开关,即GaN BDS(Bidirectional Switch,双向开关)。这是一种较为新型的GaN功率器件产品,顾名思义,双
    发表于 04-20 09:15 1253次阅读

    OptiSystem应用:真实图像在光纤中传输后的恢复

    经过50km的光纤系统进行传输,光电转化并滤波之后,我们用数据恢复器件(Data Recovery)来恢复二进制信号,再用图像重构组件(Image Reconstructor)接收二进制信号实现对传
    发表于 03-03 09:26

    GAN039-650NBB氮化镓(GaN)FET规格书

    电子发烧友网站提供《GAN039-650NBB氮化镓(GaN)FET规格书.pdf》资料免费下载
    发表于 02-13 16:10 0次下载
    <b class='flag-5'>GAN</b>039-650NBB氮化镓(<b class='flag-5'>GaN</b>)FET规格书

    GAN041-650WSB氮化镓(GaN)FET规格书

    电子发烧友网站提供《GAN041-650WSB氮化镓(GaN)FET规格书.pdf》资料免费下载
    发表于 02-13 14:24 2次下载
    <b class='flag-5'>GAN</b>041-650WSB氮化镓(<b class='flag-5'>GaN</b>)FET规格书