0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

必读!生成对抗网络GAN论文TOP 10

DPVg_AI_era 来源:lp 2019-03-20 09:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

生成对抗网络 (GAN) 是深度学习中最有趣、最受欢迎的应用之一。本文列出了 10 篇关于 GAN 的论文,这些论文将为你提供一个很好的对 GAN 的介绍,帮助你理解最先进技术的基础。

本文选择的10篇GAN论文包括:

DCGANs

Improved Techniques for Training GANs

Conditional GANs

Progressively Growing GANs

BigGAN

StyleGAN

CycleGAN

Pix2Pix

StackGAN

Generative Adversarial Networks

DCGANs — Radford et al.(2015)

我建议你以DCGAN这篇论文来开启你的GAN之旅。这篇论文展示了卷积层如何与GAN一起使用,并为此提供了一系列架构指南。这篇论文还讨论了GAN特征的可视化、潜在空间插值、利用判别器特征来训练分类器、评估结果等问题。所有这些问题都必然会出现在你的GAN研究中。

总之,DCGAN论文是一篇必读的GAN论文,因为它以一种非常清晰的方式定义架构,因此很容易从一些代码开始,并开始形成开发GAN的直觉。

DCGAN模型:具有上采样卷积层的生成器架构

论文:

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

Alec Radford, Luke Metz, Soumith Chintala

https://arxiv.org/abs/1511.06434

改进GAN训练的技术—— Salimans et al.(2016)

这篇论文(作者包括Ian Goodfellow)根据上述DCGAN论文中列出的架构指南,提供了一系列建议。这篇论文将帮助你了解GAN不稳定性的最佳假设。此外,本文还提供了许多用于稳定DCGAN训练的其他机器,包括特征匹配、minibatch识别、历史平均、单边标签平滑和虚拟批标准化。使用这些技巧来构建一个简单的DCGAN实现是一个很好的练习,有助于更深入地了解GAN。

论文:

Improved Techniques for Training GANs

Tim Salimans, Ian Goodfellow, Wojciech Zaremba, Vicki Cheung, Alec Radford, Xi Chen

https://arxiv.org/abs/1606.03498

Conditional GANs — Mirza and Osindero(2014)

这是一篇很好的论文,读起来很顺畅。条件GAN(Conditional GAN)是最先进的GAN之一。论文展示了如何整合数据的类标签,从而使GAN训练更加稳定。利用先验信息对GAN进行调节这样的概念,在此后的GAN研究中是一个反复出现的主题,对于侧重于image-to-image或text-to-image的论文尤其重要。

Conditional GAN架构:除了随机噪声向量z之外,类标签y被连接在一起作为网络的输入

论文:

Conditional Generative Adversarial Nets

Mehdi Mirza, Simon Osindero

https://arxiv.org/abs/1411.1784

Progressively Growing GANs— Karras et al.(2017)

Progressively Growing GAN (PG-GAN)有着惊人的结果,以及对GAN问题的创造性方法,因此也是一篇必读论文。

这篇GAN论文来自NVIDIA Research,提出以一种渐进增大(progressive growing)的方式训练GAN,通过使用逐渐增大的GAN网络(称为PG-GAN)和精心处理的CelebA-HQ数据集,实现了效果令人惊叹的生成图像。作者表示,这种方式不仅稳定了训练,GAN生成的图像也是迄今为止质量最好的。

它的关键想法是渐进地增大生成器和鉴别器:从低分辨率开始,随着训练的进展,添加新的层对越来越精细的细节进行建模。“Progressive Growing”指的是先训练4x4的网络,然后训练8x8,不断增大,最终达到1024x1024。这既加快了训练速度,又大大稳定了训练速度,并且生成的图像质量非常高。

Progressively Growing GAN的多尺度架构,模型从4×4 逐步增大到1024×1024

论文:

Progressive Growing of GANs for Improved Quality, Stability, and Variation

Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen

https://arxiv.org/abs/1710.10196

相关阅读:

迄今最真实的GAN:英伟达渐进增大方式训练GAN,生成前所未有高清图像

BigGAN — Brock et al.(2019)

BigGAN模型是基于ImageNet生成图像质量最高的模型之一。该模型很难在本地机器上实现,而且BigGAN有许多组件,如Self-Attention、Spectral Normalization和带有投影鉴别器的cGAN,这些组件在各自的论文中都有更好的解释。不过,这篇论文对构成当前最先进技术水平的基础论文的思想提供了很好的概述,因此非常值得阅读。

BigGAN生成的图像

论文:

Large Scale GAN Training for High Fidelity Natural Image Synthesis

Andrew Brock, Jeff Donahue, Karen Simonyan

https://arxiv.org/abs/1809.11096

StyleGAN — Karras et al.(2019)

StyleGAN模型可以说是最先进的,特别是利用了潜在空间控制。该模型借鉴了神经风格迁移中一种称为自适应实例标准化(AdaIN)的机制来控制潜在空间向量z。映射网络和AdaIN条件在整个生成器模型中的分布的结合使得很难自己实现一个StyleGAN,但它仍是一篇很好的论文,包含了许多有趣的想法。

StyleGAN架构,允许潜在空间控制

论文:

A Style-Based Generator Architecture for Generative Adversarial Networks

Tero Karras, Samuli Laine, Timo Aila

https://arxiv.org/abs/1812.04948

CycleGAN — Zhu et al.(2017)

CycleGAN的论文不同于前面列举的6篇论文,因为它讨论的是image-to-image的转换问题,而不是随机向量的图像合成问题。CycleGAN更具体地处理了没有成对训练样本的image-to-image转换的情况。然而,由于Cycle-Consistency loss公式的优雅性,以及如何稳定GAN训练的启发性,这是一篇很好的论文。CycleGAN有很多很酷的应用,比如超分辨率,风格转换,例如将马的图像变成斑马。

Cycle Consistency Loss背后的主要想法,一个句子从法语翻译成英语,再翻译回法语,应该跟原来的是同一个句子

论文:

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros

https://arxiv.org/abs/1703.10593

Pix2Pix — Isola et al.(2016)

Pix2Pix是另一种图像到图像转换的GAN模型。该框架使用成对的训练样本,并在GAN模型中使用多种不同的配置。读这篇论文时,我觉得最有趣部分是关于PatchGAN的讨论。PatchGAN通过观察图像的70×70的区域来判断它们是真的还是假的,而不是查看整个图像。该模型还展示了一个有趣的U-Net风格的生成器架构,以及在生成器模型中使用ResNet风格的skip connections。Pix2Pix有很多很酷的应用,比如将草图转换成逼真的照片。

使用成对的训练样本进行Image-to-Image转换

论文:

Image-to-Image Translation with Conditional Adversarial Networks

Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros

https://arxiv.org/abs/1611.07004

StackGAN — Zhang et al.(2017)

StackGAN的论文与本列表中的前几篇论文相比非常不同。它与Conditional GAN和Progressively Growing GANs最为相似。StackGAN模型的工作原理与Progressively Growing GANs相似,因为它可以在多个尺度上工作。StackGAN首先输出分辨率为64×64的图像,然后将其作为先验信息生成一个256×256分辨率的图像。

StackGAN是从自然语言文本生成图像。这是通过改变文本嵌入来实现的,以便捕获视觉特征。这是一篇非常有趣的文章,如果StyleGAN中显示的潜在空间控制与StackGAN中定义的自然语言接口相结合,想必会非常令人惊讶。

基于文本嵌入的StackGAN多尺度架构背后的想法

论文:

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks

Han Zhang, Tao Xu, Hongsheng Li, Shaoting Zhang, Xiaogang Wang, Xiaolei Huang, Dimitris Metaxas

https://arxiv.org/abs/1612.03242

Generative Adversarial Networks — Goodfellow et al.(2014)

Ian Goodfellow的原始GAN论文对任何研究GAN的人来说都是必读的。这篇论文定义了GAN框架,并讨论了“非饱和”损失函数。论文还给出了最优判别器的推导,这是近年来GAN论文中经常出现的一个证明。论文还在MNIST、TFD和CIFAR-10图像数据集上对GAN的有效性进行了实验验证。

论文:

Generative Adversarial Networks

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio

https://arxiv.org/abs/1406.2661

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2330

    浏览量

    79244
  • 分类器
    +关注

    关注

    0

    文章

    153

    浏览量

    13671
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123907

原文标题:必读!生成对抗网络GAN论文TOP 10

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Leadway GaN系列模块的工作温度范围

    ),在发动机舱内+93℃的高温下,模块支持20分钟快充,功率密度达10kW/L,效率96.8%。数据中心 英特尔数据中心12V电源采用GaN后,PUE(能源使用效率)降至1.08。在高温数据中心环境中
    发表于 11-12 09:19

    安森美入局垂直GaNGaN进入高压时代

    电子发烧友网综合报道 近日,安森美发布器垂直GaN功率半导体技术,凭借 GaN-on-GaN 专属架构与多项性能突破,为全球高功率应用领域带来革命性解决方案,重新定义了行业在能效、紧凑性与耐用性上
    的头像 发表于 11-10 03:12 5253次阅读

    Leadway GaN系列模块的功率密度

    场景提供高性价比的全国产解决方案。一、功率密度提升的核心逻辑材料特性突破: GaN(氮化镓)作为宽禁带半导体,电子迁移率(2000cm²/Vs)和饱和漂移速度(2.5×10⁷cm/s)远超传统硅基器件
    发表于 10-22 09:09

    声智科技AI耳机登顶东盟市场TOP1

    AI声学技术实力和基于高频场景精准定义的产品与创新,直接为声智带来高速的海外增长。2025年10月,仅上线1个月的声智AI耳机登顶东南亚TikTok榜单TOP1 ,店铺排名也进入TikTok 榜单TOP8。北美市场上线2周,销量
    的头像 发表于 10-21 15:25 713次阅读

    赣锋锂电荣登全球新能源品牌榜TOP10

    近日,由全球绿色能源理事会(GGIEC)、亚太新能源行业协会(NEIAAP)、亚洲光伏产业协会(APVIA)联合主办的 “全球新能源品牌榜 TOP10” 颁奖典礼在国家会展中心(上海)举行。
    的头像 发表于 07-18 17:56 1039次阅读

    硅无光束肖特基二极管 - 成对和四成对 skyworksinc

    电子发烧友网为你提供()硅无光束肖特基二极管 - 成对和四成对相关产品参数、数据手册,更有硅无光束肖特基二极管 - 成对和四成对的引脚图、接线图、封装手册、中文资料、英文资料,硅无光束
    发表于 07-14 18:33
    硅无光束肖特基二极管 - <b class='flag-5'>成对</b>和四<b class='flag-5'>成对</b> skyworksinc

    天合储能荣获自产电池系统TOP10榜单

    近日,在2025高工储能产业TOP50企业的颁奖典礼上,天合储能凭借深厚的全栈自研能力、卓越的系统集成优势和强大的全球化交付实力,荣膺 “自产电池·系统” TOP10榜单。这一奖项不仅是对天合储能技术实力与市场地位的认可,更是对其通过全产业链布局推动光储融合发展的肯定。
    的头像 发表于 07-11 17:44 993次阅读

    比克电池多款圆柱电池跻身全国出货量TOP10

    中国18650圆柱电池TOP10出货量排行榜(按只数排名)中,比克电池位列第七位;在2024中国21700圆柱电池TOP10出货量排行榜(按只数排名)中,比克电池排
    的头像 发表于 04-22 15:32 713次阅读
    比克电池多款圆柱电池跻身全国出货量<b class='flag-5'>TOP10</b>

    中国固态电池综合竞争力企业TOP10榜单发布,宁德时代、太蓝新能源领跑

    近日,中国最强固态电池TOP10榜单《中国固态电池综合竞争力企业TOP10》正式发布。该榜单由OFweek产业研究中心以技术、产能、市场及生态四维评价体系,深度剖析电池厂商在固态电池赛道中的战略卡位
    的头像 发表于 04-19 13:44 6129次阅读

    基于RV1126开发板网络配置方法

    描述网卡的工作方式,然后Netplan工具就会根据yaml文件中的描述去自动生成对应的网络配置。        网络管理工具[NetworkManager]或者[Systemd-network]就会根据
    的头像 发表于 04-15 14:57 706次阅读
    基于RV1126开发板<b class='flag-5'>网络</b>配置方法

    AspenCore评选中国Top10传感器公司出炉 豪威科技、格科微、思特威、汇顶科技等上榜(附全名单)

    模拟,每个类别挑选出Top  10,外加上市公司和EDA、IP公司这三个类别各自的Top 10,共同组成Fabless100 3+10
    的头像 发表于 04-02 18:54 4458次阅读
    AspenCore评选中国<b class='flag-5'>Top10</b>传感器公司出炉 豪威科技、格科微、思特威、汇顶科技等上榜(附全名单)

    博联智能荣膺2024光明奖“年度智能家居品牌TOP10

    近日,备受瞩目的 “智 + 出海”2025 中国照明行业品牌盛典于佛山盛大启幕。在这场汇聚行业精英的盛会中,中国照明灯饰电工行业年度重磅榜单 ——2024 “光明奖” 正式揭晓。博联智能凭借卓越的行业贡献与创新实力上榜 “年度智能家居品牌 TOP 10”,再度成为行业焦点
    的头像 发表于 03-10 10:55 1143次阅读

    #新年新气象,大家新年快乐!#AIGC入门及鸿蒙入门

    Generated Content,即人工智能生成内容。它利用人工智能技术自动生成或辅助生成文本、图像、音频、视频等内容。 AIGC的核心技术包括自然语言处理(NLP)、计算机视觉、生成对抗
    发表于 01-13 10:46

    AIGC入门及鸿蒙入门

    Generated Content,即人工智能生成内容。它利用人工智能技术自动生成或辅助生成文本、图像、音频、视频等内容。 AIGC的核心技术包括自然语言处理(NLP)、计算机视觉、生成对抗
    发表于 01-13 10:32

    使用 LMG5200POLEVM-10A GaN 48V-1V 负载点 EVM用户指南

    电子发烧友网站提供《使用 LMG5200POLEVM-10A GaN 48V-1V 负载点 EVM用户指南.pdf》资料免费下载
    发表于 12-29 15:32 0次下载
    使用 LMG5200POLEVM-<b class='flag-5'>10</b>A <b class='flag-5'>GaN</b> 48V-1V 负载点 EVM用户指南