DeepMind用强化对抗学习生成编写图像的程序-电子发烧友网

近几年，深度生成网络取得了令人印象深刻的成果，尽管如此，这些模型通常会在数据集的细节上浪费很多资源，这也许是由于解码器中弱感应偏差造成的。于是这时，图形引擎就派上了用场，因为它们能将低水平的细节变得抽象，然后用高水平的程序表示图像。目前将深度学习和渲染器结合的方法受限于似然性或距离函数，需要大量的监督，或难于将其推理算法扩展到更丰富的数据集中。于是，DeepMind的研究人员推出了SPIRAL，该智能体经过训练后能生成一个程序，它能通过图像引擎解释并采样图像。以下是对原文的编译。

人类的眼睛所看到的，并不仅仅是角膜反射的图像。例如当我们看到一幢建筑，沉迷于它精妙的设计时，我们会感叹工匠的高超技艺。这种通过思考创造它们的工具来欣赏物体的能力，使我们对世界有了更加丰富的理解，这也是人类智慧的一个重要方面。

我们希望系统可以创造出相似的对世界丰富的知觉。例如，在观察一幅油画作品时，我们想让它们了解绘画的笔触，而不仅仅是屏幕上单纯的像素。

在这项研究中，我们给智能体配备了与人类绘画相同的工具，可以让它们明白数位、字符和人像是如何绘制出来的。重要的是，它们完成的这一切都靠自我学习，无需人类标记过的数据集。这与最近一个需要人类数据集的研究不同，这一过程可能非常耗时。

我们设计了一款深度强化学习智能体SPIRAL，它可以和计算机的绘画程序交互，可以在电子画布上绘画，也可以改变笔刷的大小、按压强度和颜色。未经训练的智能体最初会漫无目的地在画布上涂鸦，于是我们必须创造出一种奖励智能体的方法，促使它画出有意义的作品。

为了这一目的，我们训练了另一个神经网络，称为判别器（discriminator），它的作用是判断该作品是否是智能体生成的，或者仅仅是从真实照片中采样的一张图片。绘画智能体是通过欺骗判别器认为绘画是真实与否的程度来获得奖励的。换句话说，智能体的奖励信号本身就是学习来的。虽然这很像生成对抗网络（GAN），但是二者的不同之处在于GAN中的生成器通常是直接输出像素的神经网络，而我们的智能体通过编写图形程序生成图像，从而在绘图环境中进行交互。

在实验的第一个装置中，智能体用于训练生成类似MNIST数字一样的图像：最后发现这些数字看上去很像MNIST，但画的方式不一样。为了生成能够欺骗过判别器的图像，智能体学着控制笔刷，然后让其适应不同数字的风格，这种技术成为视觉程序合成。

我们同样训练它重现具体的图像。在这里，判别器的目的是判断重新生成的图像是否是目标图像的复制品，还是真的由智能体生成的。判别器判断得越困难，智能体得到的奖励就越多。

重要的是，该框架也是可解释的，因为它能生成一串动作用来控制模拟笔刷。这意味着模型可以将其所学应用到模拟绘画软件上，在其他相似的环境中重新创造作品，例如在机械臂上。

该框架也可以扩展到真实数据集上。当我们训练智能体画出名人的脸时，它能够捕捉到脸部主要的特征，比如脸型、肤色和发型，有点街头艺人用仅有的画笔为人画肖像的感觉：

从原始感知中复原结构表示是人类能够轻易获得并经常使用的能力。在这项工作中，我们证明可以通过给智能体配备与人类相同的感知工具生成相似的表示。在这一过程中，它们学会制作可视化程序，这些程序能简洁地表达产生这种观察的因果关系。

尽管我们的工作仅是迈向灵活程序合成的一小步，但我们希望未来能有更多的技术，让人工智能体具备人类的感知、概括和交流能力。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4572

浏览量
98745
DeepMind

DeepMind

+关注

关注
0

文章
126

浏览量
10709

原文标题：DeepMind用强化对抗学习生成编写图像的程序

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

未来的AI 深挖谷歌 DeepMind 和它背后的技术

学习从非结构化数据中学习来编写分析报告或执行无人监督的任务。所有这些发展都为不同的公司发挥作用并证明他们的价值奠定了基础。因此，很多像DeepMind这样的公司成立了，来继续发展这一领

发表于 08-26 12:04

深度强化学习实战

内容2:课程一： TensoRFlow入门到熟练：课程二：图像分类：课程三：物体检测：课程四：人脸识别：课程五：算法实现：1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性

发表于 01-10 13:42

图像生成对抗生成网络gan_GAN生成汽车图像精选资料推荐

图像生成对抗生成网络ganHello there! This is my story of making a GAN that would generate images of cars

发表于 08-31 06:48

图像生成对抗生成网络

图像生成对抗生成网络ganby Thalles Silva 由Thalles Silva暖身 (Warm up)Let’s say there’s a very cool party going

发表于 09-15 09:29

谷歌、DeepMind重磅推出PlaNet 强化学习新突破

Google AI 与 DeepMind 合作推出深度规划网络 (PlaNet)，这是一个纯粹基于模型的智能体，能从图像输入中学习世界模型，完成多项规划任务，数据效率平均提升50倍，强化学习

发表于 02-17 09:30 •3071次阅读

基于生成器的图像分类对抗样本生成模型

，并保证攻击成功率。模型将对抗样本生成的过程视为对原图进行图像増强的操作引入生成对抗网络，并改进感知损失函数以增加对抗样本与原图在内容与特征

发表于 04-07 14:56 •2次下载

基于生成式对抗网络的端到端图像去雾模型

针对现有图像去雾算法严重依赖中间量准确估计的问题，提出了一种基于 Wasserstein生成对抗网络（wGAN）的端到端图像去雾模型。首先，使用全卷积密集块网络（FC- Dense Net充分

发表于 04-12 15:03 •20次下载

GAN图像对抗样本生成方法研究综述

为了提高生成对抗网络模型对抗样本的多样性和攻击成功率，提出了一种GAN图像对抗样本生成方法。首先，利用原始样本集整体训练一个深度卷积

发表于 04-28 16:39 •72次下载

基于密集卷积生成对抗网络的图像修复方法

度差等问题。针对上述问题，文中提出了一种基于密集卷积生成对抗网络的图像修复算法。该算法采用生成对抗网络作为图像修复的基本框架。首先，利用密集卷积块构建具有编解码结枃的

发表于 05-13 14:39 •15次下载

基于生成式对抗网络的图像补全方法

图像补全是数字图像处理领域的重要研究方向，具有广阔的应用前景。提出了一种基于生成式对抗网络（GAN）的图像补全方法。

发表于 05-19 14:38 •14次下载

基于结构保持生成对抗网络的图像去噪

基于循环生成对抗网络结构学习无配对 SD-OCT和EDI-oCT图像之间的域映射关系。为了克服循环生成对抗网络生成

发表于 06-07 14:21 •3次下载

基于像素级生成对抗网络的图像彩色化模型

基于像素级生成对抗网络的图像彩色化模型

发表于 06-27 11:02 •4次下载

一种基于生成对抗网络的无人机图像去雾算法

摘要: 无人机所采集的图像容易受到雾霾、雾气等阴霾天气干扰，造成图像质量下降。针对阴霾天气下无人机采集图像的质量下降问题，提出了一种新颖的基于生成对抗网络的

发表于 03-10 10:30 •1502次阅读

语言模型做先验，统一强化学习智能体，DeepMind选择走这条通用AI之路

在智能体的开发中，强化学习与大语言模型、视觉语言模型等基础模型的进一步融合究竟能擦出怎样的火花？谷歌 DeepMind 给了我们新的答案。一直以来，DeepMind 引领了强化学习（

发表于 07-24 16:55 •332次阅读

深度学习生成对抗网络（GAN）全解析

GANs真正的能力来源于它们遵循的对抗训练模式。生成器的权重是基于判别器的损失所学习到的。因此，生成器被它生成的

发表于 03-29 14:42 •97次阅读