0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一位网友便利用StyleGAN耗时5天创作出了999幅抽象派画作!

DPVg_AI_era 来源:lp 2019-04-19 14:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英伟达推出的StyleGAN在前不久大火了一把。今日,Reddit一位网友便利用StyleGAN耗时5天创作出了999幅抽象派画作!不仅如此,他还将创作过程无私的分享给了大家,引来众网友的一致好评。

人人都能当抽象派画作大师了!

去年,佳士得拍卖会上拍卖了一副由AI创作的肖像画——《爱德蒙·贝拉米的肖像》,该画最终售价43.25万美元(301万元人民币),远远超过了7000到1万美元的预计售价,同时也引发了人们对人工智能作画的热烈探讨。

爱德蒙·贝拉米的肖像

今天,Reddit上一位网友利用StyleGAN训练生成了999幅抽象派画作!

生成的其中一幅画作

这项工作使得其他网友们羡慕不已:

那么,这999幅AI生成的画作中,是否又会出现天价作品呢?值得拭目以待。

利用StyleGAN训练生成抽象派画作

这位名为“_COD32_”的网友在Reddit上毫无保留的分享了这项工作的创作过程。

Reddit地址:

https://www.reddit.com/r/MachineLearning/comments/bagnq6/p_stylegan_trained_on_paintings_512x512/

在模型方面,采用的依旧是去年英伟达爆款StyleGAN,这是一种新的生成器架构,基于风格迁移,将面部细节分离出来,由模型进行单独调整,从而大幅度超越传统GAN等模型。

英伟达StyleGAN GitHub官方地址:

https://github.com/NVlabs/stylegan

在数据方面,采用的是Kaggle上名为”Painter by Numbers“项目中的数据集,其中大部分的图像数据来源于WikiArt.org网站。

Kaggle地址:

https://www.kaggle.com/c/painter-by-numbers/data

其中,只采用了≥1024X2014的图像。在GTX 1080 TI上的训练时间大约是5天。

不过作者表示,该模型试图生成人脸的部分并不是很完美,但其它部分还算可以。

例如下面两个随机向量之间的快速隐空间差值(latent space interpolation):

同时,作者也给出了训练好的模型和Jupyter Notebook地址:

https://mega.nz/#!PsIQAYyD!g1No7FDZngIsYjavOvwxRG2Myyw1n5_U9CCpsWzQpIo

https://colab.research.google.com/drive/1cFKK0CBnev2BF8z9BOHxePk7E-f7TtUi

英伟达“造假”黑科技:StyleGAN简介

StyleGAN是英伟达提出的一种用于生成对抗网络的替代生成器体系结构,该结构借鉴了样式迁移学习的成果。新结构能够实现自动学习,以及无监督的高级属性分离(比如在使用人脸图像训练时区分姿势和身份属性)和生成的图像(如雀斑,头发)的随机变化,并能在图像合成和控制上实现直观化和规模化。

新模型在传统的分布质量指标方面实现了提升,并且更好地解决了潜在的变量因素。为了对插值质量和分解进行量化,本模型提出了两种适用于任何生成架构的自动化新方法。以及一个新的、高度多样化、高质量的人脸数据集。

英伟达研究人员在论文中写道,他们提出的新架构可以完成自动学习,无监督地分离高级属性(例如在人脸上训练时的姿势和身份)以及生成图像中的随机变化,并且可以对合成进行更直观且特定于比例的控制。

换句话说,这种新的GAN在生成和混合图像,特别是人脸图像时,可以更好地感知图像之间有意义的变化,并且在各种尺度上针对这些变化做出引导。

例如,研究人员使用的旧系统可能产生两个“不同”的面部,这两个面部其实大致相同,只是一个人的耳朵被抹去了,两人的衬衫是不同的颜色。而这些并不是真正的面部特异性特征,不过系统并不知道这些是无需重点关注的变化,而当成了两个人来处理。

在上面的动图中,其实面部已经完全变了,但“源”和“样式”的明显标记显然都得到了保留,例如最底下一排图片的蓝色衬衫。为什么会这样?请注意,所有这些都是完全可变的,这里说的变量不仅仅是A + B = C,而且A和B的所有方面都可以存在/不存在,具体取决于设置的调整方式。

下面这些由计算机生成的图像都不是真人。但如果我告诉你这些图像是真人的照片,你可能也不会怀疑:

效果如此出众的StyleGAN一经开源就成了“网红”,由该模型生成的假脸几乎完全可以乱真,即使是放大了仔细看,大多数情况下依然难以分清,其难度堪比“大家来找茬”。

为此,有人甚至专门写了一篇指南,专门指点那些有兴趣“鉴脸”的人,该文总结出了StyleGAN生成假脸的几处常见的破绽。不过,这些破绽大部分是在图片背景、配饰、衣物等附加元素上找到的,面部本身的破绽虽然也有,但显著性和易见性都要下降一个档次。

上图的StyleGAN生成图像在面部上几乎无破绽,但左右耳的首饰不对称

被玩坏的StyleGAN:从“假人脸”到“假房子”,生成世间万物

StyleGAN生成假脸图像的逼真程度令人惊艳,但这么厉害的模型只能用来生成假人脸吗?显然不是。很快,越来越多的吃瓜群众发现了StyleGAN的更多潜力。比如生成假的出租房。

前不久,就有好事者利用StyleGAN生成了一个假的Airbnb租房网站,上面从房源图片、地址、再到租客的评论和打分没有一个是真实的,全是StyleGAN的杰作。

假房生成网站 thisairbnbdoesnotexist.com,每次刷新都会出现一个虚假的房源,网页上的照片、文字描述、发布人头像均由计算机自动生成。由于使用的模型非常简单,文字描述多有不合逻辑之处,但乍看上去还是能以假乱真。来源:假房生成网站 thisairbnbdoesnotexist.com

AirBNB网站截图,避免广告嫌疑做了虚化处理

根据Christopher Schmidt在Twitter的介绍,生成每个网页用一块GPU只需0.5秒,相关代码开源,你可以在这里找到:

https://colab.research.google.com/github/tensorflow/tpu/blob/master/tools/colab/shakespeare_with_tpu_and_keras.ipynb

这个“假房源”网站是怎么做的?

网站上的图像当然由著名的图像生成模型StyleGAN生成,文本则来自在一个AirBNB列表(文末链接[1])上训练的语言模型,主要基于Tensorflow的“Predict Shakespeare with Cloud TPU”(https://t.co/sJoUbwZ2UL)。

这个文本生成模型似乎是个两层的前馈LSTM(文末链接[2]),主要是用它来独立训练生成房屋列表中的标题、描述、房主姓名、地理位置等,然后组合生成综合列表。

每个模型的输出都是预先生成的,每5秒创建一个新的列表(网页)。唯一的修改是根据文本稍微调整序列大小。

下面是Christopher Schmidt在Twitter上对这个“假房子”网站的简要介绍,包括灵感来源、大致结构、构建页面使用的框架和训练方式等。

本页面在开发时主要使用以下几种模型:在构建图片和卧室照片时使用StyleGAN,一些文本网络的训练使用了tf.keras来生成地点名称、房主姓名、标题和描述。此外还使用了Tensorflow的实例代码)

所有的数据训练过程都在谷歌的Colab上完成,该平台上可以免费使用GPU和TPU来训练和生成数据。

每个模型都可以做出独立的预测,所以会经常出现各部分信息不相配的情况,比如描述信息中说某套房子有一间卧室,但列表信息中显示有四件卧室,或者外观和名字排列不齐等。

但总的来看,这个过程是比较理想的,我在这个学习过程中也获得了不少乐趣,进一步掌握了一些模型的使用技巧。这里要感谢Colab平台,更感谢StyleGAN社群的出色研究成果。

有了这个思路,应用方向什么的就不用愁了,基于StyleGAN模型的假简历、假食物、假猫咪等等如雨后春笋一样不断涌现。甚至有人把这些“造假成果”汇总到了一个网站,叫“这些东西都不存在”。

这样看来,StyleGAN已经火到了几乎要被“玩坏”的程度。未来再出现什么样的假货,可能已经不取决于模型本身,而是程序员们的脑洞了。

介绍了这么多,大家是不是也想玩一玩StyleGAN呢?打开下方链接,快去尝鲜吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50325

    浏览量

    266967
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261
  • 英伟达
    +关注

    关注

    23

    文章

    4115

    浏览量

    99631

原文标题:StyleGAN玩出新高度!生成999幅抽象画,人人都是毕加索(附代码)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    树莓5还是香橙5 Pro?两款热门开发板的详细对比

    。千兆以太口均支持通过扩展板实现以太供电(PoE),电源需求均为5V/5A。 从国内用户的使用习惯来看,香橙
    发表于 03-04 19:29

    分体 T5 LED 灯管的开关设计,怎样提升使用便利性?

    从不同类型的开关设计及其带来的便利进行阐述。、传统手动开关设计优化位置与标识优化:传统手动开关应设计在易于触及的位置。对于安装在天花板的分体T5LED灯管,开关可
    的头像 发表于 02-12 13:11 303次阅读
    分体 T<b class='flag-5'>5</b> LED 灯管的开关设计,怎样提升使用<b class='flag-5'>便利</b>性?

    一张网正在重塑数字政府新底座

    早上八点,来自南海的风拂过深圳湾。一位年轻的科技创业者通过“i深圳”APP快速完成了企业注册的所有手续,包括工商登记、税务申报等,全程无纸化。曾经需要往返多个部门、耗时数周的企业设立流程,现在只需动动手指就能完成,大大节省了时间和精力。这样的日常,如今已在全国遍地开花。
    的头像 发表于 01-10 15:10 1904次阅读

    BSI为电子颁发ISO/SAE 21434道路车辆网络安全管理体系认证证书

    载网络安全管理体系的建立、实施与维护方面,展现出对国际标准的深入理解和卓越实践能力,顺利通过认证。电子总经理昌总、研发中心负责人娄总,BSI 长三角区域销售负责人杨明明共同出席颁证仪式,同见证了这
    的头像 发表于 12-29 16:25 336次阅读
    BSI为<b class='flag-5'>天</b><b class='flag-5'>派</b>电子颁发ISO/SAE 21434道路车辆网络安全管理体系认证证书

    解密基于磁编码器的印刷张力控制系统精度提升技术

    在印刷行业,张力控制可是个至关重要的环节。想象下,如果印刷过程中张力不稳定,那印出来的东西可能就像一幅抽象派画作,歪歪扭扭、图案模糊,根本没法看。而基于磁编码器的印刷张力控制系统,就
    的头像 发表于 08-18 17:29 859次阅读
    解密基于磁编码器的印刷张力控制系统精度提升技术

    华大九“芯聚九”系列活动助力集成电路产业蓬勃发展

    华大九希望通过“芯聚九”系列活动,打造个行业精英与企业应用通畅交流的专业平台,营造以“开放、合作、创新”为主体的产业生态圈,促进技术交流、行业合作及成长共享,让每一位参与者都能在
    的头像 发表于 07-22 09:57 1267次阅读

    在树莓5上开启YOLO姿态估计识别之旅!

    大家好,接下来会为大家开个树莓5和YOLO的连载文章。内容包括四个部分:在树莓5上使用YOLO进行物体和动物识别-入门指南在树莓
    的头像 发表于 07-18 15:31 2760次阅读
    在树莓<b class='flag-5'>派</b><b class='flag-5'>5</b>上开启YOLO姿态估计识别之旅!

    在树莓5上使用YOLO进行物体和动物识别-入门指南

    大家好,接下来会为大家开个树莓5和YOLO的专题。内容包括四个部分:在树莓5上使用YOLO进行物体和动物识别-入门指南在树莓
    的头像 发表于 07-17 17:16 2326次阅读
    在树莓<b class='flag-5'>派</b><b class='flag-5'>5</b>上使用YOLO进行物体和动物识别-入门指南

    个套件就能让多路高清摄像头接入树莓5

    ,推出了适用于树莓5的GMSL相机接入套件,支持多路GMSL摄像头同时接入。本文将介绍该套件的应用场景、硬件连接方式及软件配置方法,帮助您快速完成安装与设置,助力
    的头像 发表于 07-10 16:18 2010次阅读
    <b class='flag-5'>一</b>个套件就能让多路高清摄像头接入树莓<b class='flag-5'>派</b><b class='flag-5'>5</b>?

    搭载树莓CM5:Sfera Labs 工业控制器!

    搭载树莓计算模块5的工业计算机:快速、灵活且可靠!为更好地满足工业客户的需求,SferaLabs对StratoPiMax平台进行了升级,利用树莓计算模块
    的头像 发表于 07-01 17:41 856次阅读
    搭载树莓<b class='flag-5'>派</b>CM<b class='flag-5'>5</b>:Sfera Labs 工业控制器!

    VIVADO自带Turbo译码器IP核怎么用?

    ,last和最后一位输入数据对齐,等s_axis_data_tready拉高以后输入数据。 译码器输出的m_axis_debug_tdata有输出,但不知道都代表哪些信息,m_axis_hstat_tdatah和m_axis_hdata_tdata都没有输出,不知道是哪里有问题,请有经验的
    发表于 06-23 17:39

    树莓分类器:用树莓识别不同型号的树莓

    在本教程系列的第部分中,您将学习如何使用树莓AI摄像头来检测不同的树莓型号。本系列由DavidPlowman创建,他是树莓工程师,专注于图像处理硬件、摄像头软件和算法研究。您可
    的头像 发表于 06-13 16:39 1546次阅读
    树莓<b class='flag-5'>派</b>分类器:用树莓<b class='flag-5'>派</b>识别不同型号的树莓<b class='flag-5'>派</b>!

    涂鸦AI画画机器人开发方案

    AI画画机器人作为人工智能与艺术融合的创新产物,如今火得塌糊涂。全球首由AI机器人创作画作《AI之神》(旨在致敬人工智能之父--艾伦·图灵),在苏富比拍卖行卖
    的头像 发表于 06-12 18:17 1575次阅读
    涂鸦AI画画机器人开发方案

    关于 树莓5 超频:你需要知道的切!

    摘要树莓5可通过超频提升性能,对于机器学习等处理器密集型任务尤为有用。超频树莓5时,需将其温度控制在80°C以下。官方树莓
    的头像 发表于 06-10 17:29 3019次阅读
    关于 树莓<b class='flag-5'>派</b><b class='flag-5'>5</b> 超频:你需要知道的<b class='flag-5'>一</b>切!

    树莓5 与 树莓4:深度对比与独特优势!

    随着技术的不断发展,推动创新与创造力的工具和设备也在不断升级。其中,树莓派系列凭借其多功能性和强大性能,在从简单的DIY项目到复杂的计算任务等众多应用场景中脱颖而出。随着树莓5的近期发布,爱好者
    的头像 发表于 05-21 13:15 3430次阅读
    树莓<b class='flag-5'>派</b><b class='flag-5'>5</b> 与 树莓<b class='flag-5'>派</b>4:深度对比与独特优势!