0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

动漫生成器让照片秒变手绘日漫风!!!

lviY_AI_shequ 来源:机器之心 2020-05-12 09:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随手拍张照片,顺势转换为宫崎骏、新海诚等日漫大师的手绘风格作品,这个专门生成动漫图像的 GAN,实测很好用。

尽管最近 2019 年的图灵奖颁给了计算机图形学、颁给了皮克斯 3D 动画,但很多人可能认为二维动漫更有意思一些。像宫崎骏、新海诚这些大师手绘下的动漫,才有了灵魂,张张都能成为壁纸,而整个日漫也以二维为核心。 如果有模型能将真实画面转化为日漫风格的手绘画面,那一定非常炫酷。最近机器之心发现确实有这些模型,从 CartoonGAN 到 AnimeGAN 都能生成非常有意思的图像。

这里有一个 TensorFlow 新项目,它实现了 AnimeGAN,并提供了预训练模型。也就是说,我们下载后可以直接试试生成效果。作为日漫风格的爱好者,我们很快就试用了一下新项目。 项目地址:https://github.com/TachibanaYoshino/AnimeGAN 虽然原项目给出的最佳示例很多都是街景,但我们发现各种场景也都还行,如下是我们试用的原图与生成效果。看看第一张樱花道生成效果,忽然有一种《千与千寻》的感觉。

如果只针对人物,转换效果也是非常不错的。我们尝试将新垣结衣的照片输入 AnimeGAN 模型,然后就有如下这种神奇的画风,感觉直接用到动漫里也没什么问题了。

在原 GitHub 项目中,作者还给了非常多的示例,上面只是机器之心试用的结果,你也可以来用一用。 AnimeGAN 整个项目实现的是论文「AnimeGAN: a novel lightweight GAN for photo animation」中所提方法,作者在论文中分别将 AnimeGAN 与 CartoonGAN、ComixGAN 进行对比。

从图中可以看到,AnimeGAN 在细节方面的表现要优于以上两种方法,色彩相对而言更加自然,涂抹感也没有那么强烈。最明显的是第二行的效果图,使用 AnimeGAN 生成的漫画更加接近宫崎骏的画风。 方法简介 对于这个项目的 AnimeGAN,如下所示为 AnimeGAN 所采用的生成器网络与判别器网络。看起来模型整体是比较常规地一个卷积神经网络,但它会采用实例归一化以及新型的 LReLU 激活函数。

除了架构细节上的更新外,作者还提出了以下三个新的损失函数:

灰度风格(grayscale style)loss

灰度对抗(grayscale adversarial)loss

色彩重构(color reconstruction)loss

这些损失函数能够让生成图片的风格更加接近于真实的漫画风格。 下表比较了 ACartoonGAN 与 AnimeGAN 的模型大小与推理速度。可以明显看出,AnimeGAN 是个相对轻量级的 GAN,具有更少的参数量以及更快的推理速度。

总体来说,新提出来的 AnimeGAN 是一种轻量级的生成对抗模型,它采用了较少的模型参数,以及引入格拉姆矩阵(Gram matrix)来加强照片的风格。研究者的方法需要采用一系列真实图片与一系列动漫图片做训练,且这些图片并不需要成对匹配,这就表明训练数据非常容易获得。 项目实测 我们在 Ubuntu 18.04 下对本项目进行了测试,相关依赖环境如下:

python 3.6.8

tensorflow-gpu 1.8

opencv

tqdm

numpy

glob

argparse

这些依赖项可以说都是 CV 中常用的扩展库,我们就不用费尽心思去解决各种依赖环境冲突的问题了,这里给个好评。 以下是本项目的训练及测试详细流程。我们首先将 AnimeGAN 项目克隆到本地,在 Jupyter notebook 中输入:

!gitclonehttps://github.com/TachibanaYoshino/AnimeGAN

将工作目录切换到 AnimeGAN: importos os.chdir('AnimeGAN') print(os.getcwd()) 接下来下载项目作者提供的预训练模型,使用 vim download_staffs.sh 创建一个 Shell 文件,输入如下命令: URL=https://github.com/TachibanaYoshino/AnimeGAN/releases/download/Haoyao-style_V1.0/Haoyao-style.zip ZIP_FILE=./checkpoint/Haoyao-style.zip TARGET_DIR=./checkpoint/saved_model mkdir-p./checkpoint wget-N$URL-O$ZIP_FILE mkdir-p$TARGET_DIR unzip$ZIP_FILE-d$TARGET_DIR rm$ZIP_FILE DatesetURL=https://github.com/TachibanaYoshino/AnimeGAN/releases/download/dataset-1/dataset.zip ZIP_FILE=./dataset.zip TARGET_DIR=./dataset rm-rfdataset wget-N$DatesetURL-O$ZIP_FILE unzip$ZIP_FILE-d$TARGET_DIR rm$ZIP_FILE VGG_FILE=./vgg19_weight/vgg19.npy wget--load-cookies/tmp/cookies.txt"https://docs.google.com/uc?export=download&confirm=$(wget--quiet--save-cookies/tmp/cookies.txt--keep-session-cookies--no-check-certificate'https://docs.google.com/uc?export=download&id=1U5HCRpZWAbDVLipNoF8t0ZHpwCRX7kdF'-O-|sed-rn's/.*confirm=([0-9A-Za-z_]+).*/1 /p')&id=1U5HCRpZWAbDVLipNoF8t0ZHpwCRX7kdF"-O$VGG_FILE&&rm-rf/tmp/cookies.txt 保存后退出,以上命令会将预训练的模型、vgg19 权重以及训练数据集下载并保存到其对应目录下。在 notebook 中运行: !bashdownload_staffs.sh

至此即完成所有准备工作,运行如下代码就可以对模型进行训练了: !pythonmain.py--phasetrain--datasetHayao--epoch101--init_epoch1 AnimeGAN 的训练过程如下图所示:

当进行测试时,我们需要将用于测试的图片保存到 dataset/test/real 目录下,并运行如下代码: !pythontest.py--checkpoint_dircheckpoint/saved_model--test_dirdataset/test/real--style_nameH

当看到以上输出说明程序已经成功运行完成,生成结果保存在 results 文件夹下。可以看到,在 P100 GPU 上生成一幅图片需要大约 2.3 秒左右。 整体而言,运行速度还是比较快的,这么好玩的项目,你不来试下吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2330

    浏览量

    79247
  • 生成器
    +关注

    关注

    7

    文章

    322

    浏览量

    22507
  • 计算机图形学

    关注

    0

    文章

    12

    浏览量

    8333

原文标题:天秀!GitHub 硬核项目:动漫生成器让照片秒变手绘日漫风!!!

文章出处:【微信号:AI_shequ,微信公众号:人工智能爱好者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何通过地址生成器实现神经网络特征图的padding?

    ,从而使卷积输出特征图结果满足我们的需求,这种补零的操作称之为padding,如下图所示。 关于padding的实现,一般有两种操作,第一种是使用稀疏地址生成器,寻找padding数据地址的规律,当
    发表于 10-22 08:15

    全球首个动漫专属AI视频生成平台Animon,国内版"萌动AI"正式发布

    Animon国内版——"萌动AI"首秀:AI动漫创作进入全民时代 北京2025年9月25 /美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首个专注于动漫的AI视频
    的头像 发表于 09-25 12:33 549次阅读

    非对称密钥生成和转换规格详解

    生成 以字符串参数生成RSA密钥,具体的“字符串参数”由“RSA密钥类型”和“素数个数”使用符号“|”拼接而成,用于在创建非对称密钥生成器时,指定密钥规格。 说明:生成RSA非对称密
    发表于 09-01 07:50

    照片视频太普通?涂鸦On-App AI黑科技,宠物/人像1C位出片!

    一键识别人/宠物并实现智能居中,点一下就能让照片/视频变质感大片呢?01涂鸦助你一键生成氛围感写真基于强大的On-AppAI技术架构,涂鸦重磅推出AI写真+视频前
    的头像 发表于 08-14 18:55 895次阅读
    <b class='flag-5'>照片</b>视频太普通?涂鸦On-App AI黑科技,<b class='flag-5'>让</b>宠物/人像1<b class='flag-5'>秒</b>C位出片!

    会“说话”的空气管家:NRK3301加湿器音箱智能生活中枢

    告别繁琐操作,一句‘打开加湿器’就能享受舒适湿度,NRK3301语音模块加湿器音箱懂你的需求,智能生活从此开口即来。
    的头像 发表于 06-12 15:11 613次阅读
    会“说话”的空气管家:NRK3301<b class='flag-5'>让</b>加湿器音箱<b class='flag-5'>秒</b><b class='flag-5'>变</b>智能生活中枢

    当CCLink IE遇上DeviceNet,数据记录仪\"卷王\"?

    信技术的协议网关就能让记录仪\"卷王\",数据效率直接拉满。 协议\"鸡同鸭讲\"?网关组\"翻译天团\" 某汽车厂项目里,工程师加装
    发表于 06-11 14:48

    使用s32ds软件时,无法生成是怎么回事?

    使用s32ds软件时,无法生成,并显示以下错误消息。 请帮忙。 生成器:错误:错误:LinStackCfg.npf 行:5 “bus_clock” - 语法错误
    发表于 04-04 08:04

    “Quantum Origin”成首个获NIST验证的软件量子随机数生成器

    -Quantinuum的“Quantum Origin”成为首个通过NIST验证的软件量子随机数生成器 Quantum Origin获得NIST SP 800-90B对其验证熵源的批准 增强了联邦
    的头像 发表于 04-03 15:22 662次阅读

    EB Tresos状态显示无法运行生成器是什么原因导致的?

    我正在尝试集成 MCAL 包,但在生成过程中收到如下验证错误:“无法为模块”Dio_TS_T40D2M20I0R0“运行生成器
    发表于 04-02 08:06

    NRK3502离线语音识别芯片台灯“光影”小助手

    语音识别芯片NRK3502为台灯提供高可靠本地语音交互,低成本、隐私保护、工业级可靠,传统台灯智能,无需联网,实现智能家居普惠化。
    的头像 发表于 03-03 14:19 800次阅读
    NRK3502离线语音识别芯片<b class='flag-5'>让</b>台灯<b class='flag-5'>秒</b><b class='flag-5'>变</b>“光影”小助手

    敏捷合成器的技术原理和应用场景

    和幅度等特点。通过内部的正弦波源和外部调制输入,敏捷合成器能够生成各种复杂波形,并对其进行精确的调控。具体来说,敏捷合成器可能采用以下技术原理: 频率合成技术:利用锁相环(PLL)、直接数字合成
    发表于 02-20 15:25

    Python中的迭代器与生成器

    Python迭代器与生成器 列表生成式 列表生成式也叫做列表推导式,它本身还是列表,只不过它是根据我们定义的规则来生成一个真实的列表。     list2 = [x for x in
    的头像 发表于 02-20 10:43 681次阅读

    开源随机数生成器库OpenRNG助力实现移植到Arm平台时的最佳性能

    OpenRNG 实现了多种生成器和分布方式。生成器算法可生成“看似随机”并具有某些统计特性的序列,我们将在下文进行讨论。分布方式会将序列映射到常见的概率分布概念,如高斯分布或二项分布
    的头像 发表于 02-08 09:24 1815次阅读
    开源随机数<b class='flag-5'>生成器</b>库OpenRNG助力实现移植到Arm平台时的最佳性能

    超详细!FMU生成器用户手册来啦~

    FMU生成器是TSMaster中用于将模型打包生成FMU文件的一个工具,目前支持FMI3.0和FMI2.0版本,FMU类型仅支持Co-Simulation(CS),即联合仿真FMU。本文将介绍FMU
    的头像 发表于 01-17 20:02 1637次阅读
    超详细!FMU<b class='flag-5'>生成器</b>用户手册来啦~

    EE-322:面向SHARC处理器的专家代码生成器

    电子发烧友网站提供《EE-322:面向SHARC处理器的专家代码生成器.pdf》资料免费下载
    发表于 01-07 14:04 0次下载
    EE-322:面向SHARC处理器的专家代码<b class='flag-5'>生成器</b>