0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

动漫生成器让照片秒变手绘日漫风!!!

lviY_AI_shequ 来源:机器之心 2020-05-12 09:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随手拍张照片,顺势转换为宫崎骏、新海诚等日漫大师的手绘风格作品,这个专门生成动漫图像的 GAN,实测很好用。

尽管最近 2019 年的图灵奖颁给了计算机图形学、颁给了皮克斯 3D 动画,但很多人可能认为二维动漫更有意思一些。像宫崎骏、新海诚这些大师手绘下的动漫,才有了灵魂,张张都能成为壁纸,而整个日漫也以二维为核心。 如果有模型能将真实画面转化为日漫风格的手绘画面,那一定非常炫酷。最近机器之心发现确实有这些模型,从 CartoonGAN 到 AnimeGAN 都能生成非常有意思的图像。

这里有一个 TensorFlow 新项目,它实现了 AnimeGAN,并提供了预训练模型。也就是说,我们下载后可以直接试试生成效果。作为日漫风格的爱好者,我们很快就试用了一下新项目。 项目地址:https://github.com/TachibanaYoshino/AnimeGAN 虽然原项目给出的最佳示例很多都是街景,但我们发现各种场景也都还行,如下是我们试用的原图与生成效果。看看第一张樱花道生成效果,忽然有一种《千与千寻》的感觉。

如果只针对人物,转换效果也是非常不错的。我们尝试将新垣结衣的照片输入 AnimeGAN 模型,然后就有如下这种神奇的画风,感觉直接用到动漫里也没什么问题了。

在原 GitHub 项目中,作者还给了非常多的示例,上面只是机器之心试用的结果,你也可以来用一用。 AnimeGAN 整个项目实现的是论文「AnimeGAN: a novel lightweight GAN for photo animation」中所提方法,作者在论文中分别将 AnimeGAN 与 CartoonGAN、ComixGAN 进行对比。

从图中可以看到,AnimeGAN 在细节方面的表现要优于以上两种方法,色彩相对而言更加自然,涂抹感也没有那么强烈。最明显的是第二行的效果图,使用 AnimeGAN 生成的漫画更加接近宫崎骏的画风。 方法简介 对于这个项目的 AnimeGAN,如下所示为 AnimeGAN 所采用的生成器网络与判别器网络。看起来模型整体是比较常规地一个卷积神经网络,但它会采用实例归一化以及新型的 LReLU 激活函数。

除了架构细节上的更新外,作者还提出了以下三个新的损失函数:

灰度风格(grayscale style)loss

灰度对抗(grayscale adversarial)loss

色彩重构(color reconstruction)loss

这些损失函数能够让生成图片的风格更加接近于真实的漫画风格。 下表比较了 ACartoonGAN 与 AnimeGAN 的模型大小与推理速度。可以明显看出,AnimeGAN 是个相对轻量级的 GAN,具有更少的参数量以及更快的推理速度。

总体来说,新提出来的 AnimeGAN 是一种轻量级的生成对抗模型,它采用了较少的模型参数,以及引入格拉姆矩阵(Gram matrix)来加强照片的风格。研究者的方法需要采用一系列真实图片与一系列动漫图片做训练,且这些图片并不需要成对匹配,这就表明训练数据非常容易获得。 项目实测 我们在 Ubuntu 18.04 下对本项目进行了测试,相关依赖环境如下:

python 3.6.8

tensorflow-gpu 1.8

opencv

tqdm

numpy

glob

argparse

这些依赖项可以说都是 CV 中常用的扩展库,我们就不用费尽心思去解决各种依赖环境冲突的问题了,这里给个好评。 以下是本项目的训练及测试详细流程。我们首先将 AnimeGAN 项目克隆到本地,在 Jupyter notebook 中输入:

!gitclonehttps://github.com/TachibanaYoshino/AnimeGAN

将工作目录切换到 AnimeGAN: importos os.chdir('AnimeGAN') print(os.getcwd()) 接下来下载项目作者提供的预训练模型,使用 vim download_staffs.sh 创建一个 Shell 文件,输入如下命令: URL=https://github.com/TachibanaYoshino/AnimeGAN/releases/download/Haoyao-style_V1.0/Haoyao-style.zip ZIP_FILE=./checkpoint/Haoyao-style.zip TARGET_DIR=./checkpoint/saved_model mkdir-p./checkpoint wget-N$URL-O$ZIP_FILE mkdir-p$TARGET_DIR unzip$ZIP_FILE-d$TARGET_DIR rm$ZIP_FILE DatesetURL=https://github.com/TachibanaYoshino/AnimeGAN/releases/download/dataset-1/dataset.zip ZIP_FILE=./dataset.zip TARGET_DIR=./dataset rm-rfdataset wget-N$DatesetURL-O$ZIP_FILE unzip$ZIP_FILE-d$TARGET_DIR rm$ZIP_FILE VGG_FILE=./vgg19_weight/vgg19.npy wget--load-cookies/tmp/cookies.txt"https://docs.google.com/uc?export=download&confirm=$(wget--quiet--save-cookies/tmp/cookies.txt--keep-session-cookies--no-check-certificate'https://docs.google.com/uc?export=download&id=1U5HCRpZWAbDVLipNoF8t0ZHpwCRX7kdF'-O-|sed-rn's/.*confirm=([0-9A-Za-z_]+).*/1 /p')&id=1U5HCRpZWAbDVLipNoF8t0ZHpwCRX7kdF"-O$VGG_FILE&&rm-rf/tmp/cookies.txt 保存后退出,以上命令会将预训练的模型、vgg19 权重以及训练数据集下载并保存到其对应目录下。在 notebook 中运行: !bashdownload_staffs.sh

至此即完成所有准备工作,运行如下代码就可以对模型进行训练了: !pythonmain.py--phasetrain--datasetHayao--epoch101--init_epoch1 AnimeGAN 的训练过程如下图所示:

当进行测试时,我们需要将用于测试的图片保存到 dataset/test/real 目录下,并运行如下代码: !pythontest.py--checkpoint_dircheckpoint/saved_model--test_dirdataset/test/real--style_nameH

当看到以上输出说明程序已经成功运行完成,生成结果保存在 results 文件夹下。可以看到,在 P100 GPU 上生成一幅图片需要大约 2.3 秒左右。 整体而言,运行速度还是比较快的,这么好玩的项目,你不来试下吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2392

    浏览量

    84939
  • 生成器
    +关注

    关注

    7

    文章

    322

    浏览量

    22859
  • 计算机图形学

    关注

    0

    文章

    12

    浏览量

    8411

原文标题:天秀!GitHub 硬核项目:动漫生成器让照片秒变手绘日漫风!!!

文章出处:【微信号:AI_shequ,微信公众号:人工智能爱好者社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索 SN54LS181、SN54S181、SN74LS181 和 SN74S181 算术逻辑单元/函数生成器

    探索 SN54LS181、SN54S181、SN74LS181 和 SN74S181 算术逻辑单元/函数生成器 在电子工程师的日常设计工作中,选择合适的芯片是实现高效、可靠电路的关键。今天,我们就来
    的头像 发表于 04-22 16:40 442次阅读

    GS4901B/GS4900B:视频与音频时钟及定时生成的理想之选

    GS4901B/GS4900B:视频与音频时钟及定时生成的理想之选 在电子设计领域,时钟和定时生成器对于确保系统的稳定运行和精确同步至关重要。今天,我们就来深入探讨一下 Gennum 公司
    的头像 发表于 04-15 10:10 249次阅读

    ICS2008B:SMPTE时间码接收器/生成器的技术解析

    ICS2008B:SMPTE时间码接收器/生成器的技术解析 在多媒体技术飞速发展的今天,时间码的精确控制对于音视频同步至关重要。ICS2008B作为一款SMPTE时间码接收器/生成器芯片,为多媒体
    的头像 发表于 04-13 18:10 465次阅读

    探秘ICS841402I:PCIe与sRIO时钟生成的理想之选

    探秘ICS841402I:PCIe与sRIO时钟生成的理想之选 在电子设计领域,时钟信号的稳定性和准确性对于系统的性能至关重要。今天,我们就来深入了解一款优化的PCIe和sRIO时钟生成器
    的头像 发表于 04-12 12:40 497次阅读

    探索ICS9FG104E:PCIe Gen1/2、USB3.0等设备的频率生成器解决方案

    探索ICS9FG104E:PCIe Gen1/2、USB3.0等设备的频率生成器解决方案 在电子设备的设计中,频率生成器扮演着至关重要的角色,它为各种高速接口提供稳定的时钟信号,确保设备的正常运行
    的头像 发表于 03-29 17:05 985次阅读

    SBC案例生成器对VisionFive2的支持

    最近收到了我的 VisionFive2,并且是 SBC 模型框架和 SBC 案例生成器的开发人员,我为那些对标准和自定义案例感兴趣的人在这两个应用程序中添加了对 VisionFive2 SBC
    发表于 03-18 08:21

    桨的“能量密钥”:疆鸿智能Ethernet/IP转Modbus伺服精准捕风

    桨的“能量密钥”:疆鸿智能Ethernet/IP转Modbus伺服精准捕风  在电行业的巨擘风车之上,桨系统如同精准的“智慧
    的头像 发表于 03-17 14:37 222次阅读
    <b class='flag-5'>风</b>电<b class='flag-5'>变</b>桨的“能量密钥”:疆鸿智能Ethernet/IP转Modbus<b class='flag-5'>让</b>伺服精准捕风

    解码语:疆鸿智能EtherCAT转Ethernet/IP网关为桨注入智能基因

    (EtherCAT协议)与桨系统(Ethernet/IP协议)因“数字语言”壁垒无法协同,疆鸿智能EtherCAT转Ethernet/IP网关化身“协议解码者”,在毫秒间架起能量通途,
    的头像 发表于 03-16 14:32 318次阅读
    解码<b class='flag-5'>风</b>语:疆鸿智能EtherCAT转Ethernet/IP网关为<b class='flag-5'>风</b>电<b class='flag-5'>变</b>桨注入智能基因

    探索Renesas 9FGV0431:低功耗PCIe时钟生成器的卓越之选

    探索Renesas 9FGV0431:低功耗PCIe时钟生成器的卓越之选 引言 在当今的电子设计领域,PCIe技术的广泛应用对时钟生成器提出了更高的要求。Renesas的9FGV0431作为一款专为
    的头像 发表于 03-15 17:25 1274次阅读

    商汤科技多剧集生成智能体Seko2.0重磅发布

    作为行业首个创编一体、多剧集生成智能体,Seko2.0专为当下炙手可热的短剧、剧行业的个人创作者与工作室量身打造,“一人剧组”变成可能。
    的头像 发表于 12-17 14:08 1013次阅读

    如何通过地址生成器实现神经网络特征图的padding?

    ,从而使卷积输出特征图结果满足我们的需求,这种补零的操作称之为padding,如下图所示。 关于padding的实现,一般有两种操作,第一种是使用稀疏地址生成器,寻找padding数据地址的规律,当
    发表于 10-22 08:15

    全球首个动漫专属AI视频生成平台Animon,国内版&quot;萌动AI&quot;正式发布

    Animon国内版——"萌动AI"首秀:AI动漫创作进入全民时代 北京2025年9月25 /美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首个专注于动漫的AI视频
    的头像 发表于 09-25 12:33 1494次阅读

    非对称密钥生成和转换规格详解

    生成 以字符串参数生成RSA密钥,具体的“字符串参数”由“RSA密钥类型”和“素数个数”使用符号“|”拼接而成,用于在创建非对称密钥生成器时,指定密钥规格。 说明:生成RSA非对称密
    发表于 09-01 07:50

    照片视频太普通?涂鸦On-App AI黑科技,宠物/人像1C位出片!

    一键识别人/宠物并实现智能居中,点一下就能让照片/视频变质感大片呢?01涂鸦助你一键生成氛围感写真基于强大的On-AppAI技术架构,涂鸦重磅推出AI写真+视频前
    的头像 发表于 08-14 18:55 1557次阅读
    <b class='flag-5'>照片</b>视频太普通?涂鸦On-App AI黑科技,<b class='flag-5'>让</b>宠物/人像1<b class='flag-5'>秒</b>C位出片!

    会“说话”的空气管家:NRK3301加湿器音箱智能生活中枢

    告别繁琐操作,一句‘打开加湿器’就能享受舒适湿度,NRK3301语音模块加湿器音箱懂你的需求,智能生活从此开口即来。
    的头像 发表于 06-12 15:11 1026次阅读
    会“说话”的空气管家:NRK3301<b class='flag-5'>让</b>加湿器音箱<b class='flag-5'>秒</b><b class='flag-5'>变</b>智能生活中枢