0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI画的简笔画能到什么水平

人工智能与大数据技术 来源:金磊 作者:金磊 2020-12-25 11:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI画的简笔画能到什么水平?

给一张美国演员Rami Malek的照片,效果是这样的。

是不是和原图很逼近了?

再来看下输入《老友记》合影的效果。

虽然人物众多,但出来的简笔画效果,依旧还是能分清剧中的人物。

如果毛发特别浓密的人物照,AI还能hold得住吗?

小姐姐“爆炸头”的边缘毛发,也算得上是完美还原了。

再近距离一些的呢?来看“霉霉”(Taylor Swift)照片的效果。

可以说是相当的细节了,把发丝的层次感、光感,以及衣物的褶皱,都发挥的“淋漓尽致”。

……

这些就是出自一个叫ArtLine的AI的作品。

而且它在Reddit非常火爆,已经达到了1100+的热度。

如此惟妙惟肖的效果,你是不是认为又是GAN的功劳?

错!

ArtLine完全没有用到GAN:

也正因如此,ArtLine的效果真真儿的惊艳到了网友。

那么,它是如何做到的呢?

ArtLine背后的三大“法宝”

ArtLine的作者十分爽快地分享了其背后的三大技术:

Self-Attention

Progressive Resizing

Generator Loss

接下来,一起逐一看下各个技术背后的细节内容。

Self-Attention部分引用的技术,出自两年前GAN之父lan Goodfellow等人提出的研究。

等等,刚才不是还说“没用到GAN”吗?

作者对此的解释是:

并没有起到太大作用。

这项研究主要是在GAN生成中加入了注意力机制,同时将SNgan的思想引入到生成器当中。

所要解决的是传统GAN自身存在的一些问题,例如:

使用小的卷积核很难发现图像中的依赖关系

使用大的卷积核就会丧失卷积网络参数与计算的效率

研究中核心的自注意力机制如下图所示。

其中,f(x),g(x)和h(x)都是普通的1x1卷积,差别只在于输出通道大小不同。

而后,将f(x)的输出转置,并和g(x)的输出相乘,再经过softmax归一化,得到一个Attention Map。

得到Attention Map之后,和h(x)逐像素点相乘,得到自适应的注意力feature maps。

206cd116-4658-11eb-8b86-12bb97331649.png

从结果上来看,引入自注意力机制的效果,确实在FID和IS两个性能指标下,得到了较好的效果。

ArtLine涉及到的第二个技术灵感,来自英伟达在2018年的一项研究。

20a9d660-4658-11eb-8b86-12bb97331649.png

这项研究主要提出了一种新的训练对抗神经网络的方法。

核心思想是逐步训练生成器和判别器:从低分辨率开始,随着训练进程推进,逐步增加新的层来提炼细节。

这种方法不仅加快了训练速度并且更加稳定,可以产生高质量的图像。

ArtLine所涉及到的最后一个技术,是来自斯坦福大学李飞飞团队在2016年提出的研究。

这项研究主要解决了实现的风格转换,比较费时的问题。

风格转换部分主要用了上面的网络模型,这个模型可以分为两部分:左侧是图像转换网络,而右侧是损耗网络。

其超分辨率重建也是采用上面的网络模型,只是具体内部的图像转换网络部分稍有区别。

这个网络与之前的研究相比,效果达到了相当的水平,但速度却提升了百倍之多,达到3个数量级。

21dfa44c-4658-11eb-8b86-12bb97331649.png

关于作者

ArtLine的项目作者叫做Vijish Madhavan。

他在GitHub中坦言自己并非程序员出身,也道出了ArtLine目前存在的一些缺陷,例如处理像素低于500px的图像时,效果并不理想等。

现在,ArtLine可以在线玩了!

感兴趣的读者,可以戳下方链接体验一下。

Colab链接:

https://colab.research.google.com/github/vijishmadhavan/Light-Up/blob/master/ArtLine(Try_it_on_Colab).ipynb.ipynb)
https://colab.research.google.com/github/vijishmadhavan/Light-Up/blob/master/ArtLine.ipynb

GitHub项目地址:

https://github.com/vijishmadhavan/ArtLine

责任编辑:xj

原文标题:这个AI“大师级”简笔画水平,惊艳到了网友:竟然不用GAN

文章出处:【微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38120

    浏览量

    296664
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2331

    浏览量

    79244

原文标题:这个AI“大师级”简笔画水平,惊艳到了网友:竟然不用GAN

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    VS680 HDMI AI分析解决方案 #目标识别 #视频翻译 #AI #芯片

    AI
    深蕾半导体
    发布于 :2025年11月12日 10:29:33

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验科学、理论科学、计算科学、数据驱动科学一起构成
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑在本质上就是一台湿润的软组织
    发表于 09-06 19:12

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    。 你的任务是:根据用户提供的指定主题,自动构思并随机生成具有创造性和童趣的绘本插画 要求: 1. 图像风格应统一为“绘本插画风格”,可带有手绘、水彩、蜡笔、油画或简笔画的质感。 2. 保持温暖
    发表于 08-21 13:59

    AI 芯片浪潮下,职场晋升新契机?

    申报人员提供继续教育证明 。关注行业前沿动态,参加各类专业培训、学术研讨会,不仅有助于提升自身专业水平,还能为职称申报积累必要的学分。 通过阅读最新的学术论文、行业报告,了解 AI 芯片领域的最新研究成果
    发表于 08-19 08:58

    K230芯片温度过高会烧掉吗?最高能到多少度呢?

    如题,K230芯片温度过高会烧掉吗?最高能到多少度?我有时候运行的时候发现芯片温度到70度了,会不会烧坏
    发表于 08-08 06:09

    触摸芯片全面选型指南:从功能到场景的全维度考量

    触摸芯片全面选型指南:从功能到场景的全维度考量
    的头像 发表于 07-17 17:54 509次阅读

    【BPI-CanMV-K230D-Zero开发板体验】视频会议场景下的 AI 应用(电子云台 EPTZ、人像居中 / 追踪、画中

    上人物表情细节,又想看清整个舞台画面时,“画中”功能就提供了这种优势。“画中”通过在画面上叠加一个全景画面,来达到同时看清人物细节和舞台全景的效果。   除此之外,会议场景还有诸多 AI
    发表于 07-09 20:56

    不知道怎么原理图了

    某天,某实验室,几位工程师在讨论《原理图设计规范》。一秒之前还很和谐,下一秒讨论原理图怎么的时候,大家的意见就分歧很大了。类似于“豆浆是喝甜的还是咸的”、“粽子里面是放枣子还是放肉”。原来电路图
    的头像 发表于 04-30 18:40 808次阅读
    不知道怎么<b class='flag-5'>画</b>原理图了

    AI 时代开启,企业跟风做 AI 产品是明智之举?

    AI
    华成工控
    发布于 :2025年04月10日 17:28:44

    AI多模态智能预警系统如何提升油田安全管理水平#人工智能

    AI
    jf_60804796
    发布于 :2025年04月02日 10:52:06

    华为AI Calling解决方案打造AI时代业务入口

    产品线CS&IMS领域总裁陈海永发表了《AI赋能新通话,构筑智能业务入口》主题演讲,指出在5G-A时代,基于原生拨号盘和音频、视频、数据通道能力,华为提供AI Calling解决方案,帮助运营商从AI使
    的头像 发表于 03-06 11:10 1090次阅读

    ADS1299可以直接采集μv的电压信号吗,他的精度能到多少啊?

    ADS1299可以直接采集μv的电压信号吗,他的精度能到多少啊
    发表于 01-08 06:48

    TDC7201-ZAX-EVM评估板的最高测量频率能到多少?

    TDC7201-ZAX-EVM评估板的最高测量频率能到多少?自带的GUI中最快100ms刷新一次测量结果,是否就是上限了?另外,能提供可调用的LabVIEW函数吗?
    发表于 12-24 06:00