0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一款基于GAN的AI修图大师可以将你从这类工作中解放出来

DPVg_AI_era 来源:lq 2019-02-27 09:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作为一个设计师,是否整天因为繁琐枯燥的修图工作不胜其烦?现在,一款基于GAN的AI修图大师可以将你从这类工作中解放出来。修轮廓、改表情、生发、加耳环、去眼镜、补残图,你能想到的它都能一键搞定。

这可能是史上最牛的AI修图大师。

在一张人脸图片上画上几笔,比如说勾出一个眉毛的轮廓,它就能自动把草图修正成真实的图片,即使你毫无艺术细胞,也没关系,只要能够大致表明想修哪里,剩下的活儿就都交给它好了。

这款工具由韩国电子与电信通讯研究所的Youngjoo Jo和Jongyoul Park开发,它比一般的脸部图片编辑工具或应用程序更高级,可以改变发型、把严肃脸改成笑脸,甚至可以加入原本没有的配饰,比如耳环、耳钉等。还可以在一张被部分遮挡的面部图像上生成完整的脸部图像,还能把图中的人戴的太阳镜去掉等等。

来看看这款“AI修图大师”的神奇效果:

改变脸部轮廓特征和瞳孔颜色

生发(划重点)、变笑脸、加头饰,都不在话下

加个耳环、耳坠什么的,只要划出大致位置就行了

强大的自动补全功能

草绘秒变真人,画风夸张也没问题

这款“神器”的开发者之一Youngjoo Jo表示:我们认为这个程序可以让设计师不用做那么多枯燥的劳动,让他们把更多的精力集中在创造性的工作上,不过这并不是说只有设计师才能使用这款工具,用户不需要具备设计上的专业知识。

机器学习研究人员Alex Champandard表示,这款工具与过去基于GAN的面部图片编辑程序相比实现了一次重大进步。

“当你面对这样的技术创新时,不免会在激动之余感到一丝害怕。”这种工具将不可避免地改变设计师的日常工作节奏和内容,但他并不认为这类工具会让设计师面临失业。

“现在的一个重要问题是,我们接下来要怎样做,才能让这一工具更好地服务于那些工作内容可能出现重大改变的人们?如何让这款工具成为这些人的好帮手,而不是威胁?”

SC-FEGAN:基于神经网络的人脸图像编辑系统

要达到这个神奇的效果,离不开SC-FEGAN。

SC-FEGAN是一种基于神经网络的人脸图像编辑系统,并提供了实现批量输入数据的方法。该网络可以端到端地进行训练,并生成具有逼真纹理细节的高质量合成图像。

该研究成果由韩国团队发表于arXiv:

论文地址:

https://arxiv.org/pdf/1902.06838.pdf

训练数据

恰当的训练数据有助于提高网络训练性能。

在训练本模型时,作者在几个预处理步骤之后使用CelebA-HQ数据集:

随机选择2组29000张图像用于训练,1000张图像用于测试;

在获得草图和颜色数据集之前,将图像调整为512×512像素。

为了更好的表达人脸图像中眼睛的复杂性,作者采用基于眼睛位置的free-from mask来训练网络。

此外,还使用了free from mask和人脸分割GFC创建了适当的草图域和颜色域。

这是非常关键的一步。因为它使得系统能够为手绘用户输入案例产生有说服力的结果。

网络结构

该网络同样也可以同时训练生成器和鉴别器。

生成器接收带有用户输入的不完整图像,在RGB通道中创建输出图像,并将输出图像的掩码区域插入到不完整输入图像中,以创建完整图像。

鉴别器接收完成的图像或原始图像(没有掩蔽)以确定给定输入是真实的还是假的。

在对抗训练中,识别器的额外用户输入也有助于提高性能。 此外,团队还发现与一般GAN损失不同的额外损失对于恢复大的擦除部分是有效的。

该网络架构如下图所示:

图注:SC-FEGAN的网络架构。除了输入和输出,LRN应用于所有卷积层之后。使用tanh作为发生器输出的激活函数。采用SN卷积层作为鉴别器。

生成器

生成器是基于U-net,所有卷积层使用3x3大小核的门控卷积。在除了其他soft gate之外的特征映射卷积层之后应用局部信号归一化(LRN)。LRN适用于除输入层和输出层之外的所有卷积层。

生成器的编码器接收尺寸为512×512×9的输入张量:具有在编辑时要被去除区域的不完整RGB通道图像,描述被去除部分结构的二进制草图、RGB颜色笔划图、二元掩模和噪音(如下图所示)。

草图和颜色域数据集以及批处理的输入。我们使用HED边缘检测器提取草图。使用GFC ,通过分割区域的中间颜色生成颜色图。 网络的输入包括不完整的图像、掩模、草图、颜色和噪声。

编码器使用2个步幅内核卷积对输入进行7次下采样,然后在上采样之前进行扩张卷积。

解码器使用转置的卷积进行上采样。然后,添加跳跃连接(skip connection)以允许与具有相同空间分辨率的先前层连接。

除了使用tanh函数的输出层之外,我们在每一层之后都使用了leaky ReLU激活函数。

总的来说,我们的发生器由16个卷积层组成,网络的输出是相同大小的输入(512×512)的RGB图像。

在将损失函数应用于输入图像之前,用输入图像替换了掩模外部的图像的剩余部分。这种替换允许发电机专门在编辑区域上进行训练。发生器受到了PartialConv中引入的损失的训练:每像素损失、感知损失、风格损失和总方差损失。还使用通用GAN损失函数。

鉴别器

该鉴别器有SNPatchGAN结构。同时,也使用3×3大小卷积内核,并应用了gradient penalty损失。还增加了额外的一项,避免了鉴别器输出patch的值接近于零。

总体损失函数如下:

其中,发生器用LG进行训练,鉴别器用LD进行训练。D(I)是鉴别器给定输入I的输出。

而当编辑大面积区域时,额外损失(如Lstyle和Lpercept)是非常关键的。

多种场景修图俱佳,AI修图大师大显身手

那么,这款AI修图大师的修图结果如何呢?

首先将结果与Coarse-Refined net结构和U-net结构网络进行了比较。在测试Coarse-Refined net结构时,注意到细化阶段模糊了输出。而下图便展示了在Coarse-Refined net上使用本文方法后的结果。

在U-net和Coarse-Refined net上使用本文方法后的结果

本文的系统不仅在上述细节方面,在大面积区域修改方面也是具有优势的。

有/没有VGG损失的训练结果

在处理自由形状遮掩情况时,本文系统所产生的结果也较好。

与Celebf-HQ验证集上的Deepfillv1进行定性比较

下图显示了使用草图和颜色输入的各种结果。实验结果表明,该系统能够使用户很直接地编辑人脸图像的发型、脸型、眼睛、嘴巴等特征。

系统的面部图像编辑结果。 它表明系统可以正确地改变面部的形状和颜色。 还表明可以用于改变眼睛的颜色或擦除不必要的部分。 特别是右下角的两个结果表明系统也可以用于新的发型修饰。

GAN生成的图像结果通常显示出对训练数据集的高度依赖性。在本研究中,研究人员将HED应用于所有的区域,通过调度它来扩展掩蔽区域,能够获得特殊的结果,产生面部图像和耳环。

下图显示了这些有趣结果的选择。这些例子表明,该网络能够学习小细节,即使是很小的输入也能产生合理的结果。

特别的结果

总结

本文提出了一种基于端到端可训练生成网络的自由形状掩模、草图、颜色输入的图像编辑系统。

实验结果表明,与其他研究相比,该网络架构和损失功能显着改善了修复效果。并在许多情况下显示了各种成功和逼真的编辑结果。

该系统在一次性修复大面积区域方面表现极佳,使用者不需要费力就可以产生高质量和逼真的效果。

堪称AI修图大师!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4829

    浏览量

    106891
  • 图像
    +关注

    关注

    2

    文章

    1096

    浏览量

    42179
  • GaN
    GaN
    +关注

    关注

    21

    文章

    2339

    浏览量

    79328

原文标题:最强GAN修图魔术师:美颜生发摘眼镜、草绘秒变真人脸

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI+EDA如何重塑验证效率

    AI+EDA”如何重塑验证效率以及客户应用成果。 验证自动化应该是每个验证工程师的终极梦想,这不仅意味着效率的提升,更代表着可以将工程师从重复繁重的手工任务解放出来,将创造力聚焦于
    的头像 发表于 12-04 10:52 937次阅读
    <b class='flag-5'>AI</b>+EDA如何重塑验证效率

    小马智行亮相第二十届中国经济论坛

    “人工智能的发展目标,绝不止是‘模仿人类’,而是要在分析、决策等方面展现‘超越人类’的能力,最终实现责任从人转移到AI,从而将人类从日常劳动解放出来。”在第二十届中国经济论坛上,小马智行创始人兼CEO彭军博士以“引领
    的头像 发表于 11-21 15:49 300次阅读

    陶氏化学借助AI技术重塑网络安全

    威胁狩猎、事件响应到新人培训的智能化变革。AI技术不仅大幅缩短了警报响应时间,将分析师从繁琐任务解放出来,为企业智能化转型与安全防御提供了全新范式。
    的头像 发表于 10-10 09:21 684次阅读

    凌晨两点的急诊室:被校准卡壳的抢救设备

    工程师们从繁琐记录解放出来,当患者因准确诊断获得及时救治 —— 这正是校准工作的初心。在慢性病高发、精准医疗兴起的今天,“误差零容忍” 不仅是技术标准,更是医疗行业对生命的承诺。
    的头像 发表于 09-19 11:28 205次阅读
    凌晨两点的急诊室:被校准卡壳的抢救设备

    AI 芯片浪潮下,职场晋升新契机?

    、新架构不断涌现。能够在工作中提出创新性的解决方案,推动 AI 芯片性能、功耗、成本等关键指标的优化,将极大提升在职称评审的竞争力。例如,在芯片设计引入新的计算范式,如存算
    发表于 08-19 08:58

    Analog Devices Inc. ADAQ8092 14位105MSPS μModule®数据手册

    (ADC) 驱动器、电压基准和ADC。μModule解决方案将设计人员从设计、器件选择、优化和布局工作中解放出来,简化了高速数据采集系统的开发。ADAQ8092可减少6倍占位面积。
    的头像 发表于 06-19 15:57 630次阅读
    Analog Devices Inc. ADAQ8092 14位105MSPS μModule®数据手册

    SGK5872-20A 是一款高功率 GaN-HEMT,其内部匹配标准通信频段,可提供最佳功率和线性度。

    :SGK5872-20A 是一款高功率 GaN-HEMT,其内部匹配标准通信频段,可提供最佳功率和线性度。 现货库存qq:419341947
    发表于 06-16 16:18

    BM6GD11BFJ-LB罗姆首面向高耐压GaN器件驱动的隔离型栅极驱动器IC开始量产

    在高频、高速开关过程实现更稳定的驱动,有助于电机和服务器电源等大电流应用进步缩减体积并提高效率。 新产品是ROHM首面向高耐压GaN HEMT的隔离型栅极驱动器IC。在电压反复急
    的头像 发表于 06-04 14:11 4.2w次阅读
    BM6GD11BFJ-LB罗姆首<b class='flag-5'>款</b>面向高耐压<b class='flag-5'>GaN</b>器件驱动的隔离型栅极驱动器IC开始量产

    【开源分享】Made with KiCad(128):CANBoard V2 开源一款支持CAN的简单IO板

    、PCB、3D 及 BOM,查询设计器件、走线、焊盘的属性详情。还可以在原理图中与AI小助手互动,帮您更高效地学习设计细节: 概览 CANBoard 是一款支持 CAN 的简
    发表于 06-03 14:17

    滚珠丝杆在工作中损耗会影响什么?

    滚珠丝杆在工作中的损耗会对设备的性能、精度、寿命和运行稳定性产生多方面的影响。
    的头像 发表于 05-10 17:54 398次阅读
    滚珠丝杆在<b class='flag-5'>工作中</b>损耗会影响什么?

    AI开发板】正点原子K230D BOX开发板来了!一款性能强悍且小巧便携的AI开发板!

    AI开发板】正点原子K230D BOX开发板来了!一款性能强悍且小巧便携的AI开发板! 正点原子K230D BOX是一款性能强悍且小巧便携的A
    发表于 02-18 16:56

    有没有一款FIFO可以与ADC08200通信?

    ADC08200可工作在10M~230MHZ之间的频率, 请问TI有没有一款FIFO可以与ADC08200通信?好像最高速率的也只有166MHZ??
    发表于 02-08 08:37

    光庭信息自动驾驶系统亮相CES 2025

    自动驾驶的魅力在于将人类从繁琐的驾驶任务解放出来,随着 AI 大模型和大数据技术的突破,自动驾驶技术的发展及实际应用也成为 CES 2025 的重头戏之。展会上,光庭信息自主研发的
    的头像 发表于 01-13 14:23 1266次阅读

    柔性力量崛起:富唯智能协作机器人点亮食品饮料生产线

    富唯智能协作机器人在食品和饮料供应链中广泛应用于包装和机床管理等次级流程。协作机器人可以在潮湿的温室、冷藏室、加热炉等环境工作,将员工从重复性工作中
    的头像 发表于 12-30 15:51 632次阅读
    柔性力量崛起:富唯智能协作机器人点亮食品饮料生产线