0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GTN可以勾勒出夸张的几何线条?

lhl545545 来源:中科院长春光机所 作者:中科院长春光机所 2020-06-05 15:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

漫画是很多人的童年回忆,除了经典的《银魂》、《海贼王》、《火影》,久保带人的作品《死神》也很有人气。最近,六位来自北航的研究者推出了一款漫画脸转换模型「MangaGAN」,实现了真人照片到漫画脸的完美转换。

我们可以合理怀疑,几位论文作者都是久保带人的粉丝。

这篇论文中提出的「MangaGAN」,是一种基于生成对抗网络(GAN)的非成对照片到漫画转换方法。用来训练 MangaGAN 的数据集也来源于一部非常受欢迎的漫画作品——久保带人的《死神(Bleach)》,包含漫画人脸的面部特征、特征点、身体等元素,所以生成结果也带有强烈的久保带人风格。

标准漫画脸是如何生成的?

MangaGAN 生成漫画脸的整体流程。

总体来说,MangaGAN 包含两个分支:

一个分支通过几何转换网络(Geometric Transformation Network,GTN)学习几何映射;

另一个分支通过外观转换网络(Appearance Transformation Network,ATN)学习外观映射。

最后通过合成模块将二者融合,从而生成漫画脸。

假设 P 表示照片,M 表示生成的漫画脸,二者之间不存在成对关系。给定一张照片 p∈P,MangaGAN 学习映射

 GTN可以勾勒出夸张的几何线条?

将 p 迁移至样本

 GTN可以勾勒出夸张的几何线条?

(m∈M),同时为 m 加上漫画风格和面部相似度。

图中(f)步骤通过 GTN 勾勒出夸张的几何线条,并确定五官的几何分布位置;图中(e)步骤则通过 ATN 生成所有的面部特征,包括眼睛、鼻子和嘴巴。继而通过合成模块将几何轮廓和面部特征相融合,输出漫画脸 m∈M。

外观转换:ATN

 GTN可以勾勒出夸张的几何线条?

ATN 是一个 multi-GAN 结构的网络,包含四个局部 GAN,分别用来转换眼、口、鼻和头发这四个面部位置。针对每个部位的 GAN,会有专属的训练策略和编码器以改善其性能。

眼睛和嘴巴是漫画脸的灵魂所在,但也是最难转换的部分,随着表情的变化,这两个部位的特征也会变化。

对于眼睛和嘴巴部位,为了实现更好的非成对数据匹配,研究者将 CycleGAN 与反向映射(reverse mapping)相结合,并进行了三项改进:

第一,设计了一个带有 SP loss L_SP 的 Similarity Preserving (SP) 模块,以增强相似度;

第二,训练编码器 E^eye 用于提取 p^eye 的主干,训练编码器 E^mouth 用于提取 p^mouth 的轮廓线条;

第三,提出结构平滑损失 L_SS,帮助网络生成笔触平滑的漫画脸。

使用不同的改进方法得到的眼部和嘴部区域对比情况。

上图第 5 列和第 11 列展示了使用 SP 模块进行改进的效果;第 6 列和第 12 列分别展示了使用编码器 E^eye 和 E^mouth 的改进效果;第 4 列和第 10 列展示了使用结构平滑损失进行改进的效果。

鼻子和头发的生成则相对简单,大部分动漫人物的鼻型相似,因此该研究使用基于 ProGAN 的架构生成鼻子。头发部分则使用了 APDdrawingGAN,通过头发分割方法划分出大致的头发区域,然后使用肖像分割方法移除多余的背景区域,即可生成类似漫画风格的头发样式。

几何转换:GTN

在转换面部特征点时会遇到一个问题:面部特征的搭配模式限制了结果的多样性。比如,脸型相同的人可能有着不同的眼口鼻大小或位置,但 GAN 在接受全局人脸特征点训练时可能遵循固定或类似的搭配模式。因此研究者也将「几何特征」分解为三种属性:脸型、位置、大小,并使用三个 sub-GAN 分别转换。

GTN pipeline。几何信息被分为三种独立属性:位置、大小和脸型,然后使用 N_loc、N_siz、N_sha 三个 sub-GAN 分别进行转换。

最终,如图 5(b) 所示,基于预定义的脸颊和额头比例,生成了整张漫画脸的几何特征。

最后一步:融合

这一步的目的是融合人脸特征和几何特征,从而生成漫画脸。

如上图所示,首先,根据几何特征来调整和定位各面部特征组件;

其次,基于分段三次 Hermite 插值多项式 (PCHIP) 方法,获得平滑的曲线并保留脸部形状,然后通过拟合生成人脸特征点的曲线来绘制脸型;

然后,模型提供了 10 种漫画式耳朵供选择,而非按照片重新生成,因为耳朵的样式对面部表情来说影响不大;

此外,研究者还收集了 8 种漫画人物身体(manga body),用来与生成的漫画脸搭配。

最后就可以输出漫画结果啦。该模型提供了快速微调尺寸和位置的工具,以及鼻子、耳朵和骨架等组件的切换工具,用户可以按照个人喜好进行调整,生成自己喜欢的漫画脸。

MangaGAN 效果如何?

该研究所用的实验数据集包括三部分:漫画数据集、照片数据集和人像数据集。漫画数据集来源于一部流行的漫画作品《死神》,包括 448 双眼睛、109 个鼻子、179 个嘴巴和 106 张正面漫画脸。

研究者将 MangaGAN 与 9 种漫画脸生成 SOTA 方法进行了对比,效果生成如下图所示:

可以看到,其他方法生成的漫画脸都会有扭曲和突兀的线条,或是面部存在莫名的阴影,其原因在于生成过程中忽视了几何特征的转换。相比之下,MangaGAN 生成的脸部十分干净利落,没有多余的部分。

接下来是跨域转换层面中 MangaGAN 与其他方法的对比。为公平起见,CycleGAN 和 UNIT 先转换全脸再转换每个人脸特征。最终效果如下图所示:

很明显,其他方法在匹配照片和漫画时容易出现问题,它们更关心二者的黑暗区域是否匹配,但没有转换脸型和笔触。MangaGAN 的生成结果则更接近理想中的漫画脸,脸型棱角分明,眉形平滑,嘴巴也进行了简化,几乎完全符合手绘漫画的人物长相特征。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 几何
    +关注

    关注

    0

    文章

    37

    浏览量

    12682
  • 合成
    +关注

    关注

    0

    文章

    16

    浏览量

    13940
  • ATN
    ATN
    +关注

    关注

    0

    文章

    5

    浏览量

    3834
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    德力西电气以新质创新赋能制造业绿色转型

    “十五五”蓝图正徐徐铺展,国家战略部署为产业发展勾勒宏伟且清晰的轮廓。“十五五”规划纲要将“能源强国”建设首次纳入五年规划,明确提出深入实施能源安全新战略,加快构建清洁低碳安全高效的新型能源体系,为能源产业锚定了发展方向。
    的头像 发表于 03-26 15:32 319次阅读

    谷东智能亮相SIOF 2026上海国际眼镜业展览会

    3月2日至4日,上海国际眼镜业展览会(SIOF 2026)如期举办。在这场汇聚全球目光的行业盛会上,广东谷东智能科技有限公司(以下简称“谷东智能”)以“光学+AI”双重引擎,向外界勾勒一个智能眼镜的崭新未来。
    的头像 发表于 03-09 11:35 1729次阅读

    天马微电子创新显示产品重磅亮相CES 2026

    当地时间1月6日,被誉为科技产业第一风向标的国际消费电子展(CES 2026)在美国拉斯维加斯盛大启幕,这场全球瞩目的科技盛宴再次汇聚全球创新力量,层出不穷的突破性技术与创新性产品在此集中亮相,勾勒一幅未来科技图景。
    的头像 发表于 01-09 16:46 7052次阅读

    SGS授予几何伙伴ASPICE V4.0 CL2认证

    近日,国际公认的测试、检验和认证机构SGS(以下简称为“SGS”)为上海几何伙伴智能驾驶有限公司(以下简称“几何伙伴”)颁发Automotive SPICE V4.0 CL2(以下简称ASPICE)认证证书。这一认证标志着几何
    的头像 发表于 11-18 10:01 770次阅读

    800G光模块:SR8、DR8、FR4、LR4与ZR技术对比

    800G实现之路并非一蹴而就,而是建立在400G的坚实技术基础之上,并通过持续的创新来应对新的挑战。本文将从技术驱动、核心突破、部署挑战及未来展望等方面,勾勒800G实现的技术演进路径。
    的头像 发表于 11-17 16:21 3383次阅读
    800G光模块:SR8、DR8、FR4、LR4与ZR技术对比

    谷景电子出席联合飞机2025年供应商大会

    近日,谷景电子受邀出席联合飞机大会,与行业先锋共探低空经济发展新路径。从飞行器制造到核心元器件创新,这场技术对话正勾勒 “空中交通时代” 的清晰蓝图。
    的头像 发表于 10-23 15:37 729次阅读

    多种类几何尺寸集成智能仪器定制 一站式解决产线多维度测量需求

    关键词:几何尺寸测量仪,智能仪器,定制仪器,测宽测厚仪,测宽测长仪,直线度外径测量仪 在现代化生产线上,几何尺寸测量是保障产品精度、控制生产质量的核心环节。传统模式下,企业需为长度、直径、圆度
    发表于 10-09 13:50

    Infineon TLE987x是否有串口的状态寄存器,可以显示串口是处于忙碌状态还是空闲状态?

    Infineon TLE987x 是否有串口的状态寄存器,可以显示串口是处于忙碌状态还是空闲状态(可显示当前一帧信号的接收已完全完成)
    发表于 07-15 07:00

    三坐标高精度检测液压支架导向套的几何公差尺寸

    导向套充当着千吨级支护力传递的力学支点:当顶板来压时,巨大的支护载荷通过导向套端面传递至活柱,其微米级的几何公差(同轴度/槽深/垂直度)实则是矿工生命的物理防线。根据导向套的作用可知它的主要检测需求
    发表于 07-10 13:36 0次下载

    三坐标微米级测量精度,高精度检测液压支架导向套的几何公差尺寸

    Mars Classic 10158 三坐标测量机可以测量各种复杂几何特征,满足客户对阀体全尺寸检测的需求;能实现微米级的高精度测量,满足导向套关键尺寸的高精度检测需求;自动测量程序可以快速完成所有测量任务,大大提高检测效率。
    的头像 发表于 07-10 13:33 1000次阅读
    三坐标微米级测量精度,高精度检测液压支架导向套的<b class='flag-5'>几何</b>公差尺寸

    破解五大运营痛点:盘古信息IMS MOM重塑PCB工厂数字化基石

    盘古信息以技术为笔,通过战略重构、流程再造、系统集成、组织赋能的四维协同,为行业勾勒从“制造”到“智造”的清晰路径,推动效率、质量、柔性的全面跃升。
    的头像 发表于 06-23 10:17 599次阅读
    破解五大运营痛点:盘古信息IMS MOM重塑PCB工厂数字化基石

    几何伙伴荣获ISO 26262:2018汽车功能安全ASIL D流程认证

    近日,国际公认的测试、检验和认证机构SGS(以下简称为“SGS”)为上海几何伙伴智能驾驶有限公司(以下简称“几何伙伴”)颁发ISO 26262:2018功能安全ASIL D流程认证证书。此项认证
    的头像 发表于 06-17 14:24 1151次阅读

    科而美正式推出新一代RDM线条

    在照明技术快速迭代的今天,科而美正式推出新一代RDM线条灯,以颠覆性的技术突破重新定义行业标准!
    的头像 发表于 06-11 15:41 1620次阅读

    wafer晶圆几何形貌测量系统:厚度(THK)翘曲度(Warp)弯曲度(Bow)等数据测量

    在先进制程中,厚度(THK)翘曲度(Warp)弯曲度(Bow)三者共同决定了晶圆的几何完整性,是良率提升和成本控制的核心参数。通过WD4000晶圆几何形貌测量系统在线检测,可减少其对芯片性能的影响。
    发表于 05-28 11:28 2次下载

    wafer晶圆几何形貌测量系统:厚度(THK)翘曲度(Warp)弯曲度(Bow)等数据测量

    在先进制程中,厚度(THK)翘曲度(Warp)弯曲度(Bow)三者共同决定了晶圆的几何完整性,是良率提升和成本控制的核心参数。通过WD4000晶圆几何形貌测量系统在线检测,可减少其对芯片性能的影响。
    的头像 发表于 05-23 14:27 1673次阅读
    wafer晶圆<b class='flag-5'>几何</b>形貌测量系统:厚度(THK)翘曲度(Warp)弯曲度(Bow)等数据测量