0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

​多模态风格迁移——生成更加美丽动人的风格图像

nlfO_thejiangme 来源:lp 2019-05-01 14:11 次阅读

对风格图像的风格进行聚类实现多模态表示,并对风格与内容图的空间特征进行匹配实现了具有多种模态风格的、具有内容自适应性风格迁移。

图像风格迁移是一种利用风格图像中的特征将内容图像渲染成类似风格图像效果的技术,随着深度学习的发展越来越精美的图像被生成出来甚至可以与专业画家相媲美。由于人们发现卷积特征间的相关性可以表示图像的风格,这使得迭代优化网络参数或者利用前传网络生成风格图像成为可能,目前的方法主要利用风格图的预训练模型来对任意的输入进行风格化处理,或者抽取风格图的特征对内容图进行风格化。这些方法大都假设图像的风格可以通过格拉姆矩阵等深度特征的全局统计信息来描述。

尽管这些方法可以保存内容图像并匹配风格图像的特征,但很多时候还是会在局部产生一系列扭曲和变形,造成明显的人工痕迹。如何处理这些问题成为了风格迁移领域的研究难点和热点。下图展示了先前方法的风格迁移图像的一些结果,其中第一列大图为内容图,右下角小图为风格图,最后一列为本文提出的多模态风格迁移(MultimodalStyleTransfer,MST)方法:

在第一行中左下角的风格图像中包含一系列复杂的纹理和线条,先前的方法无法区分风格图像中不同的风格,并且对于内容图像不加区分地进行了风格化处理,这使得在背景天空等区域出现了一些较为明显的线条,破坏了内容图原有的连续性。让我们再来看看第二行,这里的风格图像模式清晰,包含了统一的背景和红色/黑色的前景。AdaIN,WCT和LST等方法都无法较好的保持内容图像的结构特征,受到冲洗效应(wash-outartifacts.)的影响使得很多内容细节变得模糊。这主要是由于单调的背景在风格图中占比过大,造成了背景全局风格特征中占据了主导地位。从这些结果中可以看出类似格拉姆矩阵或协方差均值这类全局单模态的统计表示不足以表达特征图丰富、多模态的特征。理想的特征表达应该是具有空间分布的特征模式。

尽管基于图像片的方法这些模型可以在内容图像和风格图像具有相似结构特征时生成视觉效果较好的风格图,但这些方法很多时候会在生成图像中引入不该出现的风格模式。在上图中最后两行的图像中可以明显看到这些结果。例如风格图像中的眼睛、嘴唇等模式都会被copy到背景中(倒数第二行),甚至在最后一行中我们可以看出内容图像已经发生改变,女孩的脸型受到了风格图像的影响。这些缺点大大限制了生成高质量风格图像的应用,为了解决这些问题研究人员从风格分布的角度提出了一种多模态风格迁移的方法,实现了灵活、通用风格化过程,并充分利用并有效平衡了参数化和非参数化方法的优势。

具体来说,研究人员提出了多模态风格表示方法来表示风格图的特征,并基于图方法的匹配机制来实现风格特征和内容图像的匹配。研究人员在对多种风格图像风格分布分析的基础上认为多模态表示是更为有效的风格表达方式,并利用表示不同特定特征的风格集合来实现多模表示,可利用这些特征来实现会对不同特征的混合与匹配,得到丰富多彩的风格化图像。

为了实现风格-内容的匹配,研究人员提出了基于图的能量最小化方法,并利用图割的方式来求解。风格表达通过内容的空间特征来匹配。最后研究人员还利用了不同的子风格数量探索了多模态表达的鲁棒性和有效性,实验表明MST可有效改进现有风格化方法表现。

接下来让我们一起来探索高效的多模态风格表示,并研究如何为每一种内容特征与风格特征进行匹配,最后将在对应的特征子空间中实现风格转换。

多模态表示

基于卷积的图像风格迁移主要利用两种方法来对特征进行表示,一种假设全局具有相同分布并用全局特征来表风格,另一种则基于图像片提取风格。当风格图像具有多种特征时、单一均匀的方法无法较好的处理。在下图中可以看到对于风格特征的聚类,明显具有多种不同的风格模式。

而基于图像片的方法来说,会造成多个相同模式的图像片被copy到最终结果中造成不连续不美观的局部畸变。为了处理这些问题研究人员提出了利用多模态来表示风格图的特征,通过将风格分为多个子集实现了高维空间中的模态聚类,在特征空间中通过K均值聚类来对特征点进行分割:

特征Fs被分解成多个子特征,每个特征都有自己的特征标签lk。在特征空间中的邻近点具有相同的视觉特征。通过这样的方法就将先前均一模式的特征表达分解到了多个子空间中。

基于图的风格匹配

针对内容图,同样需要抽取特征。随后对内容特征和风格特征进行距离测量,基于余弦距离计算出每一个风格特征与内容特征的距离,并最小化数据能量函数来匹配对应的特征:

随后还需要考虑内容图像的空间信息来保留内容的连续性和边缘的完整,并希望内容图像同一局域拥有相同的特征标签,所以还引入了内容平滑项:

最后将两项能量函数联合起来并最小化就能得到风格与对应内容匹配的结果。研究人员提出了基于图的方法来最小化,并最终实现了像素级的风格匹配。

实验发现,风格特征的聚类将抽取出图像中的语义信息。在获得像素级的匹配图后,就可以更具内容的特征自适应的匹配不同风格来实现更为有效的图像风格化操作。下图分别显示了具有两个/三个子风格的风格匹配图像。

通过一系列的实验表明,这种方法在边缘保留、特征自适应匹配等方面具有十分优异的表现。研究人员探索了不同风格聚类数量对于风格化的影响,可以看到越多的子风格数对图像的表达越完整,迁移后的图像具有更好的视觉连续性:

在匹配图中我们可以看到不同特征的分布区域,下图中可以看到聚类数为3时不同特征对应内容图和特征图的区域模式。

这种利用多模态的风格表示方法有效的将风格图中的不同特征进行了更为丰富完整的表示,并利用特征匹配的方法为不同的内容区域匹配不同的特征,自适应的实现具有空间分布的风格迁移。MST的思想可以有效拓展到现有的风格迁移方法中,提高最终生成的风格图像的视觉效果。最后让我们再来欣赏一些机器生产的美丽画作吧!

MST方法得到的结果与其他方法的比较

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1063

    浏览量

    40035
  • 视觉
    +关注

    关注

    1

    文章

    140

    浏览量

    23670
  • K均值
    +关注

    关注

    0

    文章

    6

    浏览量

    6852

原文标题:​多模态风格迁移——生成更加美丽动人的风格图像

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    关于深度学习中的图像处理应用

    神经风格迁移(NST,Neural Style Transfe) 神经风格迁移是指将参考图像风格
    发表于 08-06 16:52 1785次阅读

    教你如何用OpenCV、Python和深度学习技术对图像和实时视频进行神经风格迁移

    虽然Gatys等人的方法能生成不错的神经风格迁移结果,但是它的速度非常慢。2016年,Johnson等人在Gatys的基础上提出的全新算法速度快了三倍,但同时也存在着缺点,即用户不能随机选择想要应用的
    的头像 发表于 08-31 09:47 7414次阅读

    Linux内核编码风格(编程代码风格推荐)

    这是翻译版本,英文原版是linux源码Documentation文件夹下的CodingStyle一个良好风格的程序看起来直观、美观,便于阅读,还能有助于对程序的理解,特别在代码量比较大情况下更显
    发表于 08-24 09:45

    【洞幺邦】基于深度学习的GAN应用风格迁移

    和虚假,最后两者到达动态的平和的时候,生成网络G就可以生成以假乱真的图片了。GAN应用风格迁移:在最一开始那个呐喊的例子中,人类骑行的图像
    发表于 07-01 10:53

    迁移学习

    的领域适配。迁移效果的可视化,利用机器学习库scikit-learn中的t-SNE对迁移过后的高维数据进行可视化。十、实验实操之图片与视频风格迁移实践掌握基于
    发表于 04-21 15:15

    山东分公司的风格山东分公司的风格山东分公司的风格山东分公司的风格

    东分公司的风格东分公司的风格东分公司的风格东分公司的风格东分公司的风格东分公司的风格东分公司的
    的头像 发表于 09-07 14:57 1104次阅读

    用TensorFlow.js在浏览器中部署可进行任意图像风格迁移的模型

    Reiichiro Nakano提供的模型突破了以往模型的局限,它能将任何风格图像分解为表示其风格的100维向量,然后把这些向量结合照片信息一起馈送到另一个神经网络,以产生最终的风格
    的头像 发表于 11-22 09:01 6177次阅读

    新GAN技术应用多层次特征的风格迁移人脸生成器你了解吗

    GAN 生成器架构借鉴了风格迁移研究,可对高级属性(如姿势、身份)进行自动学习和无监督分割,且生成图像还具备随机变化(如雀斑、头发)。该架
    的头像 发表于 12-23 11:03 6558次阅读
    新GAN技术应用多层次特征的<b class='flag-5'>风格</b><b class='flag-5'>迁移</b>人脸<b class='flag-5'>生成</b>器你了解吗

    风格迁移中如何进行数据增强

    这是一篇关于风格迁移中如何进行数据增强的论文。在introduction部分,informal--formal 的风格迁移问题,最大的障碍是训练数据的不足。为了解决此问题,本篇论文提出
    的头像 发表于 01-13 09:41 2298次阅读

    一种具有语义区域风格约束的图像生成框架

    生成对抗网络近年来发展迅速,其中语义区域分割与生成模型的结合为图像生成技术研究提供了新方向。在当前的研究中,语义信息作为指导生成的条件,可以
    发表于 04-13 15:47 5次下载
    一种具有语义区域<b class='flag-5'>风格</b>约束的<b class='flag-5'>图像</b><b class='flag-5'>生成</b>框架

    基于多尺度笔刷的分层图像优化风格化绘制算法

    基于图像的油画风格化绘制是计算机图形学领域非真实感绘制研究的热点之一。为了进一步提高图像油画风格化的质量,提出了一种基于多尺度笔刷的分层图像
    发表于 06-07 11:23 5次下载

    PyTorch教程14.12之神经风格迁移

    电子发烧友网站提供《PyTorch教程14.12之神经风格迁移.pdf》资料免费下载
    发表于 06-05 11:21 0次下载
    PyTorch教程14.12之神经<b class='flag-5'>风格</b><b class='flag-5'>迁移</b>

    PyTorch教程-14.12. 神经风格迁移

    的一个方面。要为照片应用理想的风格,您可能需要尝试多种不同的滤镜组合。这个过程与调整模型的超参数一样复杂。 在本节中,我们将利用 CNN 的分层表示将一幅图像风格自动应用到另一幅图像
    的头像 发表于 06-05 15:44 425次阅读
    PyTorch教程-14.12. 神经<b class='flag-5'>风格</b><b class='flag-5'>迁移</b>

    基于PyQT5与ONNXRUNTIME实现风格迁移应用

    2023年一月份跟二月份创建了一个PyQT5人工智能软件开发系列的文章系列,过去的两个月都没怎么更新,心里一直想有时间继续更新下去,今天又更新了一篇,基于PyQT5实现多线程、界面化、风格迁移模型的实时推理。
    的头像 发表于 10-25 10:35 262次阅读
    基于PyQT5与ONNXRUNTIME实现<b class='flag-5'>风格</b><b class='flag-5'>迁移</b>应用

    基于OpenCV的DNN图像风格迁移

    图像风格迁移已经属于比较成熟的领域了,现在连实时的风格迁移都不成问题。之前一直想出一篇这样的文章,但无奈于大部分开源项目配置起来非常麻烦,比
    的头像 发表于 10-30 10:03 235次阅读