对于设计领域,特别是服装和鞋类的设计是人类审美和技术的结晶。但在品牌和产品迅速迭代的今天,是否可以利用新的工具为美的理解和设计带来更高的效率呢?人工智能技术在鞋类的审美和设计中给出了自己的探索。
GOAT是一家运动鞋和街头服装在线销售平台,其数字团队的主要业务是帮助客户表达自己喜欢的风格并指引客户找到自己喜欢的运动鞋。为了告别过去需要人工学习和描述每一双鞋的数据特征,其数据团队开始尝试着研发出一系列工具来加速这一个过程。
要实现对运动鞋视觉特征的描述,首先需要开发出一种可以描述出所有鞋的通用语言。但对于拥有30000双鞋并在不断增长的产品线来说,这并不是一件容易的事情。每款鞋的外形、材料和颜色都各不相同,用人工的方法将会是一场永无休止的工作。同时随着每一双新鞋的发行,需要不断的更新这种描述的语言。这样的工作光是想想就会心里打鼓。那怎么办呢?GOAT的数据团队于是将目光转到了强大的机器学习上来。研究人员们建立了能够寻求不同类型款式之间特征和相关性的模型,并通过学习不断获取描述的特征, 从而实现了一种得以描述上万双不同鞋的通用描述方法。
首先,研究人员们引入了隐变量模型(Latent Variable Models)。借由人工智能的方法,研究人员们得到了一系列隐变量来描述产品的视觉特征。在机器学习中,这样的学习方式又被称为流形(Manifold)学习。流型学习背后的主要假设在于数据分布通常可以被表示为较低维度的表达,在降维的同时却保留了绝大部分的有用信息。这种方法可以将数百万的像素压缩到有很少变量表达的特征空间中去。
如果要形象地理解流型,我们可以用一个生活中的例子来解释一番。你想要告诉你的小伙伴如何从地铁站到公司,你肯定不会给他发一系列GPS的坐标点,然后让他沿着坐标来。而是会告诉他出了地铁几号口,看到一栋白色建筑物,右转沿街走50m右手边这样的更容易为人所理解的语义信息。在这里,GPS坐标点很精确是原始数据,但数据量太大对应着高维空间;而你告诉他的近似路线则是语义信息,这就对应着高维GPS坐标在流型空间上的近似,也就是说我们对高维的GPS坐标序列在低维的语义流型空间上进行了编码。
在流型空间的基础上,研究人员通过变分自编码器(VAE),生产对抗网络(GAN)及其混合模型进行非监督学习,将原始的运动鞋照片转换到隐空间中进行编码,并在其中包含了一系列具有审美特征的信息因素。
先前人们为了将很多像素的图像编码到隐空间一般会使用自编码器(AE)来实现。自编码器可以将原始的图像压缩(编码)到隐空间中去,随后对隐空间中的变量进行解码重建出输入图像。按照自编码器的流程,研究人员们测试了模型的重建能力,并测算重建图像与输入图像之间的误差。自编码器通过不断重复压缩编码和解压重建的过程,并利用误差来调整网络改善参数。最后,自编码器可以实现如下图所示的模型,在中心的隐空间中保留下对任务最为重要的特征。
但在实际的任务中,如果仅仅使用自编码器重建图像时远远不够的。自编码器在训练过程中由于数据集的原因会使得隐含空间中的特征向量不连续(裂缝/断崖效应),这样的结果影响了模型的泛化性。为了解决这一问题,需要在模型中引入一些变化,变分自编码器就是一种著名的工具,它在损失函数中添加了一项散度的正则项来对隐藏空间的不连续性进行处理。
具体来说,它可以通过散度惩罚隐空间中那些与高斯分布不匹配的变量。在很多场合下,模型的原则最终归结于对于散度度量的选择、重建误差函数的建立和先验。例如著名的β-VAE和Wasserstein 自编码器都利用的KL散度和对抗损失。下式描述了β-VAE的损失函数,包括了重建误差和带权重的散度项。
在学习运动鞋美学特征的任务中,希望得到尽可能多样性的隐空间来覆盖各式各样的运动鞋,这就意味着希望对于一些清奇的款式不要有太大的损失函数。
最终通过对于多款鞋的照片训练了一个可以学习到不同鞋型的变分自编码器。下图显示了在保持隐空间编码长度的同时,模型表现随训练时间的变化。
可以看到随着训练时间的增加,模型对于特征的理解和表达也逐渐提高。在开始训练的时模型主要集中于重建出精确的外形特征,并理解到了鞋底和鞋帮的对比度变化的特征;随后模型开始学习鞋子表面的灰度分布情况。在理解了外形、轮廓、高宽等特征之后,模型会开始将更多的精力放在学习模式和颜色等更为复杂的特征。
在经历了多次训练迭代后,研究人员们得到了流畅顺滑的隐空间变量。在下图可以看到,在固定左边一列和右边一列两双鞋的隐变量之后,可以在隐空间中自由移动,探索不同的风格组合。
除此之外,还可以在隐空间中进行更多的探索,下图中左上角的鞋子作为锚,将隐变量按照颜色、高度、鞋底和鞋型进行变化,探索出了65中不同的变换。
同时研究人员们利用t-SNE来探索了高维空间可视化,以验证不同特征的学习是否准确。
此外隐空间中的编码向量可以进行算术操作,这使得不同鞋型之间的互相变换成为了可能。下图是一个叠加两款鞋的例子,可以看到结果保留了较宽踝部的和logo,但结合了第二双鞋的外形和材料。
这样方法很容易就能创造出新款的服饰,大大节省了设计成本,也极大的扩大了设计空间。在不远的未来利用这样的方法,你也可以设计出自己的喜欢的衣服和鞋子,可以用VAE试试哦!
-
人工智能
+关注
关注
1776文章
43824浏览量
230574 -
机器学习
+关注
关注
66文章
8116浏览量
130546
原文标题:“嗨! 你的运动鞋真好看!”“哈哈,我是用AI设计的耶~”
文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论