0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探究对深度学习模型VAE的时序性解耦

电子工程师 来源:DeepBlue深兰科技 作者:DeepBlue深兰科技 2021-06-04 11:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

现代深度学习架构一直被描述为一个黑匣子:被输入数据,并期望从中得到一些结果。然而,由于此类架构存在许多的复杂性,过程中发生的事情,通常难以解释和分析。这已发展成为整个社会未能广泛接受深度学习的主要原因之一,尤其是对于关键任务应用程序。

因此,“黑匣子”的解体已成为机器学习研究人员的一个重大开放问题,并且是该领域当前感兴趣的问题之一,这一研究领域通常被称为机器学习架构的“可解释性”。在本文中,我们将讨论可解释性研究中的一个重要主题,即解耦问题。

Disentangled

Sequential VAE

光的解耦(Ddisentangled)

我们举个常见的例子:在日常生活中,太阳光看起来是白色的,但是如果我们让阳光通过三棱镜,就会发现阳光分别折射出多种色彩。这说明白光其实是多种颜色混合的体现,而我们可以通过三棱镜把它分解成基本七种颜色,其中包括红、绿、蓝三原色。

我们继续聊聊白光:在广泛意义上说光是由RGB三种颜色组成的。这也就定义了光的解耦过程:光可以分离成R、G、B三种颜色,同时我们也可以用这三种颜色,进行不同程度的叠加,产生丰富而广泛的颜色。

计算机定义颜色时R、G、 B三种成分的取值范围是0-255,0表示没有刺激量,255表示刺激量达最大值。R、G、B均为255时就合成了白光,R、G、B均为0时就形成了黑色。在这个区间范围内,我们可以通过任意的数值组合构造出无数种不同的颜色,让我们的生活充满色彩。

白光和解耦又有什么关系呢?那关系就大了!我们下面简单聊一下一种深度学习模型——变分自编码器模型(VAE:variational autoencoder),然后用它来解释解耦。

什么是VAE?

什么是VAE呢?那要先从AE开始说起了。

AE(Autoencoder)

87c81b48-c4e0-11eb-9e57-12bb97331649.png

上图由两个部分组成,第一个部分是编码器(Encoder),第二部分是解码器(Decoder),图片经过编码器得到一个潜在的编码(code),编码再通过解码器还原输入的图片,因此得到的编码就是图片在一个潜在空间的表示。而编码器和解码器就是由神经网络组成的。图中例子就是希望能够生成一张一样的图片。

VAE (Variational Autoencoder)

变分编码器是自动编码器的升级版本,其结构跟自动编码器相似,也由编码器和解码器构成。在AE中,输入一个图片得到一个的编码(code),但这个编码是一个固定的编码,使得模型没有很好的泛化功能。所以VAE引入了一种新的方式有效解决了上述的问题,就是将编码问题变成一个分布问题,具体操作是在AE的基础上增加一个限制,迫使编码器得到的编码(code)能够粗略地遵循一个标准正态分布,这就是其与一般的自动编码器最大的不同。

这样我们生成一张新图片就很简单了,我们只需要给它一个标准正态分布的随机隐含向量,这样通过解码器就能够生成我们想要的图片,而不需要给它一张原始图片先进行编码。

87d5973c-c4e0-11eb-9e57-12bb97331649.png

VAE的演变增加了模型的泛化性,以上图VAE的过程为例,当输入的图片是猫时,通过猫的特征来生成新的图片,VAE的好处就在于当输入的图片不是完整的图片时(训练集外),它依旧可以还原成原来的样子。

在深度学习中,不管是什么样的模型,数据都很重要,而VAE的好处就在于 :

它可以通过编码和解码的过程,通过抽样,生成新的数据。这样对于机器学习就有了更多的数据支撑从而得到更好的模型效果。

VAE在中间层会得到一个编码(code),也就是一个语义层,我们可以通过对于这个语义的理解,从而达到图片的分类、变换的效果。

如果我们类比光的解耦(将光分离成R、G、B三种颜色),VAE(Variational Autoencoder)就可以理解成是深度学习框架的三棱镜。

这是为什么呢?我们先给一个浅显的技术介绍,然后再回来聊颜色分离。

VAE是一种深度学习框架,更具体来说,它是一种生成模型。生成模型的操作很简单:它可以读取数据(多为图片),抽取数据的特征,然后自动生成有这些特征的新数据。我们这里关心的是提取特征这个环节。大多生成模型的特征提取模式,便是经过所谓的“潜在变量”(latent variables)来编码提取到的特征。

这里的一个明显的问题便是:我们怎么判断正式数据里的某一个特征对应的是哪个语义变量?我们可以回到类比成颜色分离和生成的过程,将一种颜色先编码(encoder)成R,G,B,再通过解码(decoder)形成一种颜色。

Disentangled Sequential VAE

随着对VAE的研究,越来越多的研究重点就放在了如何在VAE的基础上做到disentangled的过程。以下简单介绍一下深兰科学院对于该项目的研究内容:对于时序的数据解耦出其数据的动态信息和静态信息,并理解静态信息和动态信息的语义,后续团队的目标也是基于当前的项目,进行这个主流方向的基础研究。

本项目采用的数据是Sprites,这是个具有时序性的数据。小精灵有着不同的颜色和动作,团队的任务就是通过这些小精灵的图片,解耦出小精灵的动态信息(小精灵的动作)和静态信息(小精灵的颜色)。通过深度学习来获得小精灵动静态信息的语义,并理解这语义从而生成新的小精灵。

如下图所示,通过深度学习得到小精灵的动态信息和静态信息,并改变他们的值的生成效果(上排是原始数据,下排是生成数据)。

1. 改变静态信息(颜色)

2.改变动态信息

对于VAE时序性解耦的工作可以更容易地说明神经网络的可解释性,这样的任务不仅可以对神经网络的基础研究作出贡献,还可以应用到很多人工智能的项目中,例如对图像视频的处理;动静的解耦可以实现换脸等效果;在自然语言处理中,可以改变声音的种类等。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1225

    浏览量

    43770
  • 数据
    +关注

    关注

    8

    文章

    7349

    浏览量

    95025
  • 计算机
    +关注

    关注

    19

    文章

    7841

    浏览量

    93464
  • Code
    +关注

    关注

    0

    文章

    71

    浏览量

    16301
  • 深度学习
    +关注

    关注

    73

    文章

    5608

    浏览量

    124635

原文标题:探究 | 对深度学习模型VAE的时序性解耦

文章出处:【微信号:kmdian,微信公众号:深兰科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何突破AI存储墙?深度解析ONFI 6.0高速接口与Chiplet架构

    系列产品(如 ML100 IO Die)实现硬件级交付。• 架构:将存储接口与核心SoC物理解,弱化热效应对存储颗粒的影响,提升系统可靠。• 降本增效:通过国产化供应链和先进
    发表于 01-29 17:32

    机器学习深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 350次阅读
    机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    TDK ADL4532VK电感:汽车电路的理想之选

    TDK ADL4532VK电感:汽车电路的理想之选 在汽车电子的复杂世界里,电感作为关键的电子元件,对电路的性能起着至关重要的作用。今天,我们就来深入探讨TDK推出的ADL - VK系列中
    的头像 发表于 12-25 15:20 684次阅读

    TDK ADL3225VF电感:汽车电路的理想之选

    TDK ADL3225VF电感:汽车电路的理想之选 作为电子工程师,在设计汽车电子电路时,电感的选择至关重要。TDK 的 ADL - VF 系列电感专为汽车电路设计,其中 AD
    的头像 发表于 12-25 14:45 348次阅读

    TDK ADL4524VL电感:汽车电路的理想之选

    TDK ADL4524VL电感:汽车电路的理想之选 在汽车电子系统中,电路对于稳定电源和信号传输至关重要。TDK的ADL4524VL系列电感专为汽车
    的头像 发表于 12-25 14:15 299次阅读

    探索TDK MLZ1608C电感:汽车PoC电路的理想之选

    探索TDK MLZ1608C电感:汽车PoC电路的理想之选 在电子工程师的日常设计工作中,电感作为一种基础且关键的电子元件,其性能的优劣直接影响着整个电路系统的稳定性和可靠。今天,我们就来
    的头像 发表于 12-25 11:40 596次阅读

    穿孔机顶头检测仪 机器视觉深度学习

    顶头状态。 检测顶头算法 引入人工智深度学习技术,通过Keras实现卷积神经网络(CNN),用Numpy实现采集数据的训练,得到符合现场需求的模型,进一步提升检测的准确和现场的适应
    发表于 12-22 14:33

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心一言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这一话题一直被
    的头像 发表于 08-13 09:15 4367次阅读
    自动驾驶中Transformer大<b class='flag-5'>模型</b>会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    兰州大学:研究阻抗实现高精度自供能多模传感

    近日,兰州大学材料与能源学院研究团队提出阻抗策略用于提高自供能传感系统中的传感精度,实现高精度多模态传感。 随着物联网和5G技术的飞速发展,利用环境能量供电的自供能传感技术愈发重要。但是,由于
    的头像 发表于 07-23 11:26 1401次阅读
    兰州大学:研究阻抗<b class='flag-5'>解</b><b class='flag-5'>耦</b>实现高精度自供能多模传感

    深度解析SLM345CK-DG 40V, 1.0 A 高性能、高可靠兼容光的隔离栅极驱动器

    传统光驱动器的管脚,却在性能和可靠上实现了显著飞跃,是升级现有光驱动方案的理想选择。 一、核心优势:超越光的性能与可靠SLM34x
    发表于 07-21 08:56

    无轴承异步电机气隙磁场定向逆控制

    轴承异步电机进行动态控制。经解后的径向位移子系统只与悬浮绕组电流和转矩系统气隙磁链有关,耦合变量减少;而且逆系统模型中不再有负载转矩变量,更便于逆系统的实现。 纯分享帖,点击下方
    发表于 07-14 17:43

    无轴承异步电机的RFOC逆动态控制

    进行了转速和转子磁链之间、两个径向位移分量之间的动态控制方法研究,给出了逆动态控制系统结构。仿真结果表明,系统各状态变量之间实现了可靠的动态
    发表于 07-14 17:35

    模型推理显存和计算量估计方法研究

    GPU、FPGA等硬件加速。通过分析硬件加速器的性能参数,可以估算模型在硬件加速下的计算量。 四、实验与分析 为了验证上述估计方法的有效,我们选取了几个具有代表深度
    发表于 07-03 19:43

    软硬+模块化:深度拆解开放架构的“自由”基因

    ET2500系列应运而生——这款基于开放架构的智能业务处理平台,通过算网融合芯片与模块化设计,实现软硬件,将网络、路由、安全等功能集成于单一设备,为中小企业提供高性能、易维护的一体化解决方案
    的头像 发表于 06-09 15:42 1272次阅读
    软硬<b class='flag-5'>解</b><b class='flag-5'>耦</b>+模块化:<b class='flag-5'>深度</b>拆解开放架构的“自由”基因