0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于改进文本分类的特征投影

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2021-03-05 15:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

TL; DR

在情感分类中,一些good features,比如”good“、”nice“表示积极,”bad“、“terrible”表示消极。但是,还有许多common features,比如voice、screen就没有特别的情感性。

尽管深度学习拥有强大的representation learning(表征学习,即同一个数据用不同的表示形式)。但我们认为还有可以改进的地方。

在本文中,我们提出了一种新的角度来进一步改善这种表示学习,即特征投影(feature projection):将现有特征投影到common特征的正交空间中。

所得的投影向量垂直于common特征,能更好的进行分类。

将该方法用于改进基于CNN,RNN,Transformer和Bert的文本分类模型,获得更好的结果。

网络结构

Feature Purification Network 特征净化网络

模型分为两部分:

projection network (P-net);

common feature learning network (C-net)

P-net:计算净化的向量特征,通过将学习到的输入文本的信息向量投影到更具区分性的语义空间中来消除共同特征的影响。

C-net:提取common features。

P-net由四部分组成:

输入层X

特征提取器Fp

正交投影层(OPL,Orthogonal Projection Layer)

分类层Cp

C-net也由四部分组成:

输入层X

特征提取器Fc(Fp和Fc的参数不共享)

渐变反向层(GRL,Gradient Reverse Layer)

分类层Cc

技术的关键思想如下:

P-Net中特征向量fp投影到C-Net的fc的正交方向上。也就是说,将fp(从输入文档中提取的完整信息)投影到更具区分性的语义空间中,以进行最终分类。

图2:正交投影层的工作方式。这里的示例是在二维空间中。

fp表示传统特征向量;

fc表示公共特征向量;

fp∗是投影特征向量;

fp~是最终的正交投影特征向量。

我们首先将传统特征向量fp投影到共同特征向量fc,得到fp∗。

等式9中的fp∗即表示对共同特征向量fc的约束。

再将fp投影到fp-fp*得到fp~

也就是说:通过将输入的传统特征向量fp投影到公共特征向量fc来限制公共特征向量的模,因此新的公共特征向量fp*的语义信息仅包含xi的公共语义信息。

这使得最终的纯化特征向量fp~来自传统特征向量fp,而不是与公共特征向量fc正交的任何平面中的任何向量。

最后,我们使用纯化的特征向fp~进行分类。

Experiments实验

1 实验使用数据集

2 Baselines模型

用LSTM、CNN、Transformer和BERT等基准模型进行对比实验,已验证特征投射的有效性。

3 实施细节

首先,我们将实验中的所有词嵌入随机初始化为200维向量,然后在训练过程中进行修改(Bert除外)。对于每种类型的特征提取器,我们具有以下配置:

对于RNN模型,使用两层LSTM进行特征提取,每层的hidden state=256;

对于CNN模型,为了获得更多的细粒度特征,我们分别使用了[2,3,4,5,6]的滤波器大小,每个滤波器都有100个特征图。

对于Transformer的模型,我们使用Transformer的编码器作为特征提取器,使用单头和3个block。

对于Bert模型,我们微调了预训练的基于Bert的参数。这些设置与FP-Net中的基线完全相同。

在C-net模块的训练中,我们以0.9为初始学习率的随机梯度和随后的退火学习率(Ganin and Lempitsky,2014)。

其中,训练进度p从0线性变化为1,l0 = 0.01,α= 10和β= 0.75。在GRL中,超参数λ为[0.05,0.1,0.2,0.4,0.8,1.0]。

4 实验结果

5 消融实验与分析

消融实验类似于“控制变量法”。假设在某任务中,使用了A,B,C,取得了不错的效果,但是这个时候你并不知道效果是由A,B,C中哪一个起的作用,于是你保留A,B,移除C进行实验来看一下C在整个任务中所起的作用。

结论

在本文中,我们提出了一种新的特征净化网络(FP-Net),以改进文本分类的表示;

该方法基于特征投影。所提出的模型使用两个子网,一个用于识别对分类没有区别的共同特征common features,另一个用于将传统特征投射到共同特征的正交方向的特征投影;

我们当前的方法仅用于传统文本分类方法,例如LSTM,CNN和Transformer。在未来的工作中,我们将考虑将其扩展到基于图的方法(例如用于图形数据的GCN),以及扩展到基于生成的方法(例如用于对抗性学习的GAN)。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 文本分类
    +关注

    关注

    0

    文章

    18

    浏览量

    7442
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123900
  • cnn
    cnn
    +关注

    关注

    3

    文章

    355

    浏览量

    23247

原文标题:【ACL2020】用于改进文本分类的特征投影

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于级联分类器的人脸检测基本原理

    本次分享的内容是基于级联分类器的人脸检测基本原理 1) 人脸检测概述 关于人脸检测算法,目前主流方法分为两类,一类是基于知识,主要方法包括模板匹配,人脸特征,形状和边缘,纹理特征,颜色特征
    发表于 10-30 06:14

    多光谱图像颜色特征用于茶叶分类的研究进展

    多光谱成像技术结合颜色特征分析为茶叶分类提供了高效、非破坏性的解决方案。本文系统综述了该技术的原理、方法、应用案例及挑战,探讨了其在茶叶品质分级、品种识别和产地溯源中的研究进展,并展望了未来发展方向
    的头像 发表于 10-17 17:09 400次阅读
    多光谱图像颜色<b class='flag-5'>特征用于</b>茶叶<b class='flag-5'>分类</b>的研究进展

    DLP4500连续触发投影,大约投影一百多次后,再触发就不投影了,为什么?

    在vs程序总将投影的控制进行了实现,投影序列设置如下图: 1. 测试连续触发时:每隔一秒触发一次投影,大约投影一百多次后,再触发就不投影
    发表于 03-03 08:33

    DLP LightCrafter 3000 evm按照教程进行标定,没有投影白色而是投影的绿色,为什么?

    (tidu985a.pdf)文档进行标定,运行程序到第四五步时,投影投影出来的是纯绿色光线和绿色棋盘格,请问如何设置投影出白色和白色棋盘格。 我修改了config_projector.txt配置文件中
    发表于 03-03 06:13

    DLP3010投影图片超过48Bit,超过48bit的图片不会投影是怎么回事?

    如图,我现在在用DLP3010_LC EVM配合GUI做结构光条纹投影,目前有制作6个pattern set,每个pattern set里面有6张8bit的条纹图片,然后按照上图的设置点击
    发表于 02-27 07:37

    DLP Lightcrafter 4500添加好投影序列发送,给触发信号仍无法触发投影怎么解决?

    使用外部信号触发投影投影,将外部触发线接到J11的2脚,地线接到6脚。选择Pattern Sequence模式,在Individual Pattern Settings中选择External
    发表于 02-27 06:43

    用DLP4500投影正弦光栅时存在高频噪声,应该如何改进正弦光栅质量?

    用DLP4500投影正弦光栅时存在高频噪声,应该如何改进正弦光栅质量?
    发表于 02-26 07:24

    dlpc3479用于dlp4710这款DMD上,该系统的最大投影帧率是多少?

    请问一下,dlpc3479用于dlp4710这款DMD上, 该系统的最大投影帧率是多少?以及相应的文档资料, 非常感谢
    发表于 02-24 07:21

    DLP4500用HDMI线投影电脑画面投影不上是怎么回事?

    下载了最新的固件和GUI,用HDMI线连接后可以看见video signal information,在电脑上也可以看见投影仪信息,但是没有投影画面
    发表于 02-21 07:10

    DLP4710EVM-LC两个条纹集合投影冲突怎么解决?

    如图所示,我将条纹图写入投影用于投影,当只有一个条纹集合时投影正常,因为一个集合最多投影7张图片,而我需要
    发表于 02-19 08:36

    DLP4710LC如何通过编程实现投影仪上电后自动初始化?

    我们现在是将投影用于三维测量投影,并且把投影图烧进板子里,通过编程控制外接ARM开发板的引脚来触发投影仪投图,但每次给
    发表于 02-19 06:54

    使用DLP4500进行图片投影时,内置Flash太小,无法投影更多的图片,怎么解决?

    在使用DLP4500进行图片投影时,内置Flash太小,无法投影更多的图片,请问有其他方法能够投影更多的图片吗?或者有其他flash更大的型号DLP推荐吗?
    发表于 02-18 07:33

    DLP4500怎么确定投影仪开始投影的同时相机的c++代码开始运行?

    投影仪通过trig1 链接相机,投影仪投图同时触发相机,相机采集图像并传回电脑,相机的代码里需要添加dlp4500的api或sdk代码吗,怎么确定投影仪开始投影的同时相机的c++代码
    发表于 02-18 07:16

    盛显科技:投影融合方案需要哪些设备?

    投影融合方案所需的设备主要包括以下几类: 一、核心设备 1、投影融合处理器: 投影融合处理器是实现从独立屏幕演示过渡到多个投影机无缝宽屏演示的核心设备。 主要决定大屏幕画面显示的内容和
    的头像 发表于 01-08 15:24 654次阅读
    盛显科技:<b class='flag-5'>投影</b>融合方案需要哪些设备?

    液晶投影仪与传统投影仪的比较

    液晶投影仪与传统投影仪在多个方面存在显著差异,以下是对两者的比较: 一、成像技术 液晶投影仪 :采用液晶板作为成像元件,通过液晶分子的排列变化来调控光线,从而实现色彩的精准还原与高清显示效果。 传统
    的头像 发表于 12-26 18:10 1594次阅读