0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用于改进文本分类的特征投影

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2021-03-05 15:35 次阅读

TL; DR

在情感分类中,一些good features,比如”good“、”nice“表示积极,”bad“、“terrible”表示消极。但是,还有许多common features,比如voice、screen就没有特别的情感性。

尽管深度学习拥有强大的representation learning(表征学习,即同一个数据用不同的表示形式)。但我们认为还有可以改进的地方。

在本文中,我们提出了一种新的角度来进一步改善这种表示学习,即特征投影(feature projection):将现有特征投影到common特征的正交空间中。

所得的投影向量垂直于common特征,能更好的进行分类。

将该方法用于改进基于CNN,RNN,Transformer和Bert的文本分类模型,获得更好的结果。

网络结构

Feature Purification Network 特征净化网络

模型分为两部分:

projection network (P-net);

common feature learning network (C-net)

P-net:计算净化的向量特征,通过将学习到的输入文本的信息向量投影到更具区分性的语义空间中来消除共同特征的影响。

C-net:提取common features。

P-net由四部分组成:

输入层X

特征提取器Fp

正交投影层(OPL,Orthogonal Projection Layer)

分类层Cp

C-net也由四部分组成:

输入层X

特征提取器Fc(Fp和Fc的参数不共享)

渐变反向层(GRL,Gradient Reverse Layer)

分类层Cc

技术的关键思想如下:

P-Net中特征向量fp投影到C-Net的fc的正交方向上。也就是说,将fp(从输入文档中提取的完整信息)投影到更具区分性的语义空间中,以进行最终分类。

图2:正交投影层的工作方式。这里的示例是在二维空间中。

fp表示传统特征向量;

fc表示公共特征向量;

fp∗是投影特征向量;

fp~是最终的正交投影特征向量。

我们首先将传统特征向量fp投影到共同特征向量fc,得到fp∗。

等式9中的fp∗即表示对共同特征向量fc的约束。

再将fp投影到fp-fp*得到fp~

也就是说:通过将输入的传统特征向量fp投影到公共特征向量fc来限制公共特征向量的模,因此新的公共特征向量fp*的语义信息仅包含xi的公共语义信息。

这使得最终的纯化特征向量fp~来自传统特征向量fp,而不是与公共特征向量fc正交的任何平面中的任何向量。

最后,我们使用纯化的特征向fp~进行分类。

Experiments实验

1 实验使用数据集

2 Baselines模型

用LSTM、CNN、Transformer和BERT等基准模型进行对比实验,已验证特征投射的有效性。

3 实施细节

首先,我们将实验中的所有词嵌入随机初始化为200维向量,然后在训练过程中进行修改(Bert除外)。对于每种类型的特征提取器,我们具有以下配置:

对于RNN模型,使用两层LSTM进行特征提取,每层的hidden state=256;

对于CNN模型,为了获得更多的细粒度特征,我们分别使用了[2,3,4,5,6]的滤波器大小,每个滤波器都有100个特征图。

对于Transformer的模型,我们使用Transformer的编码器作为特征提取器,使用单头和3个block。

对于Bert模型,我们微调了预训练的基于Bert的参数。这些设置与FP-Net中的基线完全相同。

在C-net模块的训练中,我们以0.9为初始学习率的随机梯度和随后的退火学习率(Ganin and Lempitsky,2014)。

其中,训练进度p从0线性变化为1,l0 = 0.01,α= 10和β= 0.75。在GRL中,超参数λ为[0.05,0.1,0.2,0.4,0.8,1.0]。

4 实验结果

5 消融实验与分析

消融实验类似于“控制变量法”。假设在某任务中,使用了A,B,C,取得了不错的效果,但是这个时候你并不知道效果是由A,B,C中哪一个起的作用,于是你保留A,B,移除C进行实验来看一下C在整个任务中所起的作用。

结论

在本文中,我们提出了一种新的特征净化网络(FP-Net),以改进文本分类的表示;

该方法基于特征投影。所提出的模型使用两个子网,一个用于识别对分类没有区别的共同特征common features,另一个用于将传统特征投射到共同特征的正交方向的特征投影;

我们当前的方法仅用于传统文本分类方法,例如LSTM,CNN和Transformer。在未来的工作中,我们将考虑将其扩展到基于图的方法(例如用于图形数据的GCN),以及扩展到基于生成的方法(例如用于对抗性学习的GAN)。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 文本分类
    +关注

    关注

    0

    文章

    18

    浏览量

    7260
  • 深度学习
    +关注

    关注

    73

    文章

    5240

    浏览量

    119936
  • cnn
    cnn
    +关注

    关注

    3

    文章

    327

    浏览量

    21304

原文标题:【ACL2020】用于改进文本分类的特征投影

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    了解如何使用PyTorch构建图神经网络

    图神经网络直接应用于图数据集,您可以训练它们以预测节点、边缘和与图相关的任务。它用于图和节点分类、链路预测、图聚类和生成,以及图像和文本分类
    发表于 02-21 12:19 229次阅读
    了解如何使用PyTorch构建图神经网络

    人工智能中文本分类的基本原理和关键技术

    在本文中,我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用,以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用,旨在提供对文本分类技术深入理解的全面视角。
    的头像 发表于 12-16 11:37 562次阅读
    人工智能中<b class='flag-5'>文本分类</b>的基本原理和关键技术

    华为云 API 自然语言处理的魅力—AI 情感分析、文本分

    云服务、API、SDK,调试,查看,我都行  阅读短文您可以学习到:人工智能 AI 自言语言的情感分析、文本分词、文本翻译 IntelliJ IDEA 之 API 插件介绍 API 插件支持 VS
    的头像 发表于 10-12 11:02 262次阅读
    华为云 API 自然语言处理的魅力—AI 情感分析、<b class='flag-5'>文本分</b>析

    各种投影显示技术有哪些特点

    CRT投影机的历史可以追溯到上世纪50年代,当时主要应用在商务飞机上,进行录像带的播放。到了80年代,个人电脑的迅速发展,使得文本和数据展示的市场需求越来越大,促使了CRT投影技术的长足发展。
    发表于 09-26 09:42 675次阅读
    各种<b class='flag-5'>投影</b>显示技术有哪些特点

    3 种用于改进过程的基本精益工具

    每个组织都可以从持续改进中受益。尽管精益、六西格玛、改善等是持续改进专业人员的口头禅,但它们是所有人应用于日常职业生涯以提高效率和推动价值的准则。 “精益”一词往往侧重于通过创造效率来实现价值最大化
    的头像 发表于 09-18 10:32 253次阅读

    基于无线射频识别的手术器械自适应分类仿真

    氏距离的手术器械信号分类方法。 该方法采用高斯滤波对手术器械设备标签信号进行滤波处理,将滤波后的手术器械标签信号投影到新的特征空间上,将投影后新特征
    发表于 09-18 08:53

    自然语言处理和人工智能的区别

      自然语言处理(Natural Language Processing,NLP)是人工智能(AI)中的一个分支,它利用计算机技术对自然语言进行处理,使得电脑能够理解和操作人类语言。自然语言处理技术包括文本分析、语音识别和机器翻译等,这些技术已经广泛应用于在线客服、
    发表于 08-28 17:32 941次阅读

    什么是卷积神经网络?为什么需要卷积神经网络?

    卷积神经网络(Convolutional Neural Network,CNN)是一种用于处理具有类似网格结构的数据的神经网络。它广泛用于图像和视频识别、文本分类等领域。CNN可以自动从训练数据中学习出合适的
    发表于 08-22 18:20 1570次阅读

    神经网络模型用于解决什么样的问题 神经网络模型有哪些

    下一个单词或者下一句话的概率,从而建立起一个能够捕捉序列数据中语言模式的模型,从而用于自然语言生成、机器翻译、文本分类等任务。 序列标注任务:神经网络模型可以将文本序列中的各个位置与相应的标签关联起来,从而
    的头像 发表于 08-03 16:37 4314次阅读

    87.7 10 LSTM文本分类文本生成实战 #硬声创作季

    网络程序代码
    充八万
    发布于 :2023年07月20日 04:39:21

    华为云ModelArts入门开发(完成物体分类、物体检测)

    利用ModelArts框架可以完成图像分类、物体检测、预测分析、声音分类文本分类等功能。介绍如何使用ModelArts完成图像分类、物体检测、自我学习等功能运用。
    的头像 发表于 07-10 16:26 1314次阅读
    华为云ModelArts入门开发(完成物体<b class='flag-5'>分类</b>、物体检测)

    XGBoost中无需手动编码的分类特征

    XGBoost 中无需手动编码的分类特征
    的头像 发表于 07-05 16:30 289次阅读

    NLP中的迁移学习:利用预训练模型进行文本分类

    迁移学习彻底改变了自然语言处理(NLP)领域,允许从业者利用预先训练的模型来完成自己的任务,从而大大减少了训练时间和计算资源。在本文中,我们将讨论迁移学习的概念,探索一些流行的预训练模型,并通过实际示例演示如何使用这些模型进行文本分类。我们将使用拥抱面转换器库来实现。
    发表于 06-14 09:30 312次阅读

    PyTorch教程-4.3. 基本分类模型

    4.3. 基本分类模型¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab Colab [jax
    的头像 发表于 06-05 15:43 323次阅读

    PyTorch教程4.3之基本分类模型

    电子发烧友网站提供《PyTorch教程4.3之基本分类模型.pdf》资料免费下载
    发表于 06-05 15:43 0次下载
    PyTorch教程4.3之基<b class='flag-5'>本分类</b>模型