基于卷积神经网络的组合模型处理NLP任务讽刺检测-电子发烧友网

编者按：NTU研究人员Soujanya Poria等提出了一个组合模型，基于预训练的卷积神经网络提取情感、情绪、个性特征，以进行讽刺检测。NTHU PhD学生Elvis Saravia简明扼要地总结了论文的主要思路。

概览

这篇论文使用基于卷积神经网络（CNN）的组合模型处理NLP任务讽刺检测（sarcasm detection）。讽刺检测对情感检测和情感分析等领域而言十分重要，因为这一表达将翻转句子的极性。

例子

人们可以认为讽刺用来挖苦或奚落。比如“是你还是我该吃药了”、“我每周工作40小时才这么穷”。（examples.yourdictionary.com上有更多例子。）

挑战

理解和检测讽刺很重要的一点就是理解关于事件的事实。这让我们可以检测客观极性（通常是负面的）和作者的讽刺特征（通常是正面的）之间的反差。

考虑以下例子，“我爱分手之苦”，很难从中提取检测其中是否存在讽刺的知识。例子中的“我爱其苦”提供了作者表达的情感的知识（在这个例子中是正面的），而“分手”描述了一个相反的情感（负面）。

讽刺语句中的其他挑战包括指代多个事件，以及提取大量事实、常识、指代解析、逻辑推理。论文的作者依靠CNN从讽刺语料库中自动学习特征。

贡献

将深度学习应用于讽刺检测

利用用户简介、情绪、情感特征进行讽刺检测

应用预训练模型自动提取特征

模型

情感转移（sentiment shifting）在牵涉讽刺的交流中很常见。因此，论文作者首先训练基于CNN训练一个情感模型学习情感特定的特征提取。模型在低层学习局部特征，之后在高层转换为全局特征。作者发现讽刺表达和用户相关——某些用户比其他用户发布更多讽刺性内容。

作者提出的框架整合了基于用户个性的特征，情感特征，基于情绪的特征。每组特征通过独立的模型学习，成为从数据集中提取讽刺相关特征的预训练模型。

CNN框架

CNN能够有效地建模局部特征以学习更全局的特征，本质上，这是在学习上下文（learn context）。句子使用词向量（嵌入）表示（基于Google的word2vec向量）。使用了非静态表示，因此，词向量的参数在训练阶段学习。接着，在特征映射上应用最大池化，以生成特征。然后是softmax层及全连接层，以输出最终预测。（见下图）

为了得到其他特征——情感（S）、情绪（E）、个性（P）——预训练了CNN模型，并使用这些预训练模型从讽刺数据集中提取特征。训练每个模型使用了不同的训练数据集。（参考论文了解更多细节）

测试了两个分类器——一个CNN分类器（CNN）和一个SVM分类器（CNN-SVM，使用CNN提取的特征作为输入）。

另外还训练了一个基线分类器（B）——仅仅使用CNN模型，没有结合其他模型（情绪、情感等）。

试验

数据为均衡和失衡的讽刺推文数据集，取自Ptacek等2014年的工作和The Sarcasm Detector。移除了用户名、URL、#标记，使用了NLTK Twitter Tokenizer。（参考论文了解更多细节）

下表显示了CNN和CNN-SVM分类器的表现。我们可以观测到结合了讽刺特征、情感特征、情绪特征、个性特征的模型（特别是CNN-SVM）的表现超过了其他模型。

B = 基线，S = 情感，E = 情绪， P = 个性。所有试验使用了五折交叉验证

下表则是与当前最先进模型（第一行）和另一个知名的讽刺检测模型（第二行）的比较。同样，论文提出的模型的表现超过了其他模型。

D3 => D1意为在数据集3上训练，在数据集1上测试

论文测试了模型的概括能力，主要的发现是如果数据集本质上很不相同，会显著影响结果。（见下图基于PCA可视化的数据集）。例如，在数据集1上训练，然后在数据集3上测试，模型的F1评分为33.05%.

结论

总体而言，论文作者发现讽刺高度依赖主题，并且高度上下文相关。因此，情感和其他上下文线索有助于从文本中检测讽刺。使用预训练的情感、情绪、个性模型从文本中捕捉上下文信息。

手工构造的特征（例如，n元语法），尽管某种程度上有助于讽刺检测，会产生非常稀疏的特征向量表示。因此，使用词嵌入作为输入特征。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4572

浏览量
98746
数据集

数据集

+关注

关注
4

文章
1178

浏览量
24351
深度学习

深度学习

+关注

关注
73

文章
5237

浏览量
119908

原文标题：基于深度卷积网络进行讽刺检测

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

卷积神经网络如何使用

卷积神经网络(CNN)究竟是什么，鉴于神经网络在工程上经历了曲折的历史，您为什么还会在意它呢? 对于这些非常中肯的问题，我们似乎可以给出相对简明的答案。

发表于 07-17 07:21

可分离卷积神经网络在 Cortex-M 处理器上实现关键词识别

我们可以对神经网络架构进行优化，使之适配微控制器的内存和计算限制范围，并且不会影响精度。我们将在本文中解释和探讨深度可分离卷积神经网络在 Cortex-M 处理器上实现关键词识别的潜力

发表于 07-26 09:46

卷积神经网络一维卷积的处理过程

。本文就以一维卷积神经网络为例谈谈怎么来进一步优化卷积神经网络使用的memory。文章（卷积神经网络

发表于 12-23 06:16

卷积神经网络模型发展及应用

神经网络已经广泛应用于图像分类、目标检测、语义分割以及自然语言处理等领域。首先分析了典型卷积神经网络模型

发表于 08-02 10:39

卷积神经网络为什么适合图像处理？

卷积神经网络为什么适合图像处理？

发表于 09-08 10:23

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法

一。其主要应用领域在计算机视觉和自然语言处理中，最初是由Yann LeCun等人在20世纪80年代末和90年代初提出的。随着近年来计算机硬件性能的提升和深度学习技术的发展，CNN在很多领域取得了重大的进展和应用。一、卷积神经网络

发表于 08-17 16:30 •917次阅读

卷积神经网络的应用卷积神经网络通常用来处理什么

卷积神经网络的应用卷积神经网络通常用来处理什么卷积神经网

发表于 08-21 16:41 •3988次阅读

卷积神经网络模型有哪些？卷积神经网络包括哪几层内容？

、视频等信号数据的处理和分析。卷积神经网络就是一种处理具有类似网格结构的数据的神经网络，其中每个单元只处

发表于 08-21 16:41 •1508次阅读

卷积神经网络模型原理卷积神经网络模型结构

卷积神经网络模型原理卷积神经网络模型结构卷积

发表于 08-21 16:41 •660次阅读

卷积神经网络的介绍什么是卷积神经网络算法

的深度学习算法。CNN模型最早被提出是为了处理图像，其模型结构中包含卷积层、池化层和全连接层等关键技术，经过多个卷积层和池化层的

发表于 08-21 16:49 •1425次阅读

卷积神经网络算法流程卷积神经网络模型工作流程

，其独特的卷积结构可以有效地提取图像和音频等信息的特征，以用于分类、识别等任务。本文将从卷积神经网络的基本结构、前向传播算法、反向传播算法等方面探讨其算法流程与

发表于 08-21 16:50 •1586次阅读

常见的卷积神经网络模型典型的卷积神经网络模型

常见的卷积神经网络模型典型的卷积神经网络模型卷积

发表于 08-21 17:11 •1922次阅读

cnn卷积神经网络模型卷积神经网络预测模型生成卷积神经网络模型

cnn卷积神经网络模型卷积神经网络预测模型生成卷积

发表于 08-21 17:11 •806次阅读

卷积神经网络模型搭建

卷积神经网络模型搭建卷积神经网络模型是一种深度学习算法。它已经成为了计算机视觉和自然语言

发表于 08-21 17:11 •610次阅读

卷积神经网络模型的优缺点

等领域中非常流行，可用于分类、分割、检测等任务。而在实际应用中，卷积神经网络模型有其优点和缺点。这篇文章将详细介绍

发表于 08-21 17:15 •2328次阅读

搜索历史

基于卷积神经网络的组合模型处理NLP任务讽刺检测

评论

卷积神经网络如何使用

可分离卷积神经网络在 Cortex-M 处理器上实现关键词识别

卷积神经网络一维卷积的处理过程

卷积神经网络模型发展及应用

卷积神经网络为什么适合图像处理？

卷积神经网络原理：卷积神经网络模型和卷积神经网络算法

卷积神经网络的应用卷积神经网络通常用来处理什么

卷积神经网络模型有哪些？卷积神经网络包括哪几层内容？

卷积神经网络模型原理卷积神经网络模型结构

卷积神经网络的介绍什么是卷积神经网络算法

卷积神经网络算法流程卷积神经网络模型工作流程

常见的卷积神经网络模型典型的卷积神经网络模型

cnn卷积神经网络模型卷积神经网络预测模型生成卷积神经网络模型

卷积神经网络模型搭建

卷积神经网络模型的优缺点