0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深兰在自然语言处理领域欧洲顶会上取得好成绩

电子工程师 来源:DeepBlue深兰科技 作者:DeepBlue深兰科技 2021-04-23 11:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2021年4月19-23日,EACL2021因疫情影响于线上正式召开,这是计算语言学和自然语言处理领域的重要国际会议,在Google Scholar计算语言学刊物指标中排名第七。深兰科技DeepBlueAI团队参加了Shared Task on Sarcasm and Sentiment Detection in Arabic 比赛,并在其两个子任务讽刺检测和情感识别中,分别获得了第二名和第三名的好成绩,在深兰荣誉榜上再添新篇。

29afae82-a39c-11eb-aece-12bb97331649.jpg

29afae82-a39c-11eb-aece-12bb97331649.jpg

获奖技术方案分享

任务介绍

讽刺检测要求识别一段文字中是否包含讽刺的内容,讽刺是当前情感分析系统的主要挑战之一,因为具有讽刺性的句子通常用积极的表达方式去表示消极的情感。文本所表达的情感以及作者真正想表达的情感之间存在不同,这种情况给情感分析系统带来了巨大的挑战。

讽刺检测、情感识别在其他语言中引起了很大的关注,但是在阿拉伯语上则没有太多进展,该任务则是针对阿拉伯语,针对给定的一个推特文本,判断是积极、消极或者中立情感,以及是否具有讽刺性。

数据分析

任务数据集名字为ArSarcasm-v2[1],数据包含以下几个字段,tweet, sarcasm, sentiment, dialect,tweet代表推特文本,sarcasm为讽刺检测的标签,sentiment为情感分类的标签,dialect表示当前文本确切属于阿拉伯语中的哪个方言。

2a040f40-a39c-11eb-aece-12bb97331649.png

数据集统计如上图所示,Arsarcasm-V2 共有12548条训练文本,其中MSA占比达到了68.2%,Maghrebi占比较少,仅有42条。此外我们还分析了具有讽刺文本中的情感分布情况,占比如下图所示。可以看出讽刺文本中89%具有消极情感,只有3%具有正面情感,可见讽刺一般情况下传递消极的信息。

2a1afd68-a39c-11eb-aece-12bb97331649.png

模型

模型采用当前比较流行的预训练模型,因为语言为阿拉伯语,我们采用了专门针对阿拉伯语的预训练模型bert-large-arabertv02[2],以及多语言预训练模型xlm-roberta-large[3]。其中模型结构如下,选取模型多层[CLS]位置的输出进行加权平均得到[CLS]位置向量,然后经过全连接层,之后经过Multi-sample dropout[4]得到损失。对于讽刺检测为二分类,我们采用Binary Cross Entropy 损失函数,对于情感识别为三分类,我们采用Cross Entropy损失函数。

2a3a4db2-a39c-11eb-aece-12bb97331649.png

Multi-sample dropout 是dropout的一种变种,传统 dropout 在每轮训练时会从输入中随机选择一组样本(称之为 dropout 样本),而 multi-sample dropout 会创建多个 dropout 样本,然后平均所有样本的损失,从而得到最终的损失,multi-sample dropout 共享中间的全连接层权重。通过综合 M 个 dropout 样本的损失来更新网络参数,使得最终损失比任何一个 dropout 样本的损失都低。这样做的效果类似于对一个 minibatch 中的每个输入重复训练 M 次。因此,它大大减少训练迭代次数,从而大幅加快训练速度。因为大部分运算发生在 dropout 层之前的BERT层中,Multi-sample dropout 并不会重复这些计算,所以对每次迭代的计算成本影响不大。实验表明,multi-sample dropout 还可以降低训练集和验证集的错误率和损失。

训练策略

任务自适应预训练(TAPT)[5],在当前和任务相关的数据集上进行掩码语言模型(MLM)训练,提升预训练模型在当前数据集上的性能。

对抗训练是一种引入噪声的训练方式,可以对参数进行正则化,从而提升模型的鲁棒性和泛化能力。我们采用FGM (Fast Gradient Method)[6],通过在嵌入层加入扰动,从而获得更稳定的单词表示形式和更通用的模型,以此提升模型效果。

知识蒸馏[7]由Hinton在2015年提出,主要应用在模型压缩上,通过知识蒸馏用大模型所学习到的有用信息来训练小模型,在保证性能差不多的情况下进行模型压缩。我们将利用模型压缩的思想,采用模型融合的方案,融合多个不同的模型作为teacher模型,将要训练的作为student模型。

假设:采用arabertv模型,F1得分为70,采用不同参数、不同随机数,训练多个arabertv 模型融合后F1可以达到71;在采用xlm-roberta模型,训练多个模型后与arabertv模型进行融合得到最终的F1为72。基于最后融合的多个模型,采用交叉验证的方式给训练集打上 soft label,此时的soft label已经包含多个模型学到的知识。随后再去训练arabertv模型,模型同时学习soft label以及本来hard label,学习soft label采用MSE损失函数,学习hard label依旧采用交叉熵损失,通过这种方式训练出来的arabertv模型的F1可以达到71点多,最后将蒸馏学出来的模型再与原来的模型融合,得到最后的结果。

模型融合

为了更好地利用数据,我们采用7折交叉验证,针对每一折我们使用了两种预训练模型,又通过改变不同的参数随机数种子以及不同的训练策略训练了多个模型,之后对训练集和测试集进行预测。为了更好地融合模型,我们针对讽刺检测采用了线性回归模型进行融合,针对情感识别模型,采用支持向量机SVM进行融合。

实验结果

评价标准,针对讽刺检测,只评价讽刺类的F1,针对情感分类则对各个类的F1求平均,为了更好地评估模型的好坏,我们采用7折交叉验证的形式,以下结果是交叉验证结果的平均。

从下表中可以看出,无论是讽刺检测任务还是情感分类任务都是XLM-Roberta 模型相对好一些,经过TAPT和知识蒸馏后效果都有着显著提升。对于讽刺检测因为不同模型之间分数相差比较大,直接求平均效果不行,而采用线性回归后则达到了一个不错的水平,由于讽刺检测类别不平衡,我们将阈值调整为0.41,即大于0.41为1类。同样在情感分类任务中,由于多个模型之间的性能相差较大直接求平均也会造成性能的下降,我们最终采用SVM进行模型融合。

2a5b6a6a-a39c-11eb-aece-12bb97331649.png

原文标题:赛道 | 深兰载誉自然语言处理领域欧洲顶会EACL2021

文章出处:【微信公众号:DeepBlue深兰科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42038

    浏览量

    303101
  • 自然语言
    +关注

    关注

    1

    文章

    293

    浏览量

    14044

原文标题:赛道 | 深兰载誉自然语言处理领域欧洲顶会EACL2021

文章出处:【微信号:kmdian,微信公众号:深兰科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    上汽大众智能制造领域接连取得重要成果

    近日,上汽大众捷报频传。继首台EA211黄金增程器下线之后,上汽大众ID. ERA 9X正式量产下线。值“十五五”新开局,上汽大众智能制造领域接连取得重要成果,展现“开局即全速”的昂扬姿态,更为今年7款新能源车型的密集投放打下
    的头像 发表于 03-10 16:27 1179次阅读

    深兰科技全球市场布局全面提速

    2026年伊始,两次入选“AI出海先锋”的深兰科技海外业务再上新台阶。来自俄罗斯、乌兹别克斯坦、土耳其、埃及、阿联酋等国家及中东地区的客户代表与投资机构陆续到访,技术交流、场景对接、渠道布局及采购推进等多个层面取得阶段性成果,
    的头像 发表于 02-25 11:41 838次阅读

    解锁谷歌FunctionGemma模型的无限潜力

    智能体 AI 领域,工具调用能力是将自然语言转化为可执行软件操作的关键。此前,我们发布了专门针对函数调用而特别优化的 Gemma 3 270M 模型版本 FunctionGemma。该模型旨在协助开发者构建响应快速且具高性价比
    的头像 发表于 02-04 11:30 510次阅读
    解锁谷歌FunctionGemma模型的无限潜力

    自然语言处理NLP的概念和工作原理

    自然语言处理 (NLP) 是人工智能 (AI) 的一个分支,它会教计算机如何理解口头和书面形式的人类语言自然语言处理将计算
    的头像 发表于 01-29 14:01 689次阅读
    <b class='flag-5'>自然语言</b><b class='flag-5'>处理</b>NLP的概念和工作原理

    深兰科技受邀出席中马人工智能合作交流会

    2025年11月28日,“中马人工智能合作交流会”深兰科技张江总部成功举办。来自马来西亚智慧城市建设、公共服务运营、医疗体系管理、机场运营、地产开发、科技投资等多个领域的十余家机构齐聚深兰
    的头像 发表于 12-05 10:10 890次阅读

    后摩智能六篇论文入选四大国际

    2025年以来,后摩智能在多项前沿研究领域取得突破性进展,近期NeurIPS、ICCV、AAAI、ACMMM四大国际会上有 6 篇论文入
    的头像 发表于 11-24 16:42 1524次阅读
    后摩智能六篇论文入选四大国际<b class='flag-5'>顶</b>会

    云知声论文入选自然语言处理会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(
    的头像 发表于 11-10 17:30 973次阅读
    云知声论文入选<b class='flag-5'>自然语言</b><b class='flag-5'>处理</b><b class='flag-5'>顶</b>会EMNLP 2025

    深兰科技发布AI法务大模型产品

    近日,深兰科技发布面向律所与企业法务部门的AI法务大模型产品——“深兰律师办公自动化系统(AI版)”。通过AI技术赋能法律服务行业,它能够显著提升法律文书处理效率与事务性工作自动化水平,为律所和法务团队带来全新的工作体验。
    的头像 发表于 10-23 17:58 1296次阅读

    HarmonyOSAI编程自然语言代码生成

    安装CodeGenie后,在下方对话框内,输入代码需求描述,将根据描述智能生成代码,生成内容可一键复制或一键插入至编辑区当前光标位置。 提问示例 使用ArkTs语言写一段代码,页面中间部分
    发表于 09-05 16:58

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    引言:为什么需要 “自然语言控板”? 痛点引入 :嵌入式开发中,开发者常需通过 SSH 等工具登录开发板,手动输入复杂的 Linux 命令(如ls -l、gpio readall、ifconfig等
    发表于 08-23 13:10

    思必驰与上海交大联合实验室研究成果入选两大顶级会议

    近日,计算语言学与自然语言处理领域全球顶级会议ACL 2025及语音研究领域旗舰会议INTERSPEECH 2025相继公布论文录用结果。思
    的头像 发表于 07-11 16:24 1138次阅读
    思必驰与上海交大联合实验室研究成果入选两大顶级会议

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 1464次阅读

    CADENAS 2025 年金字塔公司联系博览会上取得圆满成功

    4 月 29 日,CADENAS GmbH 又一次参加了奥格斯堡举办的金字塔企业联络展。我们与约 270 家公司一起,奥格斯堡展厅向 3500 多名参观者展示了自己。 CADENAS 现场直播
    发表于 06-04 14:32

    人工智能浪潮下,制造企业如何借力DeepSeek实现数字化转型?

    DeepSeek,凭借其强大的深度学习和自然语言处理能力,能够理解复杂问题并提供精准解决方案。它不仅能够作为学习、工作、生活的助手,满足用户不同场景下的需求,更能在制造业中发挥重要作用。通过
    的头像 发表于 05-29 16:17 791次阅读

    云知声四篇论文入选自然语言处理会ACL 2025

    结果正式公布。云知声在此次国际学术盛会中表现卓越,共有4篇论文被接收,其中包括2篇主会论文(Main Paper)和2篇Findings。入选的4篇论文聚焦大语言模型知识溯源、图文音多模态大模型、大语言模型可解释性等关键领域,提
    的头像 发表于 05-26 14:15 1546次阅读
    云知声四篇论文入选<b class='flag-5'>自然语言</b><b class='flag-5'>处理</b><b class='flag-5'>顶</b>会ACL 2025