感谢清华大学自然语言处理实验室对预训练语言模型架构的梳理,我们将沿此脉络前行,探索预训练语言模型的前....
得益于BERT的加持,Encoder搭配CRF的结构在中文NER上通常都有不错的表现,而且BERT使....
前言 情感分析是文本分类的一个分支,是对带有情感色彩(褒义贬义/正向负向)的主观性文本进行分析,以确....
近年来,自然语言处理(Natural Language Processing, NLP)模型在文本分....
本期导读:文本摘要技术(Text Summarization)是信息爆炸时代,提升人们获取有效信息效....
1. 简介 本文提出了一种新的梯度Boosting框架,将浅层神经网络作为“弱学习者”。在此框架下,....
近几年,神经网络因其强大的表征能力逐渐取代传统的机器学习成为自然语言处理任务的基本模型。然而经典的神....
开放域信息抽取是信息抽取任务的另一个分支任务,其中抽取的谓语和实体并不是特定的领域,也并没有提前定义....
前言 2021年4月,距离论文“Attention is all you need”问市过去快4年了....
NAACL2021中,复旦大学大学数据智能与社会计算实验室(Fudan DISC)和微软亚洲研究院合....
一、简介 1. 什么是问答? 问答 (Question Answering) 是自然语言处理 (Na....
说一下我了解的学校和实验室!排名不分先后,名单不全,欢迎补充~ 清华大学:孙茂松老师、刘知远 @刘知....
作者:MARCIN ZABŁOCKIMARCIN ZABŁOCKI 编译:ronghuaiyang(....
自从深度学习火起来后,预训练过程就是做图像或者视频领域的一种比较常规的做法,有比较长的历史了,而且这....
为了解决预训练和微调时,因为任务的不同而预训练和微调阶段的gap,加入了一个增强decoder端,这....
投稿要求与主流ACL系列会议一致,所有与计算语言学和自然语言处理相关的论文都可以投稿到ARR,包含长....
我的看法:知识图谱不是NLP的未来,因为知识图谱是另外一种与NLP有很多交集的技术。在目前所有已知的....
当我们拿到一个信息抽取的任务,需要明确我们抽取的是什么,”今天天气真冷“,我们要抽的天气的状态天气-....
清明节这几天有些时间写了这篇文章,从我的视角,用几个深度学习框架串起来这些年历史上的一些有趣的插曲,....
一般的文本分类任务只提供句子或文档级别的情感标签,引入情感词典等先验情感知识可以给情感文本引入更细粒....
知识图谱嵌入 knowledge graph embedding是将包含实体和关系的知识图谱三元组嵌....
请求和键值初始为不同的权重是为了解决可能输入句长与输出句长不一致的问题。并且假如QK维度一致,如果不....
图神经网络的可解释性是目前比较值得探索的方向,今天解读的2021最新综述,其针对近期提出的 GNN ....
今天想谈的问题是:什么是贝叶斯优化/Bayesian Optimization,基本用法是什么? 本....
大家在做模型的时候,往往关注一个特定指标的优化,如做点击率模型,就优化AUC,做二分类模型,就优化f....
近些年,Transformer[1]逐渐成为了自然语言处理中的主流结构。为了进一步提升Transfo....
图数据的天然优势是为学习算法提供了丰富的结构化信息,节点之间邻接关系的设计成为了重要的先验信息和交互....
1.开篇 去年年底,各大榜单上风起云涌,各路英雄在榜单上为了分数能多个0.01而不停的躁动,迫不及待....
要说自然语言处理在18年最夺目闪耀的是什么事情,那当属 BERT 刷新各个任务的记录了,至今已经过去....
参与混合主动互动的能力是会话搜索系统的核心要求之一。如何做到这一点,人们知之甚少。我们提出了一组无监....