汉语的零形式识别与填充方法研究综述

资料大小: 2.67 MB

所需积分: 0

下载次数:

用户评论: 0条评论,查看

上传日期: 2021-06-03

上 传 者: 他上传的所有资料

资料介绍

标签:算法(2935)数据(3500)

  零形式识别与填充是在语篇上下文中为句中缺失的语义角色寻找填充项,然而采用分类思想预测集合中正确瑱充项的方法制约了零形式瑱充的性能。针对该冋颕,结合启发式规则与决策树算法识别岀需要填充内容的零形式,将上下文中填充过框架元素的内容构成候选语集合,并通过改进的 SMOTE算法对少数类样本数据进行扩展,解决了候选语集合数据的非平衡问题。在此基础上,借助汉语框孆知识库提取语义相似性特征,利用框架元素间的映射关系提升零形式填充效果。实验结果表明,该方法在数对填充样本的非平衡性进行处理,可使最终的F值提高约12%。

用户评论

查看全部 条评论

发表评论请先 , 还没有账号?免费注册

发表评论

用户评论
技术交流、我要发言! 发表评论可获取积分! 请遵守相关规定。
上传电子资料