标注多跳问答(Multi-hop QA)数据集费时费力!本文首次研究了无监督的多跳问答的可能性,提出了MQG-QA,一种无监督的框架,从同构和异构数据源中自动生成多跳问答对。使用生成的数据预先训练QA系统将大大减少对人工标注训练数据的需求。
多跳问答(QA)训练数据的获取是非常耗时费力的。为了解决这个问题,我们探索了无监督的多跳QA问答对生成的问题,可以在没有标注的QA对场景下使用,非常的适合真实场景。
我们模型首先通过首先从每个数据源中选择或生成相关信息,然后将多个信息整合起来,形成一个多跳问题。我们发现,用我们模型产生的训练数据训练出来的模型,性能和完全监督模型之间的F1差距较小。这个现象是非常激动人心的,表明我们可以通过无监督预的构造数据来大大减少对人工标注的训练的需求。
下图是该方法的简易用法演示:

原文标题:【NAACL2021】初探无监督的多跳问答对
文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。
责任编辑:haq
-
人工智能
+关注
关注
1813文章
49734浏览量
261495
原文标题:【NAACL2021】初探无监督的多跳问答对
文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
功率放大器驱动:无载流子注入模式下一对多驱动研究的应用探索
基于改进模糊PI控制的无位置传感器无刷直流电机调速研究
无位置传感器控制的双电机驱动系统性能研究
无刷直流电机无位置传感器控制系统仿真研究
无刷直流电机双闭环控制的仿真研究
无刷直流电机改进型直接转矩控制研究
无刷双馈异步电机潮流建模和收敛性研究
无电解电容逆变器永磁同步电机驱动系统控制研究
聚徽解析电容式触摸屏常见失灵问题:从跳屏、漂移到无反应的修复指南
【Simcenter STAR-CCM+】通过真实条件下的多物理场CFD仿真提高产品性能

无监督的多跳问答的可能性研究
评论