0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌重磅发布自然问题数据集,包含30万个自然发生的问题和人工注释的答案

DPVg_AI_era 来源:lq 2019-01-25 09:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今天,谷歌重磅发布自然问题数据集(Natural Questions),包含30万个自然发生的问题和人工注释的答案,16000个示例,并发起基于此数据集的问答系统挑战赛。有望成为自然语言理解领域的SQuAD!

开放领域问题回答(QA)是自然语言理解(NLU)中的一项基准任务,它的目的是模拟人类如何查找信息,通过阅读和理解整个文档来找到问题的答案。

比如,给定一个用自然语言表达的问题“为什么天空是蓝色的?”("Why is the sky blue?”),QA系统应该能够阅读网页(例如“天空漫射”的维基百科页面)并返回正确的答案,即使答案有些复杂和冗长。

然而,目前还没有可以用于训练和评估QA模型的大型、公开的自然发生问题(即由寻求信息的人提出的问题)和答案数据集。

这是因为构建用于QA任务的高质量数据集需要大量的真实问题来源,并且需要大量人力来为这些问题寻找正确答案。

为了促进QA领域的研究进展,谷歌今天发布自然问题数据集(Natural Questions, NQ),这是一个用于训练和评估开放领域问答系统的新的、大规模语料库,也是第一个复制人类查找问题答案的端到端流程的语料库。

Natural Questions数据集

NQ的规模非常庞大,包含30万个自然发生的问题,以及来自Wikipedia页面的人工注释答案,用于训练QA系统。

此外,NQ语料库还包含16000个示例,每个示例都由5位不同的注释人提供答案(针对相同的问题),这对于评估所学习的QA系统的性能非常有用。

Natural Questions数据集中的示例

由于回答NQ中的问题比回答琐碎问题(这些问题对计算机来说已经很容易解决)需要有更深入的理解,谷歌还发起了一项基于此数据集的挑战赛,以帮助提高计算机对自然语言的理解。

NQ挑战赛排行榜

NQ数据集包含307K训练示例、8K开发示例和8K测试示例。

目前,NQ挑战赛排行榜上只有谷歌的BERT模型和DecAtt-DocReader模型的成绩。在论文中,谷歌证明在长答案选择任务上的人类的最优成绩为87% F1,在短答案选择任务上人类的最优成绩为76%。

来自谷歌搜索的真实问题

NQ是第一个使用自然发生的查询创建的数据集,并专注于通过阅读整个页面来查找答案,而不是从一个短段落中提取答案。

为了创建NQ,我们从用户提交给Google搜索引擎的真实、匿名、聚合的查询开始。

然后,我们要求注释者通过通读整个维基百科页面来找到答案,就好像这个问题是他们自己提出的一样。注释者需要找到一个长答案和一个短答案,长答案涵盖推断问题所需的所有信息,短答案需要用一个或多个实体的名称简洁地回答问题。

对NQ语料库的注释质量进行评估,显示准确率达到90%。

注释包含一个长答案和一个短答案

研究人员在论文《自然问题:问答研究的基准》(Natural Questions: a Benchmark for Question Answering Research)中对数据收集的过程进行了全面描述,论文已发表在《计算语言学协会会刊》(Transactions of the Association for computing Linguistics)。大家也可以在NQ网站上查看更多来自数据集的示例。

自然语言理解挑战

NQ的目的是使QA系统能够阅读和理解完整的维基百科文章,其中可能包含问题的答案,也可能不包含问题的答案。

系统首先需要确定这个问题的定义是否足够充分,是否可以回答——许多问题本身基于错误的假设,或者过于模糊,无法简明扼要地回答。

然后,系统需要确定维基百科页面中是否包含推断答案所需的所有信息。我们认为,相比在知道长答案后在寻找短答案,长答案识别任务——找到推断答案所需的所有信息——需要更深层次的语言理解。

我们希望NQ的发布以及相关的挑战赛将有助于推动更有效、更强大的QA系统的开发。我们鼓励NLU社区参与进来,并帮助缩小目前最先进方法的性能与人类上限之间的巨大差距。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110241
  • 数据集
    +关注

    关注

    4

    文章

    1230

    浏览量

    26041
  • 自然语言
    +关注

    关注

    1

    文章

    292

    浏览量

    13916

原文标题:NLP新基准!谷歌重磅发布开放问答数据集,30万自然提问+人工注释答案

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    伟创力重磅发布全球首款面向千兆瓦级数据中心的AI基础设施平台

    伟创力重磅发布全球首款面向千兆瓦级数据中心的AI基础设施平台,平台集成了电源和冷却产品、计算能力和服务,专为AI和高性能计算而设计,帮助数据中心运营商将部署速度提升高达
    的头像 发表于 10-23 15:08 591次阅读

    校园科普气象站:技术赋能下的自然探索课堂

    校园科普气象站:技术赋能下的自然探索课堂 柏峰【BF-XQX】在素质教育深化推进的背景下,校园科普气象站正成为连接课堂理论与自然实践的重要桥梁。它以模块化的技术架构、可视化的交互设计和趣味化的教学场景,
    的头像 发表于 10-22 10:05 168次阅读
    校园科普气象站:技术赋能下的<b class='flag-5'>自然</b>探索课堂

    SGS为TCL华星自然光MNT显示颁发高自然光相似度 Performance Tested Mark

    广州2025年10月17日 /美通社/ -- 2025年10月15日,第138届中国进出口商品交易会(又称"广交会")的全屋智能家电专场新产品发布会现场,国际公认的测试、检验和认证机构SGS为TCL
    的头像 发表于 10-19 20:26 236次阅读
    SGS为TCL华星<b class='flag-5'>自然</b>光MNT显示颁发高<b class='flag-5'>自然</b>光相似度 Performance Tested Mark

    激光与自然光的根本区别是什么?

    的,能够照准在一焦点。即使在远处,光线激光的光线也能够照准在一焦点上。而自然日光的光线是分散的,所以光线是比较弱。 激光主要的特性之一便是可以产生高得出奇的亮度,或者说具有高的发光强度。地球上任何一种已知材料,无论
    的头像 发表于 09-24 08:08 159次阅读

    NVIDIA推出多语种语音AI开放数据与模型

    发布的 Granary 数据包含约 100 小时音频,可用于训练高精度、高吞吐量的 AI 音频转录与翻译模型。
    的头像 发表于 09-23 15:34 592次阅读

    标贝科技参编《人工智能高质量数据建设指南》

    联盟数据委员会共同发布人工智能高质量数据建设指南》,旨在为业界建设高质量数据
    的头像 发表于 09-11 17:19 678次阅读

    北斗生态环境监测站:读懂自然的 “语言”

    北斗生态环境监测站:读懂自然的 “语言”柏峰【BF-BDQX】当生态监测遇上北斗技术,一场关于 “精准守护自然” 的变革正悄然发生 ——北斗生态环境监测站以北斗定位导航系统为核心
    的头像 发表于 09-04 10:59 319次阅读
    北斗生态环境监测站:读懂<b class='flag-5'>自然</b>的 “语言”

    航天宏图筑牢自然灾害安全防线

    自然灾害频发的今天,每一秒的数据滞后都可能意味着生命与财产的巨大损失。如何让防灾减灾的决策从“经验驱动”转向“数据智能”?航天宏图用一套“常普常新”的科技解决方案,给出了答案
    的头像 发表于 07-14 14:31 501次阅读

    人工合成石墨片与天然石墨片的差别

    程度天然高达98%以上,无需额外高温处理,保留了自然形成的层状晶体结构,适合对成本敏感的传统工业场景。 人工合成石墨则是科技创新的产物。傲琪采用聚酰亚胺膜等含碳化合物,通过炭化、高温石墨化及精密压延工艺
    发表于 05-23 11:22

    鸿利智汇旗下斯迈得推出自然光系列产品

    随着健康意识的提升与生活方式的转变,人们对健康光源的要求越来越高。鸿利智汇集团旗下子公司斯迈得凭借领先的光谱技术,推出自然光系列产品,以智能科技模拟自然日光律动,为客户带来健康、舒适且高度个性化的全天候光环境体验。
    的头像 发表于 05-22 13:47 816次阅读

    UCC28060 自然交错双相转换模式 PFC 控制器数据手册

    该解决方案针对大批量消费类应用进行了优化,将转换模式的优势(高效率和低成本组件)扩展到比以前更高的额定功率。通过使用 Natural Interleave(自然交错)技术,两**通道都作为**主
    的头像 发表于 04-01 13:46 955次阅读
    UCC28060 <b class='flag-5'>自然</b>交错双相转换模式 PFC 控制器<b class='flag-5'>数据</b>手册

    无法将自定义COCO数据导入到OpenVINO™ DL Workbench怎么解决?

    JSON包含以下格式注释的文件:{ \"images\": [], \"annotations\": [] } 创建自定义 COCO 数据。 无法将自定义 COCO
    发表于 03-05 06:02

    航天宏图持续助力自然资源高质量发展

    日前,全国自然资源工作会议在京召开,为自然资源工作指明了新方向,聚焦了新要求。航天宏图长期深耕自然资源领域,以智能遥感服务与多维时空底座建设两大核心能力为抓手,全面服务测绘、国土、林草、地质、海洋等
    的头像 发表于 02-10 09:58 718次阅读

    依托新的全球数据识别人工智能领域新一轮涌现的杰出女性

    在全球人工智能和数据岗位中仅占比25%,在全球科学家当中占比不到30%。 Zeki是唯一在全球范围内识别未被挖掘、缺乏充分代表和被低估的女性科学和工程人才的数据
    的头像 发表于 01-19 09:39 535次阅读

    启英泰伦新推出多意图自然说,重塑离线人机交互新标准!

    自然说多意图自然说是启英泰伦新推出的一种离线NLP处理技术,该技术突破以往一次只能说一命令词的限制,可同时配置多个命令词,且说法灵活,不需要依照固定的词条顺序。用
    的头像 发表于 01-03 16:01 844次阅读
    启英泰伦新推出多意图<b class='flag-5'>自然</b>说,重塑离线人机交互新标准!