0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌重磅发布自然问题数据集

电子工程师 来源:cc 2019-01-28 15:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

谷歌重磅发布自然问题数据集(Natural Questions),包含30万个自然发生的问题和人工注释的答案,16000个示例,并发起基于此数据集的问答系统挑战赛。有望成为自然语言理解领域的SQuAD!

开放领域问题回答(QA)是自然语言理解(NLU)中的一项基准任务,它的目的是模拟人类如何查找信息,通过阅读和理解整个文档来找到问题的答案。

比如,给定一个用自然语言表达的问题“为什么天空是蓝色的?”("Why is the sky blue?”),QA系统应该能够阅读网页(例如“天空漫射”的维基百科页面)并返回正确的答案,即使答案有些复杂和冗长。

然而,目前还没有可以用于训练和评估QA模型的大型、公开的自然发生问题(即由寻求信息的人提出的问题)和答案数据集。

这是因为构建用于QA任务的高质量数据集需要大量的真实问题来源,并且需要大量人力来为这些问题寻找正确答案。

为了促进QA领域的研究进展,谷歌今天发布自然问题数据集(Natural Questions, NQ),这是一个用于训练和评估开放领域问答系统的新的、大规模语料库,也是第一个复制人类查找问题答案的端到端流程的语料库。

Natural Questions数据集

NQ的规模非常庞大,包含30万个自然发生的问题,以及来自Wikipedia页面的人工注释答案,用于训练QA系统。

此外,NQ语料库还包含16000个示例,每个示例都由5位不同的注释人提供答案(针对相同的问题),这对于***的QA系统的性能非常有用。

Natural Questions数据集中的示例

由于回答NQ中的问题比回答琐碎问题(这些问题对计算机来说已经很容易解决)需要有更深入的理解,谷歌还发起了一项基于此数据集的挑战赛,以帮助提高计算机对自然语言的理解。

NQ挑战赛排行榜

NQ数据集包含307K训练示例、8K开发示例和8K测试示例。

目前,NQ挑战赛排行榜上只有谷歌的BERT模型和DecAtt-DocReader模型的成绩。在论文中,谷歌证明在长答案选择任务上的人类的最优成绩为87% F1,在短答案选择任务上人类的最优成绩为76%。

来自谷歌搜索的真实问题

NQ是第一个使用自然发生的查询创建的数据集,并专注于通过阅读整个页面来查找答案,而不是从一个短段落中提取答案。

为了创建NQ,我们从用户提交给Google搜索引擎的真实、匿名、聚合的查询开始。

然后,我们要求注释者通过通读整个维基百科页面来找到答案,就好像这个问题是他们自己提出的一样。注释者需要找到一个长答案和一个短答案,长答案涵盖推断问题所需的所有信息,短答案需要用一个或多个实体的名称简洁地回答问题。

对NQ语料库的注释质量进行评估,显示准确率达到90%。

注释包含一个长答案和一个短答案

研究人员在论文《自然问题:问答研究的基准》(Natural Questions: a Benchmark for Question Answering Research)中对数据收集的过程进行了全面描述,论文已发表在《计算语言学协会会刊》(Transactions of the Association for computing Linguistics)。大家也可以在NQ网站上查看更多来自数据集的示例。

自然语言理解挑战

NQ的目的是使QA系统能够阅读和理解完整的维基百科文章,其中可能包含问题的答案,也可能不包含问题的答案。

系统首先需要确定这个问题的定义是否足够充分,是否可以回答——许多问题本身基于错误的假设,或者过于模糊,无法简明扼要地回答。

然后,系统需要确定维基百科页面中是否包含推断答案所需的所有信息。我们认为,相比在知道长答案后在寻找短答案,长答案识别任务——找到推断答案所需的所有信息——需要更深层次的语言理解。

我们希望NQ的发布以及相关的挑战赛将有助于推动更有效、更强大的QA系统的开发。我们鼓励NLU社区参与进来,并帮助缩小目前最先进方法的性能与人类上限之间的巨大差距。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6273

    浏览量

    112314
  • 人工智能
    +关注

    关注

    1822

    文章

    50611

    浏览量

    268183

原文标题:NLP新基准!谷歌重磅发布开放问答数据集,30万自然提问+人工注释答案

文章出处:【微信号:aicapital,微信公众号:全球人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    广立微全新一代DATAEXP平台及AI产品重磅发布

    广立微DE User Forum暨新品发布会成功举办。数百位半导体行业领袖、技术专家与生态用户齐聚,共同见证全新一代DATAEXP良率数据管理分析平台及SemiClaw、MuseLab等重磅AI产品正式
    的头像 发表于 05-27 16:56 533次阅读
    广立微全新一代DATAEXP平台及AI产品<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>

    谷歌发布Gemini for Science

    2026年5月20日,谷歌I/O开发者大会上,谷歌正式推出Gemini for Science——一款专门面向科研场景的AI模型。这不是又一个能帮你查文献的聊天机器人,而是谷歌试图让AI真正参与科学发现本身的一次系统性尝试。
    的头像 发表于 05-21 10:42 1290次阅读

    谷歌正式发布Gemini Spark

    5月20日,谷歌在I/O 2026上正式发布了Gemini Spark——一款全天候运行的个人AI助手。它基于Gemini 3.5打造,运行在Google Cloud虚拟机上,用户通过Gemini
    的头像 发表于 05-21 10:39 592次阅读

    谷歌推出Gemini 3.5系列模型

    2026年5月20日凌晨,谷歌I/O 2026开发者大会正式拉开帷幕。谷歌首席执行官桑达尔·皮查伊在舞台上抛出了一枚重磅炸弹—— **Gemini 3.5 Flash** ,谷歌迄今为
    的头像 发表于 05-21 10:19 644次阅读

    谷歌发布安卓17+Gemini Intelligence

    近日,谷歌正式公布了安卓17(Android 17)的详细特性,同时抛出了一颗重磅炸弹—— **Gemini Intelligence** ,谷歌将自家最强AI能力全面植入安卓系统,推动安卓从
    的头像 发表于 05-13 11:26 1734次阅读

    芯赛场,云力量!小眼睛科技远程AI实验平台重磅发布助力2026创赛!

    新岁策马向繁花FPGA远程AI实验平台重磅发布赋能未来创芯者,小眼睛科技FPGA远程AI实验平台助力2026创赛!2026,小眼睛科技重磅推出全新FPGA远程AI实验平台!该平台将作
    的头像 发表于 03-05 13:01 2742次阅读
    芯赛场,云力量!小眼睛科技远程AI实验平台<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>助力2026<b class='flag-5'>集</b>创赛!

    智多晶重磅发布HQPEP功耗评估工具

    FPGA功耗受工艺、电压、温度、资源占用等多重因素影响,传统评估依赖后期板级实测,易引发电源重构、散热返工等风险。为此,智多晶重磅发布HQPEP(HqFpga Power Estimation Platform)功耗评估工具,聚焦FPGA设计早期的功耗评估需求,为工程师打
    的头像 发表于 01-23 16:01 3134次阅读
    智多晶<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>HQPEP功耗评估工具

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    重磅更新 | 先楫半导体HPM_APPS v1.10.1发布

    重磅更新 | 先楫半导体HPM_APPS v1.10.1发布
    的头像 发表于 12-26 08:33 1555次阅读
    <b class='flag-5'>重磅</b>更新 | 先楫半导体HPM_APPS v1.10.1<b class='flag-5'>发布</b>

    伟创力重磅发布全球首款面向千兆瓦级数据中心的AI基础设施平台

    伟创力重磅发布全球首款面向千兆瓦级数据中心的AI基础设施平台,平台集成了电源和冷却产品、计算能力和服务,专为AI和高性能计算而设计,帮助数据中心运营商将部署速度提升高达30%,大幅降低
    的头像 发表于 10-23 15:08 1076次阅读

    汇川技术17款新品重磅发布

    今天,汇川技术 2025 年度爆品发布会以 “数自融合 软件定义自动化” 为主题,面向全球重磅发布
    的头像 发表于 09-02 15:58 4417次阅读

    AI Cube如何导入数据

    我从在线平台标注完并且下载了数据,也按照ai cube的要求修改了文件夹名称,但是导入提示 不知道是什么原因,我该怎么办? 以下是我修改后的文件夹目录
    发表于 08-11 08:12

    云训练平台数据过大无法下载数据至本地怎么解决?

    起因是现在平台限制了图片数量,想要本地训练下载数据时发现只会跳出网络异常的错误,请问这有什么解决办法?
    发表于 07-22 06:03

    使用AICube导入数据点创建后提示数据不合法怎么处理?

    重现步骤 data目录下 labels.txt只有英文 **错误日志** 但是使用示例的数据可以完成训练并部署
    发表于 06-24 06:07

    数据下载失败的原因?

    数据下载失败什么原因太大了吗,小的可以下载,想把大的下载去本地训练报错网络错误 大的数据多大?数据量有多少?
    发表于 06-18 07:04