0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

讯飞人工智能研究院联合团队再次在SQuAD 2.0挑战赛中有了新突破

电子工程师 来源:lp 2019-03-29 15:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

由斯坦福大学发起的国际权威机器阅读理解评测SQuAD(Stanford Question Answering Dataset),相信很多小伙伴已经并不陌生,从1.0、1.1再到2.0,比赛难度持续升级。在谷歌、微软亚洲研究院、IBM研究院、阿里巴巴达摩院、平安科技、上海交通大学、复旦大学等众多参赛的国内外知名研究机构和高校中,科大讯飞从2017年成为首次取得赛事榜首的中国本土研究机构起,已四次刷新比赛榜单第一。

就在最近,哈工大讯飞联合实验室(HFL)与河北省讯飞人工智能研究院联合团队再次在SQuAD 2.0挑战赛中有了新突破:不仅再再再再再次登上榜单第一,还全球首次在全部两项指标上都超过了人类平均水平,一举创下比赛的全新纪录。

科大讯飞在机器阅读理解领域的实力已不言而喻,这次突破背后又有怎样的故事,“秘籍”何在?当机器学会做阅读理解,甚至比人类的答题水平还胜出一筹时,TA们能为我们带来怎样的改变和影响?

SQuAD 2.0好难一比赛!

要会答题,还要会拒绝答题

虽然之前已对SQuAD比赛有过几次介绍,还是让我们先复习一下这项比赛的关键信息:

TA是认知智能行业内公认的机器阅读理解领域顶级水平测试,通过吸收来自维基百科的大量数据,构建了一个包含十多万问题的大规模机器阅读理解数据集。

参赛者提交的系统模型在阅读完数据集中的一个篇章内容之后,回答若干个基于文章内容的问题,然后与人工标注的答案进行比对,得出精确匹配(Exact Match)和模糊匹配(F1-score)的结果。

精确匹配EM:机器给出的答案和人给出的一样才算正确;模糊匹配F1:机器答案短语切成词后与人给出的答案共同计算回归率与准确性,就算没有完全匹配也可以得分。

对于机器而言,存储、运算,甚至图像、语音的识别都已不在话下,但是想要读懂文章内容并做出回答,没有人类思维大脑的机器还是非常困难的。

SQuAD 2.0的比赛则在上面任务的基础上,把难度再次提升:加入“不可回答的问题”。也就是说,参赛系统阅读完篇章内容后再读题,如果这个问题不能通过之前读完的内容回答,要拒绝回答;如果判断可以回答,那么再给出篇章中的某个连续片段作为答案。

双指标超过人类水平!

讯飞答题有妙招

如此高难度的阅读理解比赛,如果让人类来答题,水平几何呢?

人类的成绩是:EM:86.831;F1:89.452

讯飞此次参赛系统的成绩是:EM:87.147;F1:89.474

虽然差距不算太大,但已是全球首次在这两项指标上都超过人类水平了!就在去年11月,哈工大讯飞联合实验室刷新SQuAD 2.0比赛榜单时的成绩,还与人类认知水平在该数据集上的效果有一定差距。短短不到半年的时间,科大讯飞已经取得了弥足珍贵的进步。

首次超越人类水平的背后,得益于提交的“BERT + DAE + AoA”参赛模型,模型融合了业界领先自然语言语义表示模型BERT和团队持续积累改进的层叠式注意力机制(Attention-over-Attention,AoA),在吸收业界最新前沿技术的同时又加入了已有的原创核心技术,将该评测的相关技术指标推向新的高度。

哈工大讯飞联合实验室参赛提交系统一览

超越人类不是目的

汽车、司法都已助力

也许你会疑惑,机器在阅读理解上的水平获得这样的突破与成绩,难道是为了超越人类、成为做题机器?

核心技术评测中的积累,最终是为了将技术更好应用到实际产品中,让人们亲身体会到技术带来的改变。阅读理解技术其实已经在汽车、司法领域有所应用,例如一些车型中的车载电子说明书产品,通过机器阅读汽车领域相关的材料,使机器深度理解并掌握对该车型的相关知识。用户提出相关问题之后,产品不仅可以快速反馈相关的章节,还能利用阅读理解技术进一步挖掘并反馈更精准的答案;这样就能够减少用户的阅读量,提高信息获取的速度。

在司法领域,哈工大讯飞联合实验室出品的“法小飞”智能法律咨询助手也应用了对话型阅读理解技术,带来优质快速的法律咨询和相关服务,为用户提供精准的答案,还提升了用户的对话交互体验。

技术探索的脚步还在涉足更广的领域,目前科大讯飞还在积极探索其他类型的阅读理解,例如基于知识、常识的阅读理解,对话型阅读理解以及基于综合线索的阅读理解等。

在比赛指标上超越人类水平并不是结束,对于机器阅读理解的“能理解会思考”的终极目标来说,也许这仍是一个全新的开始。对自然语言的更深层次的归纳、总结、推理,一定是未来机器阅读理解不可缺少的部分;落地应用,机器阅读理解技术在产品的精准问答、开放域的问答都能起到有力的支撑作用,未来还会有怎样的产品让我们收获更多惊喜,科大讯飞将全力以赴给出答案。

哈工大讯飞联合实验室

哈工大讯飞联合实验室(HFL)是科大讯飞针对“讯飞超脑”项目计划,重点引进和布局的核心研发团队之一,由科大讯飞AI研究院与哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)共同创办。根据联合实验室建设规划,双方将在语言认知计算领域进行长期、深入合作,具体开展阅读理解、自动阅卷、类人答题、人机对话、语音识别后处理、社会舆情计算等前瞻课题的研究。重点突破深层语义理解、逻辑推理决策、自主学习进化等认知智能关键技术,支撑科大讯飞实现从“能听会说”到“能理解会思考”的技术跨越,并围绕教育、司法、人机交互等领域实现科研成果的规模化应用。

哈工大讯飞联合实验室不仅在核心技术上持续深耕,同时也积极关注和推动中文信息处理的研究发展。在2017年和2018年,哈工大讯飞联合实验室先后承办了两届“讯飞杯”中文机器阅读理解评测(CMRC)受到了业界广泛关注和各界研究人员的积极参加,并且发布了相关中文数据集,进一步促进了中文机器阅读理解研究。今年将继续携手中国中文信息学会计算语言学专业委员会(CIPS-CL)承办相关中文机器阅读理解评测活动,持续推动中文机器阅读理解技术的研究发展。

所获荣誉:

1. 多次荣登国际权威机器阅读理解评测SQuAD 1.1榜首

2. 多次荣登国际权威机器阅读理解评测SQuAD 2.0榜首

3. 2018年2月,荣获国际语义评测SemEval 2018阅读理解任务冠军

4. 2018年12月,荣获对话型阅读理解评测CoQA冠军

河北省讯飞人工智能研究院

科大讯飞河北省讯飞人工智能研究院,成立于2019年1月,是科大讯飞推动人工智能战略落地,助力京津冀区域人工智能规模化应用和产业发展重要核心研发团队之一。研究院重点聚焦人工智能中认知智能技术,实现认知基础前沿技术、教育认知技术、司法认知技术等技术在政务、各公共服务等领域的应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50525

    浏览量

    267794
  • 数据集
    +关注

    关注

    4

    文章

    1242

    浏览量

    26303
  • 科大讯飞
    +关注

    关注

    19

    文章

    869

    浏览量

    64050

原文标题:全球首次!科大讯飞SQuAD 2.0比赛全部指标超越人类平均水平

文章出处:【微信号:iFLYTEK1999,微信公众号:科大讯飞】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    SGS与科大飞达成实验室战略合作 共筑人工智能产业质量新标杆

    近日,科大飞人工智能终端测试中心科大飞人工智能产业基地正式揭牌。揭牌仪式现场,国际公认的测试、检验与认证机构SGS与科大
    的头像 发表于 05-25 17:18 504次阅读

    合肥综合性国家科学中心人工智能研究院与大华股份达成战略合作

    近日,合肥综合性国家科学中心人工智能研究院(以下简称“人工智能研究院”)与大华股份“IAI-Dahua视频物联智能
    的头像 发表于 05-21 16:37 114次阅读

    华工科技联合共建光谷智能传感技术创新研究院

    4月12日,光谷智能传感产业创新峰会举行,200余位行业内产学研用机构代表的见证下,光谷智能传感技术创新研究院揭牌成立,力争到2030年推动传感器产业规模
    的头像 发表于 04-14 15:13 472次阅读

    思必驰斩获Interspeech 2026音频推理挑战赛智能体赛道亚军

    近日,国际语音与语言处理领域顶级赛事Interspeech 2026音频推理挑战赛结果正式揭晓。在这场首次将评估焦点从“答案正确性”转向“推理过程质量”的变革性赛事中,思必驰-上海交通大学联合实验室团队凭借创新的多
    的头像 发表于 02-28 14:13 927次阅读

    汇诚仪器与中科微电子苏州研究院合作,热重分析仪助力科研创新

    双方资源互补的体现,也是汇诚仪器深耕科研领域的重要突破。中科微电子苏州研究院聚焦高端集成电路芯片、微系统开发,深耕科研成果转化与关键技术攻关,5G通讯、人工智能
    的头像 发表于 02-05 16:20 1202次阅读
    汇诚仪器与中科微电子苏州<b class='flag-5'>研究院</b>合作,热重分析仪助力科研创新

    广电计量与长沙三大研究院达成战略合作

    研究院相继举行战略合作签约仪式。广电计量党委副书记、总经理明志茂率技术团队赴各单位深入交流,深化战略合作。
    的头像 发表于 12-04 14:36 748次阅读

    简仪科技携手国科大杭州高等研究院成功举办人工智能专题讲座

    11月22日下午,简仪科技国科大杭州高等研究院成功举办了"AI+AI:人工智能辅助数据采集编程"专题讲座。本次活动由简仪科技副总经理邵晖博士主讲,市场和院校生态经理吴珂玶共同参与,为高校学子带来了一场AI赋能测试测量的技术分享
    的头像 发表于 11-27 10:09 756次阅读
    简仪科技携手国科大杭州高等<b class='flag-5'>研究院</b>成功举办<b class='flag-5'>人工智能</b>专题讲座

    思必驰受邀出席2025人工智能+大会

    》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院研究院人工智能研究中心、
    的头像 发表于 11-20 10:26 623次阅读

    广电计量携手南山研究院打造大健康产业新生态

    10月19日, “南山研究院南海四周年系列活动”广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单
    的头像 发表于 10-23 17:42 1384次阅读

    挖到宝人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    2025人工智能十大趋势

    2025世界人工智能大会·腾讯论坛上,腾讯研究院联合腾讯优图实验室、腾讯云智能、腾讯科技联合
    的头像 发表于 08-05 11:42 6180次阅读
    2025<b class='flag-5'>人工智能</b>十大趋势

    燧原科技亮相2025世界人工智能大会

    7月27日上午,2025世界人工智能大会期间,燧原科技联合中国电子信息产业发展研究院人工智能产业工作委员会、上海市集成电路行业协会、上海
    的头像 发表于 08-01 16:14 1602次阅读

    勇艺达人工智能研究院迎大咖加盟

    近日,深圳勇艺达总部隆重举行 “数智融合 聚贤赋能 —— 勇艺达人工智能研究院高端人才聘任仪式”,正式聘请黄道权先生与吴天准先生加盟,为研究院注入顶尖智慧力量,此举标志着勇艺达
    的头像 发表于 07-10 18:04 1143次阅读

    传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军,推动视频画质升级

    近日,计算机视觉领域最具影响力的国际竞赛CVPRNTIRE2025中,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获高效超分辨率
    的头像 发表于 06-24 17:03 1103次阅读
    传音多媒体<b class='flag-5'>团队</b>揽获CVPR NTIRE 2025两项<b class='flag-5'>挑战赛</b>冠亚军,推动视频画质升级

    传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军

    近日,计算机视觉领域最具影响力的国际竞赛 CVPR NTIRE 2025中,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获 高效超分辨率
    的头像 发表于 06-24 16:08 1867次阅读
    传音多媒体<b class='flag-5'>团队</b>揽获CVPR NTIRE 2025两项<b class='flag-5'>挑战赛</b>冠亚军