近日,阿里AI在常识QA领域的权威数据集CommonsenseQA上刷新世界纪录,超过微软取得第一名。这一技术是“95后”实习生叶志秀在达摩院科学家指导下完成的实习成果,显著提升了AI的常识推理能力。
CommonsenseQA是为了研究基于常识知识的问答而提出的数据集,比此前的SWAG、SQuAD数据集难度更高。目前最流行的语言模型BERT在SWAG、SQuAD上的性能已经接近或超过人类,但在CommonsenseQA上的准确率还远低于人类。
常识推理是难度最高的自然语言理解(NLP,Natural Language Processing)任务之一。在机器翻译、阅读理解等NLP任务上,AI的表现已经接近或超过人类水平。阿里AI先后在国际顶级的机器翻译赛事WMT、机器阅读理解赛事SQuAD、文本阅读理解挑战赛MS MARCO等赛事夺冠甚至赶超人类纪录。相比之下,AI的常识推理能力比人类差得多。
为此,阿里巴巴达摩院语音实验室提出一种AMS方法,显著提升BERT模型的常识推理能力。AMS方法使用与BERT相同的模型,仅预训练BERT,在不提升模型计算量的情况下,将 CommonsenseQA数据集上的准确率提升了5.5%,达到62.2%。
阿里AI技术的突破将大幅提升下一代人机交互产品的常识理解能力,可应用于语音导航、智能电视、语音售票机等产品。
-
微软
+关注
关注
4文章
6753浏览量
108085 -
阿里巴巴
+关注
关注
7文章
1649浏览量
49332
原文标题:阿里AI刷新CommonsenseQA数据集纪录
文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
国产光纤刷新世界记录:2.5Pb/s 24芯,AI大模型训练告别传输瓶颈
50分26秒破人类纪录!深度解析荣耀“闪电”夺冠背后的散热黑科技
10米/秒,刷新世界纪录!宇树科技H1速度逼近人类百米巅峰速度
中科曙光万卡超集群刷新414.7亿原子DFT精度模拟纪录
应用案例 | 高光谱相机助力"人造太阳"刷新人类可控核聚变纪录
天合光能以极限科技创新持续突破光伏效率边界
天合光能再次刷新大面积钙钛矿晶体硅叠层组件功率世界纪录
马斯克点赞晶科能源最新电池转换效率世界纪录
天合光能钙钛矿/晶体硅叠层电池效率及叠层组件功率双双刷新世界纪录
晶科能源第31次打破电池效率和组件功率世界纪录
165Hz 超高刷东方屏打破 9 项世界纪录,一加携手京东方开启中国屏幕的刷新时刻
超越微软!阿里AI在常识QA领域刷新世界纪录
评论