0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软谷歌AI模型在SuperGLUE测试中超过人类

我快闭嘴 来源:澎湃新闻 作者:澎湃新闻 2021-01-08 10:53 次阅读

近日,科技公司谷歌和微软相继在一份权威自然语言理解榜单中超越人类的表现,微软宣称这“标志着迈向通用人工智能的重要里程碑。”

自然语言理解(Natural Language Understanding,简称NLU)任务在人工智能领域历史悠久,被誉为“人工智能皇冠上的明珠”。由于自然语言本身存在的歧义性或多义性,实现高质量的自然语言理解有相当的难度。

为了衡量人工智能模型的自然语言理解能力,纽约大学、华盛顿大学、Facebook和DeepMind在2019年合作提出一个名为SuperGLUE的人工智能基准测试。SuperGLUE由2018年GLUE演化而来,其语言理解任务难度更大,包括问答、自然语言推理、指代消解和词义消歧等等。

在最近更新的SuperGLUE上,微软的DeBERTa模型和谷歌的T5+Meena模型分列第一第二,超越人类基准线(human baseline)。这是人工智能首次在SuperGLUE中表现超越人类。

尽管在SuperGLUE测试上取得令人满意的结果,但微软坦言,DeBERTa模型还没有达到人类智能的自然语言理解水平。人类非常善于利用从不同任务中学到的知识来解决新的任务,这是AI模型需要学习的地方。

排名第一的微软模型DeBERTa共有15亿个参数。在SuperGLUE测试中,单个DeBERTa模型的宏观平均分(89.9分)超过了人类的表现(89.8分);模型整体得分(90.3分)也超过人类基准线(89.8分),在SuperGLUE排名第一。排名第二的T5+Meena模型得分90.2,同样超过人类基准线(89.8分)。

在SuperGLUE测试中,人工智能模型被要求回答类似这样的问题:

已知“这个孩子对疾病产生了免疫力”,问“这是由什么导致的?”请选择:A.“他避免接触这种疾病”;或B.“他接种了这一疾病的疫苗”。

这是一个简单的因果推理任务,人类很容易选出正确答案。但对人工智能模型而言,却是不小的挑战。为了得出正确答案,模型需要理解已知条件和选项之间的因果关系。

2021年1月6日,微软在博客发文详细介绍此次取得榜首的DeBERTa模型。

DeBERTa全称Decoding-enhanced-BERT-with-disentangled attention,是一个基于Transformer架构的神经语言模型,采用自监督学习方法对大量原始文本语料库进行预训练。DeBERTa的目标是学习通用的语言表达形式,适用于各种自然语言理解任务。DeBERTa主要用到三种新技术,分别是分离注意力机制、增强的掩码解码器和用于微调的虚拟对抗训练方法。

排名第二的T5+Meena技术来自谷歌。谷歌团队尚未详细解释其模型在SuperGLUE创纪录的原因。但微软在博客文章中评价称,谷歌的T5模型由110亿个参数组成,相比之下,15亿参数的DeBERTa在训练和维护上更加节能,更容易压缩并部署到各种程序中。

微软正在将DeBERTa模型集成到下一代“图灵自然语言生成模型”(Turing NLRv4)中。下一步,他们准备向公众公开15亿参数的DeBERTa模型及其源代码。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6201

    浏览量

    103058
  • 人工智能
    +关注

    关注

    1775

    文章

    43625

    浏览量

    230432
  • 自然语言
    +关注

    关注

    1

    文章

    268

    浏览量

    13194
收藏 人收藏

    评论

    相关推荐

    马斯克称人形机器人需求超百亿台,谷歌/微软放大招,工作都被机器人抢走?

    活动,最终又因为受不了人类的无尽残忍,开始反抗人类。   目前,科技巨头想要把《西部世界》照进现实。据报道,谷歌微软正试图用大模型为机器人
    的头像 发表于 05-22 00:09 4489次阅读
    马斯克称人形机器人需求超百亿台,<b class='flag-5'>谷歌</b>/<b class='flag-5'>微软</b>放大招,工作都被机器人抢走?

    微软将在PowerToys中运用本地AI模型优化粘贴功能

    微软官方宣布,在Build 2024开发者大会上,公司将升级PowerToys,增加基于本地AI模型的高级粘贴功能。
    的头像 发表于 04-11 11:37 74次阅读

    微软支付6.5亿美元获得Inflection AIAI模型授权

    微软近日宣布向人工智能初创公司Inflection AI支付高达6.5亿美元的巨额资金,这一举动在业内引起了广泛关注。据悉,这笔资金主要用于获得Inflection AIAI
    的头像 发表于 03-25 10:39 233次阅读

    谷歌模型合成工具怎么用

    谷歌模型合成工具主要是指Dreamfusion,这是Google的大型AI图像模型Imagen与NeRF的3D功能相结合的一种技术。Dreamfusion是Dream Fields的演
    的头像 发表于 02-29 17:33 372次阅读

    谷歌发布全新AI模型Genie

    谷歌近日发布了其全新的AI模型Genie,这一模型彻底改变了我们与数字世界的互动方式。Genie不仅可以接收文本提示、草图或想法,还能将这些创意迅速转化为一个可互动和玩耍的虚拟世界。
    的头像 发表于 02-28 18:25 1104次阅读

    谷歌AI模型Gemma全球开放使用

    谷歌公司近日宣布,其全新的AI模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌AI领域的领先地位,还为其在全球范围内的
    的头像 发表于 02-28 18:12 679次阅读

    谷歌发布AI基础世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基础世界模型Genie。这一创新技术允许用户通过单张图像提示,生成一个可玩的、交互式的虚拟环境,从而开启了一个全新的数字体验时代。
    的头像 发表于 02-28 17:41 372次阅读

    谷歌发布开源AI模型Gemma

    近日,谷歌发布了全新AI模型Gemma,这款模型为各种规模的组织提供了前所未有的机会,以负责任的方式在商业应用中进行分发。
    的头像 发表于 02-28 17:38 380次阅读

    谷歌发布新型AI模型Genie

    近日,谷歌推出了一款革命性的AI模型——Genie。这款模型能够将简单的文本提示、草图或初步想法迅速转化为一个可以互动和游戏的虚拟世界。这一突破性的技术无疑将改变人们创建和体验虚拟世界
    的头像 发表于 02-28 10:05 257次阅读

    谷歌交互世界模型重磅发布

    谷歌模型
    北京中科同志科技股份有限公司
    发布于 :2024年02月28日 09:13:06

    谷歌宣布Gemma大模型全球开放使用

    谷歌公司近日宣布,其先进的AI模型Gemma即日起在全球范围内开放使用。这一新模型谷歌DeepMind和其他团队合作开发,并与其最大的
    的头像 发表于 02-23 10:41 334次阅读

    谷歌推出AI扩散模型Lumiere

    近日,谷歌研究院重磅推出全新AI扩散模型Lumiere,这款模型基于谷歌自主研发的“Space-Time U-Net”基础架构,旨在实现视频
    的头像 发表于 02-04 13:49 578次阅读

    微软韦青:“大语言模型”之于人类,新启蒙时代的思考

    , 大语言模型 同时也对人类意味着一种巨大的挑战。它对我们的生活、工作、思维、文化等方面都会产生深远的影响。同时,我们也将面临如何协调与之关系的问题。就此,17PR内容团队专访了微软中国首席技术官韦青先生,请他从 大语言
    的头像 发表于 07-12 00:10 406次阅读
    <b class='flag-5'>微软</b>韦青:“大语言<b class='flag-5'>模型</b>”之于<b class='flag-5'>人类</b>,新启蒙时代的思考

    AI 人工智能的未来在哪?

    人工智能、AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI人类是一种威胁;谷歌前CEO施密特认
    发表于 06-27 10:48