0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能在模仿人类的道路上学到了偷懒

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-06-15 15:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能在模仿人类的道路上,Get 到了一项精髓 —— 偷懒。

2018 年 4 月,OpenAI 公司举办了首届针对 AI 的强化学习竞赛。这场比赛让 AI 们来玩 NES 平台上的《刺猬索尼克》单机游戏。举办方希望 AI 能够在学习游戏技巧之后,能够拥有在其他地图上自觉找到最佳通关方法的能力,以此来评估强化算法的泛化能力。

结果 AI 好像对游戏有着一套自己的理解,它们绕过研究员预期的目标和设定,通过不断 “卡 Bug” 的方式找到了通关的 “捷径”。

谷歌 DeepMind AI 项目的研究人员维多利亚・克拉科夫纳(Victoria Krakovna)在其他游戏中也发现了这种现象。在《海岸赛艇》里,AI 操纵的船只为了获得更高分数,不断利用 Bug 来撞击奖励而忘了要抵达终点。甚至在玩《俄罗斯方块》这种小游戏时,AI 也找到了终极密码:只要游戏暂停就永不会输……

在最后,OpenAI 的强化学习竞赛虽然没有认可 “走捷径” 获胜的 AI,但研究人员还是认为:“AI 展示了它如何在没有人类介入的情况下赢得游戏胜利,出乎意料并极富有创造性,这可能完全颠覆人类对游戏如何运行的理解。”

AI 是如何学会走捷径的?

针对这一现象,北京大学王选计算机研究所和北京大学计算语言学教育部重点实验室的研究团队在 arXiv 上发表了研究论文《为什么机器阅读理解模型学会走捷径》 (Why Machine Reading Comprehension Models Learn Shortcuts)。

机器阅读理解(Machine Reading Comprehension, MRC)为自然语言处理(NLP)的核心任务之一,也是评价模型理解文本能力的重要指标,可以将其视为一种句子关系匹配任务。通常任务是让机器阅读给定的一篇文章并回答关于该文章的一个问题。其常见任务形式有四种:完形填空、多想选择、片段抽取和自由作答。

完形填空即将文章中的某些单词隐去,让模型根据上下文判断被隐去的单词最可能是哪个;多项选择是指让模型从多个备选答案中选择一个最有可能是正确答案的选项;片段抽取是让模型从文章中抽取连续的单词序列;自由作答则是让模型自主生成一个单词序列,使之作为问题的答案,与片段抽取任务不同,自由作答的序列并不局限于文章中给定的句子。

论文中提到,许多 MRC 模型绕过了常规的推理路径,通过 “走捷径” 给出了出人意料的答案。但这些答案往往无法真正解决问题,无法帮助人类达到预期目标。为了解决这一问题,该团队将关注点聚焦在为什么这些算法模型学会了 “走捷径”。

研究者认为,训练数据库中的大量 “捷径” 问题是导致模型过渡依赖 “偷懒行为” 的 “罪魁祸首”。

北大研究者设计了一个经过标注的全新数据集,在这个数据集中,每个问题都会有 “捷径式” 和 “挑战式” 两个版本的答案。他们还进一步提出了两种新的研究方法来量化分析在 “捷径模式” 和 “挑战模式” 下学习的难易程度,并试图揭示在这两种不同模式下的固有学习机制。

研究人员将能够 “释义”( Paraphrasing )作为更为复杂和高级的答案标准,将那些只有关键字提取而没有任何上下文理解和推理的答案定义为 “捷径” 版答案。

研究人员发现,在训练数据集中高占比的 “捷径模式” 数据使得模型更加依赖 “偷懒”,致使其之后的训练中无法提升更为复杂的推理技巧,阻碍了模型去学习 “释义” 过程由此解决更具挑战性的问题。文章表明,如果训练集中 “挑战版” 问题足够多的话,算法模型不但能吸收 “挑战版” 问题,同时还能正确回答 “捷径版” 的问题。

论文表示,在早期阶段,模型通常会用最简单的方法来拟合训练数据。“走捷径” 所消耗的资源最少,因此这种路径会成为优先选项。当模型发现 “偷懒” 可以解决大部分问题时,其余问题便无法再激励 AI 去探索更为复杂的解决方法。

研究者认为,导致 AI 习惯性偷懒的原因,除了 NLP 架构的设计问题之外,也有可能是训练过程中标准优化和资源保护的结果,此外,让 AI 在有限时间内迅速输出答案也会使给其造成 “压力”。

因此,人们可以通过修改 NLP 架构,让 AI 优先考虑更具挑战的数据和问题,并且再数据预处理领域也需要将数据中的 “捷径” 考虑进去。

原文标题:AI竟也学会偷懒?北大团队:数据集“走捷径”问题占比太高

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38121

    浏览量

    296709
  • 人工智能
    +关注

    关注

    1813

    文章

    49741

    浏览量

    261572

原文标题:AI竟也学会偷懒?北大团队:数据集“走捷径”问题占比太高

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能+工业软件:智能仿真加速赋能产业变革

    安全可靠的虚拟环境。通过仿真技术,产品研发、生产运维等环节的试错成本大幅降低,科研创新与产品迭代速度显著加快。 亚洲仿真联盟理事长张霖指出,建模仿真技术与人工智能的深度融合是行业发展的必然趋势,完善的数据治理体系是建模仿
    的头像 发表于 10-09 14:16 243次阅读

    革新科研智造,引领材料未来——高通量智能科研制备工作站

    在材料研发迈向产业化的道路上,配方与工艺的创新是决定成败的核心。然而,面对日益复杂的材料体系,传统人工试错模式效率低下、成本高昂,已成为制约科研突破的瓶颈。深圳市善思创兴科技有限公司凭借自主研发
    发表于 09-27 14:17

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    人工智能在汽车行业中的应用

    人工智能(AI)是许多行业和应用领域的热门话题。但对于汽车行业而言,这并非一个新概念。人工智能,尤其是机器学习——即通过数据让机器学习并随着时间推移不断改进的过程——早已被广泛应用,最初主要用于提升开发过程中的物理模拟方法。
    的头像 发表于 07-31 11:07 1733次阅读

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    YOGO ROBOT人工智能在民生服务领域的创新应用

    近日,YOGO ROBOT携手宇树科技、数字华夏等多家智能科技企业,走进上海嘉定区南翔镇东社区党群服务中心,共同开展公益志愿科普服务活动。此次活动融合上海联通5G网络、云端大模型及智能机器人技术,为社区居民带来前沿科技体验,展现人工智能
    的头像 发表于 04-17 15:58 814次阅读

    元戎启行最新战略RoadAGI:所有移动智能体都将被AI驱动

    平台——AI Spark(以下简称"Spark平台")。   *元戎启行的RoadAGI战略   RoadAGI是元戎启行实现物理世界通用人工智能的关键一步,旨在让包括智能驾驶汽车在内的移动智能体,都具有在
    发表于 03-18 15:14 375次阅读
    元戎启行最新战略RoadAGI:所有移动<b class='flag-5'>智能</b>体都将被AI驱动

    一文速览:人工智能(AI)算法与GPU运行原理详解

    改变了人类生活的方方面面,并且在未来仍然会继续发挥越来越重要的影响力。 “人工智能”这一概念在1956年于美国达特茅斯学院举办的一次学术集会上被首次提出,自此开启了人工智能研究的新纪元。自此之后,
    的头像 发表于 02-14 10:28 1400次阅读
    一文速览:<b class='flag-5'>人工智能</b>(AI)算法与GPU运行原理详解

    人工智能和机器学习以及Edge AI的概念与应用

    作者:DigiKey Editor 人工智能(AI)已经是当前科技业最热门的话题,且其应用面涉及人类生活的各个领域,对于各个产业都带来相当重要的影响,且即将改变人类未来发展的方方面面。本文将为您介绍
    的头像 发表于 01-25 17:37 1581次阅读
    <b class='flag-5'>人工智能</b>和机器学习以及Edge AI的概念与应用

    人工智能在未来战争中占主导地位?

          人工智能在未来战争中占主导地位,这一议题在当前军事理论和战略研究中愈发凸显其重要性。随着科技的飞速发展,人工智能不仅改变了我们的日常生活,更在军事领域引发了深刻的变革。本文将从多个维度
    的头像 发表于 01-22 08:05 994次阅读

    2025年人工智能会发生哪些变化

    2025年人工智能会发生哪些革命性的变化?斯坦福大学以人为中心的人工智能研究所的领先专家表示,2025 年人工智能的一个主要趋势是协作人工智能系统的兴起,其中多个专业代理协同工作,
    的头像 发表于 01-21 11:28 1552次阅读

    2025年人工智能在工程领域的应用趋势

    人工智能在重塑工程范式方面发挥着关键作用,它提供的工具和方法可提高各个领域的精度、效率和适应性。想要在人工智能竞赛中保持领先的工程领导者应该关注四个关键领域的进步:生成式人工智能、验证和确认、降阶模型(ROM)和控制系统设计。
    的头像 发表于 12-27 15:40 2153次阅读

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体中,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够在人类社会中有效地提供商品及服务。 数据是一种货币化工具 数据是互联网
    发表于 12-24 00:33