0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能在模仿人类的道路上学到了偷懒

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2021-06-15 15:41 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能在模仿人类的道路上,Get 到了一项精髓 —— 偷懒。

2018 年 4 月,OpenAI 公司举办了首届针对 AI 的强化学习竞赛。这场比赛让 AI 们来玩 NES 平台上的《刺猬索尼克》单机游戏。举办方希望 AI 能够在学习游戏技巧之后,能够拥有在其他地图上自觉找到最佳通关方法的能力,以此来评估强化算法的泛化能力。

结果 AI 好像对游戏有着一套自己的理解,它们绕过研究员预期的目标和设定,通过不断 “卡 Bug” 的方式找到了通关的 “捷径”。

谷歌 DeepMind AI 项目的研究人员维多利亚・克拉科夫纳(Victoria Krakovna)在其他游戏中也发现了这种现象。在《海岸赛艇》里,AI 操纵的船只为了获得更高分数,不断利用 Bug 来撞击奖励而忘了要抵达终点。甚至在玩《俄罗斯方块》这种小游戏时,AI 也找到了终极密码:只要游戏暂停就永不会输……

在最后,OpenAI 的强化学习竞赛虽然没有认可 “走捷径” 获胜的 AI,但研究人员还是认为:“AI 展示了它如何在没有人类介入的情况下赢得游戏胜利,出乎意料并极富有创造性,这可能完全颠覆人类对游戏如何运行的理解。”

AI 是如何学会走捷径的?

针对这一现象,北京大学王选计算机研究所和北京大学计算语言学教育部重点实验室的研究团队在 arXiv 上发表了研究论文《为什么机器阅读理解模型学会走捷径》 (Why Machine Reading Comprehension Models Learn Shortcuts)。

机器阅读理解(Machine Reading Comprehension, MRC)为自然语言处理(NLP)的核心任务之一,也是评价模型理解文本能力的重要指标,可以将其视为一种句子关系匹配任务。通常任务是让机器阅读给定的一篇文章并回答关于该文章的一个问题。其常见任务形式有四种:完形填空、多想选择、片段抽取和自由作答。

完形填空即将文章中的某些单词隐去,让模型根据上下文判断被隐去的单词最可能是哪个;多项选择是指让模型从多个备选答案中选择一个最有可能是正确答案的选项;片段抽取是让模型从文章中抽取连续的单词序列;自由作答则是让模型自主生成一个单词序列,使之作为问题的答案,与片段抽取任务不同,自由作答的序列并不局限于文章中给定的句子。

论文中提到,许多 MRC 模型绕过了常规的推理路径,通过 “走捷径” 给出了出人意料的答案。但这些答案往往无法真正解决问题,无法帮助人类达到预期目标。为了解决这一问题,该团队将关注点聚焦在为什么这些算法模型学会了 “走捷径”。

研究者认为,训练数据库中的大量 “捷径” 问题是导致模型过渡依赖 “偷懒行为” 的 “罪魁祸首”。

北大研究者设计了一个经过标注的全新数据集,在这个数据集中,每个问题都会有 “捷径式” 和 “挑战式” 两个版本的答案。他们还进一步提出了两种新的研究方法来量化分析在 “捷径模式” 和 “挑战模式” 下学习的难易程度,并试图揭示在这两种不同模式下的固有学习机制。

研究人员将能够 “释义”( Paraphrasing )作为更为复杂和高级的答案标准,将那些只有关键字提取而没有任何上下文理解和推理的答案定义为 “捷径” 版答案。

研究人员发现,在训练数据集中高占比的 “捷径模式” 数据使得模型更加依赖 “偷懒”,致使其之后的训练中无法提升更为复杂的推理技巧,阻碍了模型去学习 “释义” 过程由此解决更具挑战性的问题。文章表明,如果训练集中 “挑战版” 问题足够多的话,算法模型不但能吸收 “挑战版” 问题,同时还能正确回答 “捷径版” 的问题。

论文表示,在早期阶段,模型通常会用最简单的方法来拟合训练数据。“走捷径” 所消耗的资源最少,因此这种路径会成为优先选项。当模型发现 “偷懒” 可以解决大部分问题时,其余问题便无法再激励 AI 去探索更为复杂的解决方法。

研究者认为,导致 AI 习惯性偷懒的原因,除了 NLP 架构的设计问题之外,也有可能是训练过程中标准优化和资源保护的结果,此外,让 AI 在有限时间内迅速输出答案也会使给其造成 “压力”。

因此,人们可以通过修改 NLP 架构,让 AI 优先考虑更具挑战的数据和问题,并且再数据预处理领域也需要将数据中的 “捷径” 考虑进去。

原文标题:AI竟也学会偷懒?北大团队:数据集“走捷径”问题占比太高

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42075

    浏览量

    303106
  • 人工智能
    +关注

    关注

    1821

    文章

    50530

    浏览量

    267798

原文标题:AI竟也学会偷懒?北大团队:数据集“走捷径”问题占比太高

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为引领构建端网业协同的智能体网络

    当下,我们正站在通信技术与人工智能两大浪潮交汇的历史节点。以人工智能为代表的技术革命,正以前所未有的深度与广度,重塑移动通信从终端、网络到业务的每个环节。在通往未来网络的道路上,核心网作为整个网络的
    的头像 发表于 02-27 09:46 425次阅读

    浅谈人工智能(2)

    。 强人工智能(Strong AI),又称通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以胜任人类所有工作的
    的头像 发表于 02-22 08:24 443次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    Dante数字化会议系统、分布式视频系统、“AI”人工智能在会议运维中的应用

    Dante数字化会议系统、分布式视频系统、“AI”人工智能在会议运维中的应用
    的头像 发表于 02-08 14:19 1655次阅读

    开发智能体配置-内容合规

    智能体上架前,需完成“人工智能生成合成内容标识”和“大模型备案信息”填写 ,以供平台审核;可在智能体【配置】-【内容合规】中填写。 人工智能生成合成内容标识 “
    发表于 02-07 11:44

    2026年自动驾驶汽车发展趋势前瞻

    自动驾驶汽车会使用人工智能吗?答案是肯定的。人工智能(AI)是自动驾驶汽车运行的基石,它使车辆能够平稳、安全地在道路上正常行驶,适应实时交通状况,并做出瞬间的决策,确保道路交通安全,是
    的头像 发表于 02-05 09:38 4089次阅读
    2026年自动驾驶汽车发展趋势前瞻

    自然智能与人工智能融合如何重塑芯片设计

    人类大脑是所有处理器中最复杂的,能够构思出不可思议的创意,解决复杂、微妙的问题。相比之下,人工智能擅长快速分析海量数据并高效执行任务。当自然智能人工智能融合的结果,就是芯片设计领域正
    的头像 发表于 01-15 13:58 791次阅读

    物理人工智能面临的安全风险

    机器人,再到常见的扫地机器人,物理人工智能系统正变得越来越智能,也越来越贴近人类生活。先进的3D传感器、人工智能摄像头、语音接口
    的头像 发表于 11-17 10:54 1143次阅读
    物理<b class='flag-5'>人工智能</b>面临的安全风险

    人工智能+工业软件:智能仿真加速赋能产业变革

    安全可靠的虚拟环境。通过仿真技术,产品研发、生产运维等环节的试错成本大幅降低,科研创新与产品迭代速度显著加快。 亚洲仿真联盟理事长张霖指出,建模仿真技术与人工智能的深度融合是行业发展的必然趋势,完善的数据治理体系是建模仿
    的头像 发表于 10-09 14:16 580次阅读

    革新科研智造,引领材料未来——高通量智能科研制备工作站

    在材料研发迈向产业化的道路上,配方与工艺的创新是决定成败的核心。然而,面对日益复杂的材料体系,传统人工试错模式效率低下、成本高昂,已成为制约科研突破的瓶颈。深圳市善思创兴科技有限公司凭借自主研发
    发表于 09-27 14:17

    《深入实施“人工智能+”行动的意见》会给自动驾驶行业带来哪些新机遇?

    [首发于智驾最前沿微信公众号]随着智能化技术发展,人工智能在社会各领域的参与度越来越强,无论是医疗还是教育亦或是出行,人工智能似乎已深入大家“吃穿住行”的方方面面。为深入实施“人工智能
    的头像 发表于 08-28 10:15 834次阅读
    《深入实施“<b class='flag-5'>人工智能</b>+”行动的意见》会给自动驾驶行业带来哪些新机遇?

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    人工智能在汽车行业中的应用

    人工智能(AI)是许多行业和应用领域的热门话题。但对于汽车行业而言,这并非一个新概念。人工智能,尤其是机器学习——即通过数据让机器学习并随着时间推移不断改进的过程——早已被广泛应用,最初主要用于提升开发过程中的物理模拟方法。
    的头像 发表于 07-31 11:07 2271次阅读

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10