0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3个方法教AI学会遗忘

mK5P_AItists 来源:未知 作者:胡薇 2018-06-13 09:43 次阅读

大部分人不会喜欢遗忘的感觉。回到家顺手把钥匙丢在一个角落就再也想不起来放在哪儿了,街角偶遇一个同事却怎么拍脑袋也叫不出他的名字……我们害怕遗忘,讨厌遗忘。

然而,生而为人,健忘其实是种关键能力。对于人类而言,遗忘绝不仅仅是“想不起来”,而是一个帮助大脑吸收新信息并锻炼有效决策的积极过程。现在,数据科学家们正在尝试应用神经科学原理来改进机器学习,并且坚信人类大脑能够解锁图灵完备的人工智能

人脑为什么需要遗忘

我们的大脑被普遍认作为信息过滤器。先放入一大堆乱七八糟的数据,筛选有用的信息,然后清理任何不相关的细节,用以陈述故事或作出决策。清除没用的细节是为了给新数据腾出储存空间,类似在计算机上运行磁盘清理。

用神经生物学的术语来说,遗忘发生于神经元之间的突触连接减弱或者消失之时,同时随着新神经元的发育,他们又会重新连接海马回路,覆盖现有记忆。

对于人类来说,遗忘有两个好处:

通过减少过时信息对我们决策的影响来增强灵活性

防止过度拟合过去的特定事件和促进概括能力

为了有效地适应环境,人类需要有策略性遗忘的能力。

计算机也需要遗忘?

计算机的遗忘与人类的不同,这是人工智能面临的一大挑战。深度神经网络在完成机器学习任务方面非常成功,但它们的遗忘方式也与我们不一样。

举一个简单的例子,如果你教一个讲英语的孩子学习西班牙语,这个孩子会在学习过程中应用英语学习的技巧,比如名词、动词动态、句子建立方法等。同时他会忘记那些不相关的部分,比如口音、嘟囔、语调等。如此,这个孩子可以在策略性遗忘的同时逐渐学习和建立新的思维方式。

相比之下,如果你已经训练了一个神经网络去学习英语,那么它的参数则已经适应了英语问题的解法。此时你要教它学习西班牙语,它就会生成新的适应系统并覆盖以前为学习英语所获得的知识,删除所有内容并重新开始。这被称作“灾难性遗忘”,并被认为是“神经网络的一个根本局限”。

虽然这还是一个新领域,最近科学家们已经在探索克服这种限制的潜在理论,并取得了长足的进步。

3个方法教AI学会遗忘

长短期记忆网络(LSTM)

LSTM是一种循环神经网络,它使用特定的学习机制来决定在任意一个节点哪些信息需要记住,哪些需要更新,哪些需要关注。

LSTM工作机制如何?一个简单的解释是拿电影来做类比:假设一个计算机正在尝试通过分析先前的场景来预测电影中接下来会发生的事。一个场景是一个女人拿着一把刀,计算机会猜测她是一个厨师还是凶手呢?另一个场景中,一个女人和一个男人在金色拱门下吃寿司:计算机会猜他们是在日本还是麦当劳呢?或者其实他们是在圣路易斯?

大拱门是美国圣路易斯的标志性建筑

LSTM通过以下3步提升神经网络:

遗忘/记忆

“当场景结束,模型应该忘记当前场景的位置,所处时间,并重置任何特定场景的信息;然而,如果场景中的一个角色死亡了,机器则应该继续记住他不再活着的事实。因此,我们希望机器能学习掌握一个相互独立的遗忘/记忆机制,这样当新信息进来时,它知道什么观念该保留什么该丢弃。”

——Edwin Chen

保存

当模型看到一张新图像,它需要了解这个图像是否有什么信息值得被使用和保存。如果一个女人在某个场景中路过广告牌,机器应该记住这个广告牌还是将其视作噪声数据忽略掉呢?

划重点

我们可能需要记住电影中的这个女人是个母亲这一信息点,因为我们稍后会看见她的孩子们,但是这个信息在她不出现的场景里可能并不重要,所以在那些场景里我们不需要重点关注。同样,并非所有存储在神经网络的长期记忆中的内容都是立即相关的,所以LSTM所做的就是在安全保存所有信息备用的同时,帮助决定哪一部分在哪一时刻被重点关注。

弹性权重固化(EWC)

EWC是由谷歌旗下DeepMind的研究人员于2017年3月创建的一种算法,旨在模拟一种被称为突触整合的神经科学过程。在突触整合过程中,我们的大脑评估一项任务,计算许多用于执行任务的神经元的重要性,同时权衡哪些神经元对正确执行任务更为重要。

这些关键的神经元被编译为重要的,并且在随后的任务中相对不可能被覆盖。同样,在神经网络中,多个连接(如神经元)被用于执行任务。EWC将一些连接编译为至关重要的,从而保护他们不被覆盖/遗忘。

在下面的图表中,你可以看到研究人员将EWC应用于Atari游戏时发生了什么。蓝线表示标准的深度学习过程,红线及棕线则由EWC提供以显示改进后的结果:

瓶颈理论

瓶颈理论由耶路撒冷希伯来大学的计算机科学家和神经科学家Naftali Tishby在2017年秋提出。这个构想是,网络摆脱了嘈杂的无关细节的输入数据,就好比用瓶颈将信息挤压,只保留与基本概念最相关的特征。

Tishby解释说,神经网络经历了两个阶段的学习——拟合与压缩。在拟合过程中,网络标记其训练数据;而在更漫长的压缩过程中,它“丢弃关于数据的信息,只跟踪最强大的特征”,也即是那些最能帮助它泛化的特征。通过这种方式,压缩成为策略性遗忘的一种方式,掌控这一瓶颈也可能成为AI研究人员用于构建未来更强大神经网络的新目标和体系的一个工具。

正如Tishby所说:“遗忘才是学习过程中最重要的一部分。”

人类大脑和遗忘的过程中,有可能藏着通往强AI的密码。但科学家们仍在上下求索。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    6665

    浏览量

    84785
  • AI
    AI
    +关注

    关注

    87

    文章

    26605

    浏览量

    264263

原文标题:教机器遗忘或许比学习更重要:让AI健忘的三种方式

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统上开发的一目标识别的AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的AI能力,并为
    发表于 04-11 16:14

    防止AI大模型被黑客病毒入侵控制(原创)聆思大模型AI开发套件评测4

    在训练一只聪明的AI小动物解决实际问题,通过构建神经网络模型并进行推理,让电脑也能像人一样根据输入信息做出决策。 在上述示例中,我创建了一简单的深度学习模型,该模型具有两全连接层。然后,加载了该
    发表于 03-19 11:18

    主板用STM32H7B3I-DK然后配一普通的摄像头,可以实现视觉AI吗?

    主板用STM32H7B3I-DK然后配一普通的摄像头,可以实现视觉AI
    发表于 03-19 06:44

    影响闪存遗忘的主要因素

    正如艾宾浩斯记忆曲线所示:输入的信息经过人脑的注意过程后被学习,学习的信息进入人脑短时记忆。遗忘在学习后立即开始,若不及时加以复习,短时记忆中的信息就会被遗忘;但遗忘的速度并不均衡——遵循先快后慢的原则。
    的头像 发表于 12-08 10:41 365次阅读
    影响闪存<b class='flag-5'>遗忘</b>的主要因素

    【KV260视觉入门套件试用体验】五、VITis AI (人脸检测和人体检测)

    _library_r3.0.x_images.tar.gz 和vitis_ai_library_r3.0.0_video.tar.gz。以下示例中使用的图像或视频均可在这两包中找到。 https://china.xilinx.com/bin/public
    发表于 09-26 16:22

    硬件工程师必须要学会的十种电路分析方法

    ,不得不选择相信“玄学”! 如何从各种繁杂的故障现象中,看到本质,是需要方法的!我正好整理了十种硬件工程师必须要学会的电路分析方法,希望能对各位朋友有所帮助。理论指导实践,通过不断实践、练习,再丰富理论,进而使理论日
    的头像 发表于 09-25 09:05 1327次阅读
    硬件工程师必须要<b class='flag-5'>学会</b>的十种电路分析<b class='flag-5'>方法</b>

    AI智能呼叫中心

    随着科技的飞速发展,人工智能(AI)已经成为了各行各业的关键技术,其中,AI智能呼叫中心的出现,给传统的呼叫中心带来了巨大的改变与创新,本文将探讨AI智能呼叫中心的优势,包括自动化处理、个性化服务
    发表于 09-20 17:53

    OpenHarmony AI框架开发指导

    ,各Plugin实现由server提供的插件接口,完成插件接入;common提供与平台相关的操作方法、引擎协议以及相关工具类,供其他各模块调用。 AI引擎框架各模块之间的代码依赖关系如下图所示: 图
    发表于 09-19 18:54

    请问STM32H7B3I-DK可以实现AI吗?

    主板用STM32H7B3I-DK然后配一普通的摄像头,可以实现视觉AI
    发表于 08-08 08:09

    乱码电路第3部分:遗忘转移

    要了解遗忘传输的工作原理,需要对公钥加密有一个基本的了解。公钥加密的每个用户都有两个数学上相关的密钥,而不是在用户之间共享私钥(与 AES 一样):私钥 k 只有用户知道,以及公钥 kG,其中
    的头像 发表于 06-27 16:14 290次阅读
    乱码电路第3部分:<b class='flag-5'>遗忘</b>转移

    AI视觉检测在工业领域的应用

    、判断和检测生产线上的各种产品,保证产品的质量和一致性。与传统的视觉检测方法相比,工业AI视觉检测系统具有如下几个显著优点: 1.高效性:工业AI视觉检测系统可以实现自动化检测,大大提高了生产效率
    发表于 06-15 16:21

    北京集成电路学会正式揭牌成立

    微纳电子战略科学家、教育家、中国科学院院士王阳元教授,作为北京集成电路学会名誉会长对学会的成立发表视频致辞,对学会的成立表示了热烈祝贺,并对学会未来的工作提出了建议。
    的头像 发表于 06-07 14:51 474次阅读

    大家觉得示器好不好用?

    器怎么设计最好用? 机器人编程,看是一种程序设计,实际上更多的是建模数据设计。 所以, 示器更接近3d建模最好,例如,一定要有sin,cos等三角形和圆形计算按钮。 我的三角形学得很烂,就不多说了。 要说编程功能的话,一定
    发表于 05-24 15:32

    7种方法您怎么进步电感Q值

    7种方法您怎么进步电感Q值 7种方法您怎么进步电感Q值电感Q值指的是电感质量因素,一般来说,电感Q值从十几到几百的都有。近日小编接到来自山东,江西,江苏等省份多个仪器外表及检测行业
    发表于 05-19 15:08