0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详谈深度学习系统中实现记忆能力的唯一技术NTM

如意 来源:OFweek电子工程网 作者:学术头条 2020-10-08 14:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在计算机科学中,没有一门学科比深度学习更能从人类的记忆系统中受益。

自早期以来,在深度学习领域,人们就一直致力于对模拟人类记忆的一些关键特征系统进行建模。然而,想要为机器系统建立起类人的记忆结构,并非易事。

近日,区块链分析公司IntoTheBlock CEO、Invector Labs首席科学家、哥伦比亚大学客座教授Jesus Rpdriguez发表文章,谈论从神经科学和认知心理学的角度理解机器的记忆建模。

他认为,神经科学的记忆理论为我们理解智能存储体系结构的一些主要组成部分提供了基础,同时,人类的记忆不仅仅是大脑物理结构的副产品,而且还深受周围环境的影响。

关记忆的神经科学理论:绑定问题

现代神经科学的记忆理论涉及大脑的三个基本区域:丘脑(the thalamus)、前额叶(the prefrontal)、皮层和海马体(cortex &the hippocampus)。

丘脑可以被认为是一个路由器,它负责处理感官信息(视觉、触觉、语言等),并将其传递到大脑的感觉皮层进行评估。经过评估的信息最终到达前额叶皮层,进入我们的意识中,形成短期记忆。同时,这些信息也被传送到海马体,海马体将不同的片段分布到不同的皮质中,形成长期记忆。

而当今神经科学面临的最大挑战之一就是,我们如何将分散的记忆碎片重新组合起来,使其在人们回忆时构成连贯的记忆。这就是“绑定问题(the binding problem)”的主要内容。

假设您曾经历一场考试,那么关于这一事件的记忆将被分解并储存在大脑的不同区域中。然而,只需要小小的提示,例如听到考试提示音或见到当时的同伴,您就能回忆起关于这堂考试的各种记忆。

这是如何做到的呢?

一种理论认为,记忆碎片是由不断流过大脑的电磁振动联系在一起的。这些振动在记忆碎片之间创造了一个时间(而非空间)联系,允许它们同时被激活,因而最后成为凝聚一体的记忆。

关记忆的认知心理学理论:启动与联想

此外,为了解释绑定问题,我们还需要一些超越大脑的结构,以评估能够影响记忆方式的各种心理背景因素。在认知心理学中,试图解释联想记忆本质的主要理论之一被称为启动效应(the Priming Effect)。

设想一下,当您听到“考试”这个词的时候,首先想到的是什么?可能是“书籍”,可能是某个日期,甚至可能是“兴奋感”(手动狗头)。由此可见,仅仅是一个简单的词语,就可以唤起人的一系列复杂情绪甚至是其他相关的词语。而这个过程实际就是:我们正在有效地想起相关的事物,或者说,我们正在“启动”其他记忆。

这一实验中最引人注目的其实是,人们根据提示检索出相关单词或记忆的速度有多快。在心理学中,这种现象也被称为联想一致化(Associatively Coherent)。

而且,启动效应不仅适用于词汇,还适用于情绪、身体反应、本能等认知现象。启动效应告诉我们,记忆不仅是由主动联想方法来回忆的,而且是由“被启动的想法”来回忆的。

认知心理学的另一个重要内容则是我们回忆起特定事件的频率。

例如,如果我问你“在过去的十年里参加了多少场考试?” 如果你刚好最近就参加过一次考试或者特别快地得出答案者,那么这个数字很能被高估。相反,如果你并不喜欢上一次的考试经历,那么这个数字可能被低估。这个认知过程被称为可得性捷思法(the Availability Heuristic),它解释了我们的记忆是如何被快速获得的答案所深深影响。

深度学习的记忆机制:神经图灵机

那么深度学习算法具体该如何模仿上述这些理论从而形成类人记忆呢?答案其实不难得出:

a) 把一个内存分成若干段,不同片段描述不同的知识领域

b) 将分散的片段重新组合成连贯的信息结构

c) 根据上下文和不直接相关的信息以及外部数据引用来检索数据

同时,为了了解深度学习算法中的记忆相关性,我们应该区分内隐记忆implicit memory和外显记忆Explicit Memory。隐性知识通常是潜意识的,因此很难解释,例如识别图片中的猴子或口语句子中的语气和情绪。显性知识则很容易以陈述性方式建模。例如,“猴子是一种动物”或“某些形容词具有攻击性”,这都是显性知识的典型例子。

再想象一下传统的神经网络结构,它们往往有数百万个相互连接的节点,却缺乏一个工作记忆系统,用来存储已推断出的知识片段及其相互关系,以便从网络的不同层加入新信息。

而在这一领域,最流行的技术之一是神经图灵机(Neural Turing Machines,NTM),由DeepMind于2014年引入。NTM也属于深层神经网络, 但是它扩展出一个具有存储完整向量的记忆单元,并使用直观推断(heuristics)来读写信息。

例如,NTM实现了一种称为基于内容的寻址机制,它可以根据输入信息来检索向量,这与人类基于文字经验来回忆相关记忆的方式相似。

此外,NTM还包括一种机制,能够根据内存单元被寻址的频率来增加其显著性。

详谈深度学习系统中实现记忆能力的唯一技术NTM

NTM并不是在深度学习系统中实现记忆能力的唯一技术,但它无疑是最受欢迎的技术之一。

模仿人类记忆的生理和心理功能并不是一件容易的事,这已经成为深度学习领域中最重要的研究领域之一。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1819

    文章

    50287

    浏览量

    266826
  • 记忆
    +关注

    关注

    0

    文章

    6

    浏览量

    13977
  • 深度学习
    +关注

    关注

    73

    文章

    5603

    浏览量

    124609
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ASPICE 是什么?汽车系统过程改进和能力确定概念(

    Determination ,中文译名为汽车软件过程改进与能力评定,在 4.0 版本迭代后,其覆盖范围扩展至 硬件、机器学习等领域 ,“S”的含义从软件变为系统,名称变为Automotive
    发表于 04-02 13:53

    【智能检测】基于AI深度学习与飞拍技术的影像测量系统实现高效精准的全自动光学检测与智能制造数据闭环

    内容概要:文档内容介绍了图仪器(Chotest)影像测量仪融合人工智能深度学习与飞拍技术的自动化检测解决方案。系统通过AI
    发表于 03-31 17:11

    Evermem 突破大模型记忆瓶颈实现低耗高效

    测试的“花架子”,实际部署后效果照样能打。而且团队有底气有信心,技术代码全部开源。 为了方便开发者使用,他们刚刚还专门上线了云服务——现在只需个最简单的API,就能直接将最前沿的大模型记忆
    的头像 发表于 03-03 13:44 331次阅读
    Evermem 突破大模型<b class='flag-5'>记忆</b>瓶颈<b class='flag-5'>实现</b>低耗高效

    机器学习深度学习需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作段时间,机器学习深度学习中都存在些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不
    的头像 发表于 01-07 15:37 336次阅读
    机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>中</b>需避免的 7 个常见错误与局限性

    穿孔机顶头检测仪 机器视觉深度学习

    LX01Z-DG626穿孔机顶头检测仪采用深度学习技术,能够实现顶头状态的在线实时检测,顶头丢失报警,顶头异常状态报警等功能,响应迅速,异常状态视频回溯,检测顶头温度,配备吹扫清洁
    发表于 12-22 14:33

    键开启涂鸦OmniMem:打通跨设备记忆壁垒,实现毫秒级高精度召回

    “更多功能”,而是“次设定,处处懂我”。涂鸦智能深入千万家庭场景,思考用户切实体验,推出AI记忆系统OmniMem,重构AI记忆逻辑,融合短记忆高效总结与长
    的头像 发表于 12-17 18:11 464次阅读
    <b class='flag-5'>一</b>键开启涂鸦OmniMem:打通跨设备<b class='flag-5'>记忆</b>壁垒,<b class='flag-5'>实现</b>毫秒级高精度召回

    分享个嵌入式开发学习路线

    拓展期(3-4个月) 学习嵌入式操作系统(RTOS)和物联网通信技术,能开发“多任务、联网”的复杂项目,理解企业级嵌入式开发的“架构思维”。这阶段的
    发表于 12-04 11:01

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    行业市场具备深度学习能力的视觉系统占比已突破40%,催生大量复合型技术岗位需求: • 岗位缺口:视觉算法工程师全国缺口15万+,缺陷检测专项
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    行业市场具备深度学习能力的视觉系统占比已突破40%,催生大量复合型技术岗位需求: • 岗位缺口:视觉算法工程师全国缺口15万+,缺陷检测专项
    发表于 12-03 13:50

    攻击逃逸测试:深度验证网络安全设备的真实防护能力

    。 基于测试结果的持续优化,使双方共同构建起能够应对新型威胁的主动防御体系,实现安全防护能力的螺旋式上升。 攻击逃逸:深度隐匿的网络安全威胁 攻击逃逸(Evasion Attack)是网络安全领域中
    发表于 11-17 16:17

    深度学习对工业物联网有哪些帮助

    、实施路径三个维度展开分析: 深度学习如何突破工业物联网的技术瓶颈? 1. 非结构化数据处理:解锁“沉睡数据”价值 传统困境 :工业物联网
    的头像 发表于 08-20 14:56 1185次阅读

    自动驾驶Transformer大模型会取代深度学习吗?

    持续讨论。特别是在自动驾驶领域,部分厂商开始尝试将多模态大模型(MLLM)引入到感知、规划与决策系统,引发了“传统深度学习是否已过时”的激烈争论。然而,从技术原理、算力成本、安全需求与
    的头像 发表于 08-13 09:15 4350次阅读
    自动驾驶<b class='flag-5'>中</b>Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    一技在手,医疗无忧!零基础转行高薪医疗维修工程师

    ,剩下的就看个人能力了,对医疗器械维修感兴趣但迷茫的可联系我们,帮你解决疑难问题,带你入门医疗维修行业! 一技在手,医疗无忧!零基础转行高薪医疗维修工程师!” “缺口40万+,月薪过万!抢占医疗行业
    发表于 05-15 10:22

    深度学习赋能:正面吊车载箱号识别系统的核心技术

    支撑。 深度学习驱动的智能识别 传统OCR技术易受光线、污损或箱体图案干扰,而新代识别系统通过深度卷积神经网络(CNN)和注意力机制,
    的头像 发表于 05-07 10:10 662次阅读

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的件大事,万物皆可大模型已成为趋势。作为大模型开发应用重要组
    发表于 05-02 09:26