0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详谈深度学习系统中实现记忆能力的唯一技术NTM

如意 来源:OFweek电子工程网 作者:学术头条 2020-10-08 14:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在计算机科学中,没有一门学科比深度学习更能从人类的记忆系统中受益。

自早期以来,在深度学习领域,人们就一直致力于对模拟人类记忆的一些关键特征系统进行建模。然而,想要为机器系统建立起类人的记忆结构,并非易事。

近日,区块链分析公司IntoTheBlock CEO、Invector Labs首席科学家、哥伦比亚大学客座教授Jesus Rpdriguez发表文章,谈论从神经科学和认知心理学的角度理解机器的记忆建模。

他认为,神经科学的记忆理论为我们理解智能存储体系结构的一些主要组成部分提供了基础,同时,人类的记忆不仅仅是大脑物理结构的副产品,而且还深受周围环境的影响。

关记忆的神经科学理论:绑定问题

现代神经科学的记忆理论涉及大脑的三个基本区域:丘脑(the thalamus)、前额叶(the prefrontal)、皮层和海马体(cortex &the hippocampus)。

丘脑可以被认为是一个路由器,它负责处理感官信息(视觉、触觉、语言等),并将其传递到大脑的感觉皮层进行评估。经过评估的信息最终到达前额叶皮层,进入我们的意识中,形成短期记忆。同时,这些信息也被传送到海马体,海马体将不同的片段分布到不同的皮质中,形成长期记忆。

而当今神经科学面临的最大挑战之一就是,我们如何将分散的记忆碎片重新组合起来,使其在人们回忆时构成连贯的记忆。这就是“绑定问题(the binding problem)”的主要内容。

假设您曾经历一场考试,那么关于这一事件的记忆将被分解并储存在大脑的不同区域中。然而,只需要小小的提示,例如听到考试提示音或见到当时的同伴,您就能回忆起关于这堂考试的各种记忆。

这是如何做到的呢?

一种理论认为,记忆碎片是由不断流过大脑的电磁振动联系在一起的。这些振动在记忆碎片之间创造了一个时间(而非空间)联系,允许它们同时被激活,因而最后成为凝聚一体的记忆。

关记忆的认知心理学理论:启动与联想

此外,为了解释绑定问题,我们还需要一些超越大脑的结构,以评估能够影响记忆方式的各种心理背景因素。在认知心理学中,试图解释联想记忆本质的主要理论之一被称为启动效应(the Priming Effect)。

设想一下,当您听到“考试”这个词的时候,首先想到的是什么?可能是“书籍”,可能是某个日期,甚至可能是“兴奋感”(手动狗头)。由此可见,仅仅是一个简单的词语,就可以唤起人的一系列复杂情绪甚至是其他相关的词语。而这个过程实际就是:我们正在有效地想起相关的事物,或者说,我们正在“启动”其他记忆。

这一实验中最引人注目的其实是,人们根据提示检索出相关单词或记忆的速度有多快。在心理学中,这种现象也被称为联想一致化(Associatively Coherent)。

而且,启动效应不仅适用于词汇,还适用于情绪、身体反应、本能等认知现象。启动效应告诉我们,记忆不仅是由主动联想方法来回忆的,而且是由“被启动的想法”来回忆的。

认知心理学的另一个重要内容则是我们回忆起特定事件的频率。

例如,如果我问你“在过去的十年里参加了多少场考试?” 如果你刚好最近就参加过一次考试或者特别快地得出答案者,那么这个数字很能被高估。相反,如果你并不喜欢上一次的考试经历,那么这个数字可能被低估。这个认知过程被称为可得性捷思法(the Availability Heuristic),它解释了我们的记忆是如何被快速获得的答案所深深影响。

深度学习的记忆机制:神经图灵机

那么深度学习算法具体该如何模仿上述这些理论从而形成类人记忆呢?答案其实不难得出:

a) 把一个内存分成若干段,不同片段描述不同的知识领域

b) 将分散的片段重新组合成连贯的信息结构

c) 根据上下文和不直接相关的信息以及外部数据引用来检索数据

同时,为了了解深度学习算法中的记忆相关性,我们应该区分内隐记忆implicit memory和外显记忆Explicit Memory。隐性知识通常是潜意识的,因此很难解释,例如识别图片中的猴子或口语句子中的语气和情绪。显性知识则很容易以陈述性方式建模。例如,“猴子是一种动物”或“某些形容词具有攻击性”,这都是显性知识的典型例子。

再想象一下传统的神经网络结构,它们往往有数百万个相互连接的节点,却缺乏一个工作记忆系统,用来存储已推断出的知识片段及其相互关系,以便从网络的不同层加入新信息。

而在这一领域,最流行的技术之一是神经图灵机(Neural Turing Machines,NTM),由DeepMind于2014年引入。NTM也属于深层神经网络, 但是它扩展出一个具有存储完整向量的记忆单元,并使用直观推断(heuristics)来读写信息。

例如,NTM实现了一种称为基于内容的寻址机制,它可以根据输入信息来检索向量,这与人类基于文字经验来回忆相关记忆的方式相似。

此外,NTM还包括一种机制,能够根据内存单元被寻址的频率来增加其显著性。

详谈深度学习系统中实现记忆能力的唯一技术NTM

NTM并不是在深度学习系统中实现记忆能力的唯一技术,但它无疑是最受欢迎的技术之一。

模仿人类记忆的生理和心理功能并不是一件容易的事,这已经成为深度学习领域中最重要的研究领域之一。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49746

    浏览量

    261603
  • 记忆
    +关注

    关注

    0

    文章

    6

    浏览量

    13966
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123914
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    分享个嵌入式开发学习路线

    拓展期(3-4个月) 学习嵌入式操作系统(RTOS)和物联网通信技术,能开发“多任务、联网”的复杂项目,理解企业级嵌入式开发的“架构思维”。这阶段的
    发表于 12-04 11:01

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    行业市场具备深度学习能力的视觉系统占比已突破40%,催生大量复合型技术岗位需求: • 岗位缺口:视觉算法工程师全国缺口15万+,缺陷检测专项
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    、锂电池产线的视觉检测工位。 二、职业发展: 目前行业市场具备深度学习能力的视觉系统占比已突破40%,催生大量复合型技术岗位需求: • 岗位
    发表于 12-03 13:50

    深度学习对工业物联网有哪些帮助

    、实施路径三个维度展开分析: 深度学习如何突破工业物联网的技术瓶颈? 1. 非结构化数据处理:解锁“沉睡数据”价值 传统困境 :工业物联网
    的头像 发表于 08-20 14:56 765次阅读

    自动驾驶Transformer大模型会取代深度学习吗?

    持续讨论。特别是在自动驾驶领域,部分厂商开始尝试将多模态大模型(MLLM)引入到感知、规划与决策系统,引发了“传统深度学习是否已过时”的激烈争论。然而,从技术原理、算力成本、安全需求与
    的头像 发表于 08-13 09:15 3923次阅读
    自动驾驶<b class='flag-5'>中</b>Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    深度学习赋能:正面吊车载箱号识别系统的核心技术

    支撑。 深度学习驱动的智能识别 传统OCR技术易受光线、污损或箱体图案干扰,而新代识别系统通过深度卷积神经网络(CNN)和注意力机制,
    的头像 发表于 05-07 10:10 432次阅读

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    很高兴又有机会学习ai技术,这次试读的是「零基础开发AI Agent」,作者叶涛、管锴、张心雨。 大模型的普及是近三年来的件大事,万物皆可大模型已成为趋势。作为大模型开发应用重要组
    发表于 05-02 09:26

    记忆示波器校准仪能校准哪些参数?

    记忆示波器校准仪是种综合性电子计量标准仪器,能够校准记忆示波器的多项关键参数,主要包括以下方面:1. 垂直系统参数 幅度校准:通过标准信号源输出精确电压,校准示波器的垂直灵敏度,确保
    发表于 04-11 14:05

    嵌入式AI技术深度学习:数据样本预处理过程中使用合适的特征变换对深度学习的意义

      作者:苏勇Andrew 使用神经网络实现机器学习,网络的每个层都将对输入的数据做次抽象,多层神经网络构成深度学习的框架,可以
    的头像 发表于 04-02 18:21 1287次阅读

    《AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    行适应性学习。生成式代理的技术实现为AI系统带来了新的发展方向。项目中的记忆架构设计特别值得关注,它不仅解决了传统AI
    发表于 02-25 21:59

    军事应用深度学习的挑战与机遇

    人工智能尤其是深度学习技术的最新进展,加速了不同应用领域的创新与发展。深度学习技术的发展深刻影响
    的头像 发表于 02-14 11:15 825次阅读

    长城汽车Coffee Agent与DeepSeek实现技术深度融合

    研发的大模型,此次融合了DeepSeek R1模型的特点,使其在理解、思考和推理能力上得到了显著提升。这一技术融合,不仅增强了Coffee Agent的智能性,也为其在更多场景下的应用提供了可能。 DeepSeek的快速上车,得益于长城汽车在AI子
    的头像 发表于 02-10 09:41 1098次阅读

    AI自动化生产:深度学习在质量控制的应用

    生产效率、保证产品质量方面展现出非凡的能力。阿丘科技「AI干货补给站」推出《AI自动化生产:深度学习在质量控制的应用》文章,探讨深度
    的头像 发表于 01-17 16:35 1219次阅读
    AI自动化生产:<b class='flag-5'>深度</b><b class='flag-5'>学习</b>在质量控制<b class='flag-5'>中</b>的应用

    MCU在车载系统的展望

    MCU在车载系统的展望 以下是MCU在车载系统的展望: 技术发展趋势 高性能与低功耗并重 :智能座舱等车载
    发表于 01-17 12:11

    记忆示波器的原理和应用

    和处理技术,能够实现对被测信号的精确测量和分析。在实际应用,用户可以根据具体需求选择合适的记忆示波器型号和功能。
    发表于 01-06 15:50