0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

长期短期记忆网络:它是什么以及它是如何工作的?

星星科技指导员 来源:VOLANSYS 作者:Dipam Shah 2022-12-05 16:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习是一种强大的技术,它通过开发算法从其经验中学习和改进。算法是计算、访问和处理输入数据并预测结果的程序。机器学习模型旨在计算复杂的计算和学习模式,并在此基础上提供相关的输出。该模型适用于数字、二元、多变量、分类和相关数据集等普通数据集。

然而,截至今天,由于理解输入数据的上下文的局限性,大多数机器学习模型都面临着预测时间序列数据的挑战。这就是递归神经网络,其中长短期记忆网络(LSTM)——一种人工神经网络。LSTM 可以识别数据序列中的模式,例如来自传感器、文本、基因组、手写和口语的数字时间序列数据。

什么是 LSTM 网络?

LSTM – 长期短期记忆网络,是一种特殊类型的RNN(递归神经网络)。RNN是一个神经网络,它将前一个状态的输出作为下一阶段的输入,这样它就可以记住前一个状态的数据。它将借助先前的数据精确预测最终输出。

然而,RNN存在梯度消失问题,即信息在较长的序列中褪色,因此在较长时间内持久化数据时面临困难。此问题可以通过 LSTM 解决。LSTM已经表现出摆脱了长期依赖问题并消除了RNN的缺点。

LSTM的重要性

在这个现代时代,机器正在使用机器学习智能地执行任务。现在,每个行业都有大量的设备历史数据,这些数据必须以机器学习模型能够有效预测数据的方式使用。

作为人类,我们总是非常规地选择一些重要的关键字,而忽略其他有助于我们理解任何句子或段落上下文的单词。例如,在阅读电影评论时,大脑只试图记住或专注于一些关键词,如“动感十足”、“令人叹为观止”、“无聊”和“惊人”。每次我们不必思考,记住并重新开始。LSTM的行为也类似。此外,LSTM 专为传统神经网络失败的顺序数据集而设计。LSTM 允许数据持久化。

在每个行业中,当局都会根据过去的重要数据做出任何决定,这将提供更好的结果。与机器学习模型相同,与其他模型相比,LSTM 展示了准确的结果,因为它在整个模型学习过程中只记住相关数据。它可以轻松保留重要信息以进行预测。

LSTM 如何工作?

LSTM 使用一系列不同的逻辑门。借助这一点,它可以调节信息流并解决RNN中的消失梯度问题。梯度消失问题发生在训练机器学习模型的反向传播期间。梯度是可用于更新神经网络权重的值。在反向传播时,梯度将变得如此之小,以至于在更新权重方面可以忽略不计。

这最终将停止学习该层,以便这些层不会学习。因此,RNN 会在更长的时间内忘记数据,因为 RNN 只有短期记忆。

LSTM和RNN在控制流方面是相似的。两者都在传递和向前传播时处理信息。唯一的区别是每个单元格内的操作。LSTM的主要概念是在整个网络中传递相关信息。根据输入,它会将该数据添加到内存中,如果不需要数据,则忘记或删除数据,如果信息不相关,则忽略信息。这就是 LSTM 不仅将信息传递到下一个状态,而且还为以后的状态保留数据的方式。

LSTM的工作分为三个部分,每个部分执行以下单独的功能:

第一部分确定来自前一个时间戳的信息是相关的,然后记住它,如果它不相关,它可以被遗忘。这部分称为遗忘门。

在第二部分中,单元格尝试从单元格的当前输入中学习新数据,这称为输入门。

最后,在第三部分中,单元格将更新的信息从当前时间戳传递到下一个时间戳。这部分称为输出门。

这就是 LSTM 在训练过程中有选择地忘记和记住信息的方式。

LSTM的应用

工业物联网:每个行业的深刻本质是始终如一地提高产品质量。在制造单位中,有许多设备、传感器和机器,每个设备、传感器和机器都有大量的数据。这些受到的关注非常少,这可能导致该行业陷入磨损情况。

LSTM将在上述情况下发挥至关重要的作用。基于执行器、振动、温度、噪声、用电量等不同参数的历史数据,该模型可以提前预测机器的早期维护和异常检测。这将有助于制造单元进行及时维护。最终,它将提高效率并减少机器的停机时间。提高设备的利用率很有用。因此,生产产品的时间更少,数量更多。对于大型电力行业,它可以使用过去的电力供应数据预测特定州、城市或街道即将到来的电力需求。电力负荷预测将有助于减轻能源损失,并根据预测管理和传输电力。

家庭自动化:在家庭自动化中,有两个最重要的事情:

准确性

处理和执行操作的速度

在智能建筑中,HVAC供暖,通风和空调系统将有助于预测能源消耗以及室内空气温度,并根据外部天气进行控制。基于人类行为,设备应执行预定义的任务,其中可以通过逐个分析视频帧来识别人类活动。在这里,LSTM将根据早期行动精确预测下一步行动。

任何与音频分析相关的应用程序,例如预测用于窃贼检测的玻璃破碎、语音识别和预测语音命令。这些具有基于时间序列的数据,其中每个信息都带有其频率和时间。

在语音命令或语音识别中,了解 LSTM 的优势的实际上下文非常重要。

汽车:每个行业都有关于各自市场的大量数据,借助这些数据,LSTM将分析即将到来的市场趋势并预测即将到来的产品需求。

这将帮助汽车制造商根据需求预测管理其供应链和库存,并制定计划以加速需求并减少不必要的成本。它可以帮助组织根据市场需求发现新的机会。它还向零售客户推荐使用过去订单的相关产品,从而提供更好的用户体验并促进销售。LSTM 在预测时间序列数据方面令人满意。

医疗保健:在医疗保健行业中,心跳、神经模式、血压和氧气水平对于严重入院的患者至关重要。如果这些参数中的任何一个发生变化,那么患者可能会死亡。这些参数应在早期阶段准确预测,这有助于相应地治疗患者。

最重要的是,所有参数都具有LSTM优于其他模型的时间序列数据。它还可以使用健康报告提前诊断任何健康问题,例如检测癌症或任何重大疾病。在智能可穿戴设备的帮助下,它可以提前预测心脏病发作,并向相关人员发送其健康状况的信息。它会建议根据他们的健康状况咨询医生,并提醒他们定期检查。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106793
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136231
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【社区之星】欧小龙——保护你的好奇心:它是所有创造力的源泉

    (CIS)芯片开发流程,具备完整产品落地能力:从 需求定义 → 芯片开发 → 模组打样 → 量产测试。 工作经历 2017年开始工作,主要从事CIS芯片开发至今。 技能专长 熟悉Linux
    发表于 11-26 16:31

    别过度解读存储芯片荒!PCB行业有“防火墙”,短期波动无效

    锚定汽车电子、工业控制等长期需求,而非存储芯片的短期供需变化,而存储芯片缺货的 “暂时性” 与 PCB 需求的 “长期性” 存在根本矛盾,这一切的核心,仍需回归存储芯片短缺的本质与 PCB 的产业特性。
    的头像 发表于 11-08 16:12 730次阅读

    解析DCQCN:RDMA在数据中心网络的关键拥塞控制协议

    DCQCN ( Data Center Quantized Congestion Notification),数据中心量化拥塞通知。它是一种专门为数据中心网络设计的端到端拥塞控制协议。其核心目的是在使用RDMA(RoCEv2) 的网络
    的头像 发表于 09-15 11:45 1495次阅读
    解析DCQCN:RDMA在数据中心<b class='flag-5'>网络</b>的关键拥塞控制协议

    三防漆的耐温范围

    三防漆的耐温能力由基础树脂类型决定,不同类型的长期使用温度和短期耐温存在显著差异,在选择三防漆时需匹配设备的实际工作环境温度:1.丙烯酸类三防漆长期耐温范围:-20℃~80℃
    的头像 发表于 07-28 09:44 471次阅读
    三防漆的耐温范围

    它是保障环网柜安全的“健康监测仪”!

    如何保障环网柜的安全?
    的头像 发表于 06-09 11:24 342次阅读

    电路询问:请问图片中R11的具体作用是什么?它是怎么能调节LED亮度?

    请问图片中R11的具体作用是什么?它是怎么能调节LED亮度?
    发表于 04-25 10:00

    校准后,记忆示波器显示频率和幅度是否准确?

    校准源、探头补偿、温度漂移等因素,并采取相应措施。 最佳实践:定期校准、环境控制、探头管理是确保长期准确性的关键。 通过严格遵循校准流程和最佳实践,记忆示波器的频率和幅度显示可长期保持高精度。
    发表于 04-16 14:56

    《AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    了分层存储架构,将记忆分为短期记忆工作记忆长期记忆三个层次,通过注意力机制和遗忘机制来管理
    发表于 02-25 21:59

    DLPC3439如果给的HDMI源输出是RGB565,会在HDMI中表示它是RGB吗,光机会如何处理这16bit?

    的亮度有异常,比如像素该亮的地方暗了, 猜想可能是像素的字段对应有问题。 所以请Ti工程师确认以下问题: 1.如果给的HDMI源输出是RGB565,会在HDMI中表示它是RGB吗,光机会如何处理这
    发表于 02-19 07:46

    和DeepSeek聊了聊,它是懂明达技术的!

    在AI大模型你追我赶的科技竞技场,一匹名为深度求索的"黑马"突然炸裂登场!这位号称"数字世界最靓的仔"——DeepSeek大模型在重重严苛测试里一路过关斩将,成绩斐然,甚至超越了行业巨头 OpenAI 所开发的模型。 DeepSeek是什么? DeepSeek是一款由国内人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。 在人工智能飞速发展的现代 DeepSeek以“有趣的灵魂” 得到了许多
    的头像 发表于 02-11 13:55 451次阅读
    和DeepSeek聊了聊,<b class='flag-5'>它是</b>懂明达技术的!

    CMOS开关和多路复用器中的Ron调制;它是什么及如何预测它对信号失真的影响

    电子发烧友网站提供《CMOS开关和多路复用器中的Ron调制;它是什么及如何预测它对信号失真的影响.pdf》资料免费下载
    发表于 01-15 16:23 1次下载
    CMOS开关和多路复用器中的Ron调制;<b class='flag-5'>它是</b>什么及如何预测它对信号失真的影响

    PCA9306是否有最低工作电流?

    。 我的疑问是,我在TI官网上看到的关于PCA9306使用的示例原理图中看到的上拉电阻多是2.2K左右,甚至还有4.7K的,算下来的电流远远低于1mA,我知道了这个器件的最高工作电流为15mA,那它是否有最低工作电流?上拉10K
    发表于 01-08 07:04

    记忆示波器的原理和应用

    在断电的情况下,记忆示波器也能将波形记忆一段时间(如一周左右),这得益于其内部的存储机制。 工作原理: 信号输入与转换:当信号输入到记忆示波器中时,首先经过信号放大器和采样,然后被送
    发表于 01-06 15:50

    影响晶振短期稳定度的因素

    晶振是电子设备中用于产生稳定时钟信号的关键元件,其短期稳定度直接影响设备的精度和可靠性。短期稳定度是指晶振在短时间内(通常为几秒到几分钟)频率波动的程度。
    的头像 发表于 12-30 15:08 885次阅读

    ADC121S101给的fSLKC小于10MHz会怎么样?它是不能产生正确的输出吗?

    最近在研究一个SPI接口的SAR型ADC121S101, datasheet里面fSLKC 的limit 是从10MHz到20MHz,最小10MHz,那么有一个疑问,如果我给的fSLKC小于10MHz会怎么样?它是不能产生正确的输出吗?
    发表于 12-20 06:04