0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

简述位置编码在注意机制中的作用

深度学习自然语言处理 来源:DeepHub 作者:DeepHub 2021-06-16 17:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

神经网络知识。

有一种叫做注意机制的东西,但是你不需要知道注意力具体实现。

RNN/LSTM的不足。

A. Vaswani等人的《Attention Is All You Need》被认为是解决了众所周知的LSTM/RNN体系结构在深度学习空间中的局限性的突破之一。本文介绍了transformers 在seq2seq任务中的应用。该论文巧妙地利用了 D.Bahdanau 等人通过联合学习对齐和翻译的神经机器翻译注意机制的使用。并且提供一些示例明确且详尽地解释了注意力机制的数学和应用。

在本文中,我将专注于注意力机制的位置编码部分及其数学。

假设您正在构建一个 seq2seq 学习任务,并且您想要开发一个模型,该模型将输入英语句子并将其翻译成其他 语言。“All animals are equal but some are more equal than others ”→Badhā prāṇī’ō samāna chē parantu kēṭalāka an’ya karatā vadhu samāna chē你的第一步是获取这个输入句子,运行一个分词器,将它转换成数字,然后将它传递给一个嵌入层,这可能会为这个句子中的每个单词添加一个额外的维度。

在运行 RNN 或 LSTM 时,隐藏状态保留单词在句子中的相对位置信息。然而,在 Transformer 网络中,如果编码器包含一个前馈网络,那么只传递词嵌入就等于为您的模型增加了不必要的混乱,因为在词嵌入中没有捕获有关句子的顺序信息。为了处理单词相对位置的问题,位置编码的想法出现了。

在从嵌入层提取词嵌入后,位置编码被添加到这个嵌入向量中。

解释位置编码最简单的方法是为每个单词分配一个唯一的数字 ∈ ℕ 。或者为每个单词分配一个在 [0,1] ∈ ℝ 范围内的实数(如果输入句子很长,这样可以处理很大的值)。但是,上述两种方法都没有捕捉到单词之间时间步长的准确性。为了克服这个问题,本文使用了 sin 和 cosine 函数形式的位置编码。

打个比方,我们输入模型的序列,无论是句子、视频序列还是股票市场价格数据,都将始终是时域信号。表示时域信号的最佳方式是通过正弦方程 sin(ωt)。如果我们巧妙地使用这个波动方程,我们可以在一次拍摄中捕获词嵌入的时间和维度信息。

让我们看一下这个等式,在接下来的步骤中,我们将尝试把它形象化。

052682a0-cab3-11eb-9e57-12bb97331649.png

让我们考虑一个简单的句子,它被分词,然后它的词嵌入被提取。句子长度为5,嵌入维数为8。因此,每个单词都表示为1x8的向量。

现在我们在时间维度上取一个序列把正弦PE向量加到这个嵌入向量上。

进一步,我们对沿dim维数的其他向量做类似的操作。

本文在嵌入向量中交替加入正弦和余弦。如果dim是偶数,则sin级数相加,如果dim是奇数,则cos级数相加。

这很好地捕获了沿时间维度(或等式中描述的 pos 维度。我将 pos 和 time 互换使用,因为它们意味着相同的事情)但是如何也捕获沿dims维度的相对位置信息呢?这里的答案也在于等式本身。ω 项。

05f41878-cab3-11eb-9e57-12bb97331649.png

随着 i 从 0 增加到 d_embedding/2,频率也从 1/2π 减少到 1/(2π.10000)

因此我们看到,沿着无序方向的每个向量,位置的唯一性被捕获。该论文还描述了这种编码的鲁棒性。但是我仍然无法找出为什么特别使用数字 10000 进行位置编码(它可能是一个超参数吗?)。这个解释粗略地展示了如何使用正弦和余弦对于模型理解是非常合理和有效的。下面的图表本身讲述了位置编码如何随位置(时间)和尺寸变化。

人们可以很容易地看到,这些是简单的时频图,其中位置代表时间,深度代表频率。时间频率图已被用于从射电天文学到材料光谱分析的许多应用中。因此,从现有的现实世界系统构建类比确实可以更好地理解问题。

这是我对注意力机制中使用的位置编码的看法。在接下来的系列中,我将尝试撰写有关编码器-解码器部分的内容,并将注意力应用于现实世界的规模问题。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4827

    浏览量

    106795
  • 编码
    +关注

    关注

    6

    文章

    1015

    浏览量

    56650
  • rnn
    rnn
    +关注

    关注

    0

    文章

    91

    浏览量

    7300
  • LSTM
    +关注

    关注

    0

    文章

    62

    浏览量

    4295

原文标题:位置编码在注意机制中的作用

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    `lv_obj_tree.h` **LVGL v9** 位置作用

    lv_obj_tree.h LVGL v9 位置作用如下: 文件路径 lv_obj_tree.h 位于 LVGL 源码的 src/core/ 目录下,完整路径是: lvgl/
    发表于 11-13 15:49

    舵机伺服编码

    —— 没有编码器的反馈,舵机就无法判断自身是否到达目标位置,控制精度会大幅下降。 核心作用:实现 “闭环控制” 舵机伺服编码器的本质是为舵机提供 “
    的头像 发表于 10-30 10:05 92次阅读

    什么是伺服电机编码器?作用/关键技术/选型等一起看看吧!

    什么是伺服电机编码器? 伺服电机编码器是伺服系统的核心反馈元件,用于实时检测电机的转速、位置、角度等参数,并将信号反馈给控制器(如伺服驱动器),形成闭环控制,确保电机运动的精准性和稳
    的头像 发表于 06-09 11:07 2035次阅读
    什么是伺服电机<b class='flag-5'>编码</b>器?<b class='flag-5'>作用</b>/关键技术/选型等一起看看吧!

    工业相机焊缝跟踪的关键作用有哪些

    工业相机焊缝跟踪系统,扮演了捕捉、处理与反馈焊缝位置信息的核心角色,通过高速、高分辨率的图像采集,并结合智能算法的实时图像处理,成为焊缝跟踪系统的“眼睛”,能够
    的头像 发表于 05-13 17:56 540次阅读
    工业相机<b class='flag-5'>在</b>焊缝跟踪<b class='flag-5'>中</b>的关键<b class='flag-5'>作用</b>有哪些

    磁旋转编码永磁同步电机位置测量的应用(可下载)

    一、概述与直流电机相比,永磁同步电机具有体积小、 效率高、无需维护等优点,某些应用 场景,由位置传感器精度引起的转矩波动应限制 1%以内,这就要求电机
    发表于 04-09 13:37 0次下载

    SME150磁性位置编码机械臂中的应用

    工业自动化领域,精准的位置感知和控制,无疑是机械设备高效运转的核心要素。今天,我们要为您重磅介绍一款能够重塑机械臂应用体验的革命性产品 ——SME150 磁性位置编码器。
    的头像 发表于 04-02 17:50 904次阅读

    绝对值编码位置丢失是什么原因?有什么解决办法?

    绝对值编码位置丢失可能由多种原因引起,以下是一些常见原因及相应的解决办法: 一、原因分析 1. 电源干扰:    ● 错误的电压、电流或突然断电可能会影响编码器的读数,导致位置丢失
    的头像 发表于 03-16 17:17 3143次阅读

    编码器在手持喷码机上的作用

    速度,来保证打印效果。 总之结磁编码器下喷码机起到了精确速度、位置、方向的反馈。从而可以提高工人的工作效率和打印的质量。
    发表于 03-04 16:52

    拉线编码器:精准测量与位置反馈的核心装置

    现代工业与自动化领域中,精准与效率是推动技术进步的两大引擎。而在实现这一目标的过程,各类传感器与执行器发挥着至关重要的作用。其中,拉线编码器作为一种高效、精确的
    的头像 发表于 03-03 08:47 791次阅读

    绝对式编码伺服电机控制的应用与优势分析

    反馈传感器,能够直接提供电机的绝对位置信息。伺服电机控制系统,绝对值编码器作为反馈装置,起到了至关重要的作用。它带来了精确的
    的头像 发表于 02-06 09:46 1552次阅读
    绝对式<b class='flag-5'>编码</b>器<b class='flag-5'>在</b>伺服电机控制<b class='flag-5'>中</b>的应用与优势分析

    拉线编码器:工作原理与机械位移测量机制

    现代工业自动化和精密测量领域,拉线编码器以其高精度、可靠性和灵活性,成为了不可或缺的位移测量元件。它不仅能够实时监测机械部件的位置变化,还能将这些变化转化为电信号,供控制系统进行分析和处理。本文将
    的头像 发表于 02-06 08:33 1318次阅读
    拉线<b class='flag-5'>编码</b>器:工作原理与机械位移测量<b class='flag-5'>机制</b>

    编码道闸门上的应用

    编码道闸门应用上的特点和需要注意的事项
    的头像 发表于 02-05 15:00 560次阅读

    编码器的作用与功能解析

    现代工业自动化与精确控制领域,编码器作为一种关键的传感器设备,发挥着举足轻重的作用。它能够将机械位移转换成可读的数字信号或模拟信号,为各种控制系统提供精确的位置、速度或方向信息。本文
    的头像 发表于 01-24 08:41 2518次阅读
    <b class='flag-5'>编码</b>器的<b class='flag-5'>作用</b>与功能解析

    拉线式绝对值编码器:精准测量与位置反馈的可靠解决方案

    自动化与精密控制领域,精确的位置反馈是确保系统稳定运行和高效作业的核心要素。随着科技的进步,各种高精度的传感器应运而生,其中拉线式绝对值编码器以其独特的优势,众多应用
    的头像 发表于 01-20 08:40 856次阅读
    拉线式绝对值<b class='flag-5'>编码</b>器:精准测量与<b class='flag-5'>位置</b>反馈的可靠解决方案

    拉线编码器接线指南:步骤与注意事项

    工业自动化和控制系统,拉线编码器作为一种高精度的位置反馈装置,扮演着至关重要的角色。它能够准确测量线性位移,为各种机械设备提供精确的位置
    的头像 发表于 01-10 08:54 1231次阅读
    拉线<b class='flag-5'>编码</b>器接线指南:步骤与<b class='flag-5'>注意</b>事项