电子发烧友网>电子资料下载>电子资料>PyTorch教程15.4之预训练word2vec

PyTorch教程15.4之预训练word2vec

2512862 2023-06-05 | pdf | 0.14 MB | 次下载 | 免费

资料介绍

我们继续实现 15.1 节中定义的 skip-gram 模型。然后我们将在 PTB 数据集上使用负采样来预训练 word2vec。首先，让我们通过调用函数来获取数据迭代器和这个数据集的词汇表，这在第 15.3 节d2l.load_data_ptb中有描述

						import math
import torch
from torch import nn
from d2l import torch as d2l

batch_size, max_window_size, num_noise_words = 512, 5, 5
data_iter, vocab = d2l.load_data_ptb(batch_size, max_window_size,
                   num_noise_words)

						 

						Downloading ../data/ptb.zip from http://d2l-data.s3-accelerate.amazonaws.com/ptb.zip...

					

						import math
from mxnet import autograd, gluon, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

batch_size, max_window_size, num_noise_words = 512, 5, 5
data_iter, vocab = d2l.load_data_ptb(batch_size, max_window_size,
                   num_noise_words)

						 

15.4.1。Skip-Gram 模型

我们通过使用嵌入层和批量矩阵乘法来实现 skip-gram 模型。首先，让我们回顾一下嵌入层是如何工作的。

15.4.1.1。嵌入层

如第 10.7 节所述，嵌入层将标记的索引映射到其特征向量。该层的权重是一个矩阵，其行数等于字典大小 ( input_dim)，列数等于每个标记的向量维数 ( output_dim)。一个词嵌入模型训练好之后，这个权重就是我们所需要的。

								embed = nn.Embedding(num_embeddings=20, embedding_dim=4)
print(f'Parameter embedding_weight ({embed.weight.shape}, '
   f'dtype={embed.weight.dtype})')

								 

								Parameter embedding_weight (torch.Size([20, 4]), dtype=torch.float32)

							

								embed = nn.Embedding(input_dim=20, output_dim=4)
embed.initialize()
embed.weight

								 

								Parameter embedding0_weight (shape=(20, 4), dtype=float32)

							

嵌入层的输入是标记（单词）的索引。对于任何令牌索引i，它的向量表示可以从ith嵌入层中权重矩阵的行。由于向量维度 ( output_dim) 设置为 4，因此嵌入层返回形状为 (2, 3, 4) 的向量，用于形状为 (2, 3) 的标记索引的小批量。

								x = torch.tensor([[1, 2, 3], [4, 5, 6]])
embed(x)

								tensor([[[-0.6501, 1.3547, 0.7968, 0.3916],
     [ 0.4739, -0.0944, 1.2308, 0.6457],
     [ 0.4539, 1.5194, 0.4377, -1.5122]],

    [[-0.7032, -0.1213, 0.2657, -0.6797],
     [ 0.2930, -0.6564, 0.8960, -0.5637],
     [-0.1815, 0.9487, 0.8482, 0.5486]]], grad_fn=<EmbeddingBackward0>)

							

								x = np.array([[1, 2, 3], [4, 5, 6]])
embed(x)

								array([[[ 0.01438687, 0.05011239, 0.00628365, 0.04861524],
    [-0.01068833, 0.01729892, 0.02042518, -0.01618656],
    [-0.00873779, -0.02834515, 0.05484822, -0.06206018]],

    [[ 0.06491279, -0.03182812, -0.01631819, -0.00312688],
    [ 0.0408415 , 0.04370362, 0.00404529, -0.0028032 ],
    [ 0.00952624, -0.01501013, 0.05958354, 0.04705103]]])

							

15.4.1.2。定义前向传播

在正向传播中，skip-gram 模型的输入包括形状为（批大小，1）的中心词索引和形状为（批大小，）center的连接上下文和噪声词索引，其中定义在第 15.3.5 节. 这两个变量首先通过嵌入层从标记索引转换为向量，然后它们的批量矩阵乘法（在第 11.3.2.2 节中描述）返回形状为（批量大小，1，）的输出。输出中的每个元素都是中心词向量与上下文或噪声词向量的点积。contexts_and_negativesmax_lenmax_lenmax_len

								def skip_gram(center, contexts_and_negatives, embed_v, embed_u):
  v = embed_v(center)
  u = embed_u(contexts_and_negatives)
  pred = torch.bmm(v, u.permute(0, 2, 1))
  return pred

								 

								def skip_gram(center, contexts_and_negatives, embed_v, embed_u):
  v = embed_v(center)
  u = embed_u(contexts_and_negatives)
  pred = npx.batch_dot(v, u.swapaxes(1, 2))
  return pred

								 

skip_gram让我们为一些示例输入打印此函数的输出形状。

								skip_gram(torch.ones((2, 1), dtype=torch.long),
     torch.ones((2, 4), dtype=torch.long), embed, embed).shape

								torch.Size([2, 1, 4])

							

								skip_gram(np.ones((2, 1)), np.ones((2, 4)), embed, embed).shape

								 

								(2, 1, 4)

							

15.4.2。训练

在用负采样训练skip-gram模型之前，我们先定义它的损失函数。

15.4.2.1。二元交叉熵损失

根据15.2.1节负采样损失函数的定义，我们将使用二元交叉熵损失。

								class SigmoidBCELoss(nn.Module):
  # Binary cross-entropy loss with masking
  def __init__(self):
    super().__init__()

  def forward(self, inputs, target, mask=None):
    out = nn.functional.binary_cross_entropy_with_logits(
      inputs, target, weight=mask, reduction="none")
    return out.mean(dim=1)

loss = SigmoidBCELoss()

								 

								loss = gluon.loss.SigmoidBCELoss()

								 

回想我们在第 15.3.5 节中对掩码变量和标签变量的描述。下面计算给定变量的二元交叉熵损失。

								pred = torch.tensor([[1.1, -2.2, 3.3, -4.4]] * 2)
label = torch.tensor([[1.0, 0.0, 0.0, 0.0], [0.0, 1.0, 0.0, 0.0]])
mask = torch.tensor([[1, 1, 1, 1], [1, 1, 0, 0]])
loss(pred, label, mask) * mask.shape[1] / mask.sum(axis=1)

								 

								tensor([0.9352, 1.8462])

							

								pred = np.array([[1.1, -2.2, 3.3, -4.4]] * 2)
label = np.array([[1.0, 0.0, 0.0, 0.0], [0.0, 1.0, 0.0, 0.0]])
mask = np.array([[1,
							

下载该资料的人也在下载下载该资料的人还在阅读

更多 >

PyTorch教程11.9之使用Transformer进行大规模预训练 0次下载
PyTorch教程13.5之在多个GPU上进行训练 0次下载
PyTorch教程之15.2近似训练 1次下载
PyTorch教程15.9之预训练BERT的数据集 0次下载
PyTorch教程15.10之预训练BERT 0次下载
开源软件-phpword2vec PHP调用word2vec实现机器学习 0次下载
Labview做的PDF转Word小程序源码分享 46次下载
基于主题分布优化的模糊文本分类方法 5次下载
融合内容与多特征计算的个性化微博推荐模型 6次下载
基于单词贡献度和Word2Vec词向量的文档表示方法 2次下载
基于BERT+Bo-LSTM+Attention的病历短文分类模型 13次下载
基于预训练模型和长短期记忆网络的深度学习模型 19次下载
基于关键字的自定义古诗句生成设计与实现 20次下载
一种面向铁路文本分类的字符级特征提取方法 10次下载
如何使用Word2vec模型进行古诗词个性化推荐的应用 12次下载

基于PyTorch的模型并行分布式训练Megatron解析 826次阅读
基于PyTorch AMD的解决方案 447次阅读
Pytorch Hub两行代码搞定YOLOv5推理 670次阅读
自训练Pytorch模型使用OpenVINO™优化并部署在AI爱克斯开发板 549次阅读
pytorch实现断电继续训练时需要注意的要点 1034次阅读
PyTorch 的 Autograd 机制和使用 797次阅读
自然语言处理的ELMO使用 3042次阅读
讨论嵌入的概念，以及使用word2vec生成嵌入的机制 2929次阅读
一文解构PyTorch：深入了解PyTorch内部机制 3623次阅读
详解谷歌最强NLP模型BERT 2702次阅读
重读Youtube深度学习推荐系统论文不同体验和收获 2463次阅读
词对嵌入技术，可以改善现有模型在跨句推理上的表现 2803次阅读
OpenAI：用可扩展的多任务系统，在多语言任务上取得了良好的成绩 1856次阅读
介绍Word2Vec和Glove这两种最流行的词嵌入方法背后的直觉 5.8w次阅读
Python自然语言用金庸的武侠小说做分析和处理 7878次阅读

资料 -- | 积分 --

查看他上传的所有资料

+关注个人主页

上传资料赚积分

下载排行

本周

1山景DSP芯片AP8248A2数据手册
1.06 MB | 532次下载 | 免费
2RK3399完整板原理图（支持平板，盒子VR）
3.28 MB | 339次下载 | 免费
3TC358743XBG评估板参考手册
1.36 MB | 330次下载 | 免费
4DFM软件使用教程
0.84 MB | 295次下载 | 免费
5元宇宙深度解析—未来的未来-风口还是泡沫
6.40 MB | 227次下载 | 免费
6迪文DGUS开发指南
31.67 MB | 194次下载 | 免费
7元宇宙底层硬件系列报告
13.42 MB | 182次下载 | 免费
8FP5207XR-G1中文应用手册
1.09 MB | 178次下载 | 免费

本月

1OrCAD10.5下载OrCAD10.5中文版软件
0.00 MB | 234315次下载 | 免费
2555集成电路应用800例(新编版)
0.00 MB | 33566次下载 | 免费
3接口电路图大全
未知 | 30323次下载 | 免费
4开关电源设计实例指南
未知 | 21549次下载 | 免费
5电气工程师手册免费下载(新编第二版pdf电子书)
0.00 MB | 15349次下载 | 免费
6数字电路基础pdf(下载)
未知 | 13750次下载 | 免费
7电子制作实例集锦下载
未知 | 8113次下载 | 免费
8《LED驱动电路设计》温德尔著
0.00 MB | 6656次下载 | 免费

总榜

1matlab软件下载入口
未知 | 935054次下载 | 免费
2protel99se软件下载(可英文版转中文版)
78.1 MB | 537798次下载 | 免费
3MATLAB 7.1 下载 (含软件介绍)
未知 | 420027次下载 | 免费
4OrCAD10.5下载OrCAD10.5中文版软件
0.00 MB | 234315次下载 | 免费
5Altium DXP2002下载入口
未知 | 233046次下载 | 免费
6电路仿真软件multisim 10.0免费下载
340992 | 191187次下载 | 免费
7十天学会AVR单片机与C语言视频教程下载
158M | 183279次下载 | 免费
8proe5.0野火版下载(中文版免费下载)
未知 | 138040次下载 | 免费

搜索历史