PyTorch已为我们实现了大多数常用的非线性激活函数-电子发烧友网

PyTorch已为我们实现了大多数常用的非线性激活函数，我们可以像使用任何其他的层那样使用它们。让我们快速看一个在PyTorch中使用ReLU激活函数的例子：

在上面这个例子中，输入是包含两个正值、两个负值的张量，对其调用ReLU函数，负值将取为0，正值则保持不变。

现在我们已经了解了构建神经网络架构的大部分细节，我们来构建一个可用于解决真实问题的深度学习架构。上一章中，我们使用了简单的方法，因而可以只关注深度学习算法如何工作。后面将不再使用这种方式构建架构，而是使用PyTorch中正常该用的方式构建。

1．PyTorch构建深度学习算法的方式

PyTorch中所有网络都实现为类，创建PyTorch类的子类要调用nn.Module，并实现__init__和forward方法。在init方法中初始化层，这一点已在前一节讲过。在forward方法中，把输入数据传给init方法中初始化的层，并返回最终的输出。非线性函数经常被forward函数直接使用，init方法也会使用一些。下面的代码片段展示了深度学习架构是如何用PyTrorch实现的：

如果你是Python新手，上述代码可能会比较难懂，但它全部要做的就是继承一个父类，并实现父类中的两个方法。在Python中，我们通过将父类的名字作为参数传入来创建子类。init方法相当于Python中的构造器，super方法用于将子类的参数传给父类，我们的例子中父类就是nn.Module。

2．不同机器学习问题的模型架构

待解决的问题种类将基本决定我们将要使用的层，处理序列化数据问题的模型从线性层开始，一直到长短期记忆（LSTM）层。基于要解决的问题类别，最后一层是确定的。使用机器学习或深度学习算法解决的问题通常有三类，最后一层的情况通常如下。

对于回归问题，如预测T恤衫的销售价格，最后使用的是有一个输出的线性层，输出值为连续的。

将一张给定的图片归类为T恤衫或衬衫，用到的是sigmoid激活函数，因为它的输出值不是接近1就是接近0，这种问题通常称为二分类问题。

对于多类别分类问题，如必须把给定的图片归类为T恤、牛仔裤、衬衫或连衣裙，网络最后将使用softmax层。让我们抛开数学原理来直观理解softmax的作用。举例来说，它从前一线性层获取输入，并输出给定数量样例上的概率。在我们的例子中，将训练它预测每个图片类别的4种概率。记住，所有概率相加的总和必然为1。

3．损失函数

一旦定义好了网络架构，还剩下最重要的两步。一步是评估网络执行特定的回归或分类任务时表现的优异程度，另一步是优化权重。

优化器（梯度下降）通常接受一个标量值，因而loss函数应生成一个标量值，并使其在训练期间最小化。某些用例，如预测道路上障碍物的位置并判断是否为行人，将需要两个或更多损失函数。即使在这样的场景下，我们也需要把损失组合成一个优化器可以最小化的标量。最后一章将详细讨论把多个损失值组合成一个标量的真实例子。

上一章中，我们定义了自己的loss函数。PyTorch提供了经常使用的loss函数的实现。我们看看回归和分类问题的loss函数。

回归问题经常使用的loss函数是均方误差（MSE）。它和前面一章实现的loss函数相同。可以使用PyTorch中实现的loss函数，如下所示：

对于分类问题，我们使用交叉熵损失函数。在介绍交叉熵的数学原理之前，先了解下交叉熵损失函数做的事情。它计算用于预测概率的分类网络的损失值，损失总和应为1，就像softmax层一样。当预测概率相对正确概率发散时，交叉熵损失增加。例如，如果我们的分类算法对图3.5为猫的预测概率值为0.1，而实际上这是只熊猫，那么交叉熵损失就会更高。如果预测的结果和真实标签相近，那么交叉熵损失就会更低。

下面是用Python代码实现这种场景的例子。

为了在分类问题中使用交叉熵损失，我们真的不需要担心内部发生的事情——只要记住，预测差时损失值高，预测好时损失值低。PyTorch提供了loss函数的实现，可以按照如下方式使用。

PyTorch包含的其他一些loss函数如表3.1所示。

表3.1

L1 loss 通常作为正则化器使用；第4章将进一步讲述

MSE loss 均方误差损失，用于回归问题的损失函数

Cross-entropy loss 交叉熵损失，用于二分类和多类别分类问题

NLL Loss 用于分类问题，允许用户使用特定的权重处理不平衡数据集

NLL Loss2d 用于像素级分类，通常和图像分割问题有关

4．优化网络架构

计算出网络的损失值后，需要优化权重以减少损失，并改善算法准确率。简单起见，让我们看看作为黑盒的优化器，它们接受损失函数和所有的学习参数，并微量调整来改善网络性能。PyTorch提供了深度学习中经常用到的大多数优化器。如果大家想研究这些优化器内部的动作，了解其数学原理，强烈建议浏览以下博客：

PyTorch提供的一些常用的优化器如下：

ADADELTA

Adagrad

Adam

SparseAdam

Adamax

ASGD

LBFGS

RMSProp

Rprop

SGD

审核编辑黄昊宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

非线性

非线性

+关注

关注
1

文章
172

浏览量
22905
函数

函数

+关注

关注
3

文章
3882

浏览量
61310
pytorch

pytorch

+关注

关注
2

文章
762

浏览量
12836

STM32L451用USB I2C发送擦除指令后，大多数情况接收到的是NACK的值，为什么？

发送擦除指令后，大多数情况接收到的是NACK的值

发表于 03-28 08:17

线性电阻和非线性电阻的区别

线性电阻和非线性电阻的区别线性电阻和非线性电阻是两种常见的电子元件，它们在电路中具有不同的特性和行为。本文将详尽、详实、细致地讨论线性电

发表于 12-07 17:03 •743次阅读

什么是集成运放的非线性区？集成运放工作在线性区和非线性区有什么区别？

什么是集成运放的非线性区？集成运放工作在线性区和非线性区有什么区别？集成运放的非线性区是指在其输入信号超过一定范围时，输出信号的增益不再保持线性

发表于 11-22 16:18 •2470次阅读

线性负载什么意思？非线性负载是什么意思？

线性负载什么意思？非线性负载是什么意思？线性负载是指在电路中，电流和电压之间的关系是线性的，也就是电压与电流成比例的关系。线性负载通常包括

发表于 11-13 16:10 •1251次阅读

S/H非线性如何？S/H非线性的重要部分如何随输入频率变化？

S/H非线性如何？S/H非线性的重要部分如何随输入频率变化？ S/H（Sample and Hold）是一种常用的电路，用于将模拟信号转换为数字信号。它由采样电路和保持电路组成，采样电路用来对输入

发表于 10-31 09:41 •318次阅读

ADC知识—直流参数（输入电压参考，参考电流输入，积分非线性误差，差分非线性误差）

大多数数据手册中，将它定义为一个特定的参考电压值，通常这个电压作为此转换器最常用的参考电压。

发表于 10-17 12:22 •1580次阅读

为什么说二极管是一种非线性器件

为什么说二极管是一种非线性器件二极管是一种电子器件，由带有P型半导体（正极）和N型半导体（负极）的半导体材料制成。它是电子行业中最常用的器件之一。因为它具有一个非常重要的特性——非线性，所以

发表于 09-02 10:13 •1812次阅读

神经网络基本的训练和工作原理是什么

在两层神经网络之间，必须有激活函数连接，从而加入非线性因素，提高神经网络的能力。所以，我们先从激活函数

发表于 08-07 10:02 •520次阅读

大多数人5G随身WiFi用户被商家引导，如何避免“劣质”随身WiFi？

大多数5G随身WiFi商家，所吹捧的宣传点，基本和网速快慢及稳定性完全不相关。我们以电商平台上，随机4款5G随身WiFi产品详情为例。

发表于 07-19 15:29 •807次阅读

在约束条件下优化非线性目标函数的问题

非线性规划是一类在约束条件下优化非线性目标函数的问题。以下是几个常见的非线性规划算法。

发表于 06-15 09:33 •556次阅读

混频器是线性还是非线性？

混频器（Mixer）是一种非线性器件。它常用于无线通信系统中的频率转换和调制解调等应用。混频器将两个或多个输入信号进行非线性混合，产生新的输出信号，其频率为输入信号频率之和或差。这种非线性

发表于 06-07 10:20 •563次阅读

PyTorch教程23.7之效用函数和类

电子发烧友网站提供《PyTorch教程23.7之效用函数和类.pdf》资料免费下载

发表于 06-06 09:19 •0次下载

PyTorch教程2.3之线性代数

电子发烧友网站提供《PyTorch教程2.3之线性代数.pdf》资料免费下载

发表于 06-05 11:32 •1次下载

PyTorch教程3.1之线性回归

电子发烧友网站提供《PyTorch教程3.1之线性回归.pdf》资料免费下载

发表于 06-05 11:30 •0次下载

PyTorch教程3.5之线性回归的简洁实现

电子发烧友网站提供《PyTorch教程3.5之线性回归的简洁实现.pdf》资料免费下载

发表于 06-05 11:28 •0次下载