0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

图文详解:神经网络的激活函数

如意 来源: 人工智能遇见磐创 作者: 人工智能遇见磐创 2020-07-05 11:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

什么是神经网络激活函数?

激活函数有助于决定我们是否需要激活神经元。如果我们需要发射一个神经元那么信号的强度是多少。

激活函数是神经元通过神经网络处理和传递信息的机制

为什么在神经网络中需要一个激活函数?

图文详解:神经网络的激活函数

在神经网络中,z是输入节点与节点权值加上偏差的乘积。z的方程与线性方程非常相似,取值范围从+∞到-∞

图文详解:神经网络的激活函数

如果神经元的值可以从负无穷到正无穷变化,那么我们就无法决定是否需要激活神经元。这就是激活函数帮助我们解决问题的地方。

如果z是线性的,那么我们就不能解决复杂的问题。这是我们使用激活函数的另一个原因。

有以下不同类型的激活函数

阀值函数或阶梯激活函数

Sigmoid

Softmax

Tanh或双曲正切

ReLU

Leaky ReLU

为什么我们需要这么多不同的激活函数,我怎么决定用哪一个呢?

让我们回顾一下每一个激活函数,并了解它们的最佳使用位置和原因。这将帮助我们决定在不同的场景中使用哪个激活函数。

阀值函数或阶梯激活函数

图文详解:神经网络的激活函数

这是最简单的函数

如果z值高于阈值,则激活设置为1或yes,神经元将被激活。

如果z值低于阈值,则激活设置为0或no,神经元不会被激活。

它们对二分类很有用。】

Sigmoid激活函数

图文详解:神经网络的激活函数

Sigmoid函数是一种光滑的非线性函数,无扭结,形状类似于S形。

它预测输出的概率,因此被用于神经网络和逻辑回归的输出层。

由于概率范围在0到1之间,所以sigmoid函数值存在于0到1之间。

但是如果我们想分类更多的是或不是呢?如果我想预测多个类,比如预测晴天、雨天或阴天,该怎么办?

Softmax激活有助于多类分类

Softmax激活函数

Sigmoid激活函数用于两类或二类分类,而softmax用于多类分类,是对Sigmoid函数的一种推广。

在softmax中,我们得到了每个类的概率,它们的和应该等于1。当一个类的概率增大时,其他类的概率减小,因此概率最大的类是输出类。

例如:在预测天气时,我们可以得到输出概率,晴天为0.68,阴天为0.22,雨天为0.20。在这种情况下,我们以最大概率的输出作为最终的输出。在这种情况下我们预测明天将是晴天。

Softmax计算每个目标类的概率除以所有可能的目标类的概率。

图文详解:神经网络的激活函数

双曲正切或Tanh激活函数

图文详解:神经网络的激活函数

对于双曲tanh函数,输出以0为中心,输出范围在-1和+1之间。

看起来很像Sigmoid。实际上双曲tanh是缩放的s形函数。与Sigmoid相比,tanh的梯度下降作用更强,因此比Sigmoid更受欢迎。

tanh的优点是,负输入将被映射为强负,零输入将被映射为接近零,这在sigmoid中是不会发生的,因为sigmoid的范围在0到1之间

ReLU

图文详解:神经网络的激活函数

ReLU本质上是非线性的,这意味着它的斜率不是常数。Relu在0附近是非线性的,但斜率不是0就是1,因此具有有限的非线性。

范围是从0到∞

当z为正时,ReLU的输出与输入相同。当z为0或小于0时,输出为0。因此,当输入为0或低于0时,ReLU会关闭神经元。

所有的深度学习模型都使用Relu,但由于Relu的稀疏性,只能用于隐含层。稀疏性指的是空值或“NA”值的数量。

当隐层暴露于一定范围的输入值时,RELU函数将导致更多的零,从而导致更少的神经元被激活,这将意味着更少的神经网络交互作用。

ReLU比sigmoid或tanh更积极地打开或关闭神经元

Relu的挑战在于,负值变为零降低了模型正确训练数据的能力。为了解决这个问题,我们有Leaky ReLU

Leaky ReLU

图文详解:神经网络的激活函数

a的值通常是0.01

在Leaky ReLU中,我们引入了一个小的负斜率,所以它的斜率不是0。这有助于加快训练。

Leaky ReLU的范围从-∞到+∞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4842

    浏览量

    108152
  • 函数
    +关注

    关注

    3

    文章

    4421

    浏览量

    67822
  • 神经元
    +关注

    关注

    1

    文章

    369

    浏览量

    19192
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为什么 VisionFive V1 板上的 JH7100 中并存 NVDLA 引擎和神经网络引擎?

    我想知道为什么 VisionFive V1 板上的 JH7100 中并存 NVDLA 引擎和神经网络引擎,请问?您能否举一些关于他们的用例的例子?
    发表于 03-25 06:01

    神经网络的初步认识

    日常生活中的智能应用都离不开深度学习,而深度学习则依赖于神经网络的实现。什么是神经网络神经网络的核心思想是模仿生物神经系统的结构,特别是大脑中神经
    的头像 发表于 12-17 15:05 458次阅读
    <b class='flag-5'>神经网络</b>的初步认识

    激活函数ReLU的理解与总结

    激活函数的作用 神经网络中使用激活函数来加入非线性因素,提高模型的表达能力。 如果不用激励函数
    发表于 10-31 06:16

    CNN卷积神经网络设计原理及在MCU200T上仿真测试

    的提出很大程度的解决了BP算法在优化深层神经网络时的梯度耗散问题。当x&gt;0 时,梯度恒为1,无梯度耗散问题,收敛快;当x&lt;0 时,该层的输出为0。 CNN
    发表于 10-29 07:49

    NMSISI库的使用

    :   神经网络卷积函数   神经网络激活函数   全连接层函数   
    发表于 10-29 07:07

    NMSIS神经网络库使用介绍

    :   神经网络卷积函数   神经网络激活函数   全连接层函数   
    发表于 10-29 06:08

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    , batch_size=512, epochs=20)总结 这个核心算法中的卷积神经网络结构和训练过程,是用来对MNIST手写数字图像进行分类的。模型将图像作为输入,通过卷积和池化层提取图像的特征,然后通过全连接层进行分类预测。训练过程中,模型通过最小化损失函数来优化
    发表于 10-22 07:03

    CICC2033神经网络部署相关操作

    在完成神经网络量化后,需要将神经网络部署到硬件加速器上。首先需要将所有权重数据以及输入数据导入到存储器内。 在仿真环境下,可将其存于一个文件,并在 Verilog 代码中通过 readmemh 函数
    发表于 10-20 08:00

    液态神经网络(LNN):时间连续性与动态适应性的神经网络

    1.算法简介液态神经网络(LiquidNeuralNetworks,LNN)是一种新型的神经网络架构,其设计理念借鉴自生物神经系统,特别是秀丽隐杆线虫的神经结构,尽管这种微生物的
    的头像 发表于 09-28 10:03 1548次阅读
    液态<b class='flag-5'>神经网络</b>(LNN):时间连续性与动态适应性的<b class='flag-5'>神经网络</b>

    神经网络的并行计算与加速技术

    随着人工智能技术的飞速发展,神经网络在众多领域展现出了巨大的潜力和广泛的应用前景。然而,神经网络模型的复杂度和规模也在不断增加,这使得传统的串行计算方式面临着巨大的挑战,如计算速度慢、训练时间长等
    的头像 发表于 09-17 13:31 1290次阅读
    <b class='flag-5'>神经网络</b>的并行计算与加速技术

    基于神经网络的数字预失真模型解决方案

    在基于神经网络的数字预失真(DPD)模型中,使用不同的激活函数对整个系统性能和能效有何影响?
    的头像 发表于 08-29 14:01 3661次阅读

    无刷电机小波神经网络转子位置检测方法的研究

    摘要:论文通过对无刷电机数学模型的推导,得出转角:与三相相电压之间存在映射关系,因此构建了一个以三相相电压为输人,转角为输出的小波神经网络来实现转角预测,并采用改进遗传算法来训练网络结构与参数,借助
    发表于 06-25 13:06

    神经网络专家系统在电机故障诊断中的应用

    摘要:针对传统专家系统不能进行自学习、自适应的问题,本文提出了基于种经网络专家系统的并步电机故障诊断方法。本文将小波神经网络和专家系统相结合,充分发挥了二者故障诊断的优点,很大程度上降低了对电机
    发表于 06-16 22:09

    神经网络RAS在异步电机转速估计中的仿真研究

    众多方法中,由于其结构简单,稳定性好广泛受到人们的重视,且已被用于产品开发。但是MRAS仍存在在低速区速度估计精度下降和对电动机参数变化非常敏感的问题。本文利用神经网络的特点,使估计更为简单、快速
    发表于 06-16 21:54

    基于FPGA搭建神经网络的步骤解析

    本文的目的是在一个神经网络已经通过python或者MATLAB训练好的神经网络模型,将训练好的模型的权重和偏置文件以TXT文件格式导出,然后通过python程序将txt文件转化为coe文件,(coe
    的头像 发表于 06-03 15:51 1498次阅读
    基于FPGA搭建<b class='flag-5'>神经网络</b>的步骤解析