深度学习最常见的26个模型汇总-电子发烧友网

今天更新关于常见深度学习模型适合练手的项目。这些项目大部分是我之前整理的，基本上都看过，大概俩特点：代码不长，一般50-200行代码，建议先看懂然后再实现和优化，我看基本上所有的实现都有明显可优化的地方；五脏俱全，虽然代码不长，但是该有的功能都有，该包含的部分也基本都有。所以很适合练手，而且实现后还可保存好，以后很多任务可能就会用到。

本文包括简介、练手项目和我的建议（建议最好看看这部分）。

简介

本篇是深度学习最常见的 26 个模型汇总的姐妹篇，建议先看那篇再看本篇。本篇新增了 26 个模型的练手项目。

练手项目

2.1 Feed forward neural networks (FF or FFNN) and perceptrons (P)

前馈神经网络和感知机，信息从前（输入）往后（输出）流动，一般用反向传播（BP）来训练。算是一种监督学习。

对应的代码：

https://github.com/danijar/layered

https://github.com/civisanalytics/muffnn

2.2 Radial basis function (RBF)

径向基函数网络，是一种径向基函数作为激活函数的FFNNs（前馈神经网络）。

对应的代码：

https://github.com/eugeniashurko/rbfnnpy

2.3 Hopfield network (HN)

Hopfield网络，是一种每个神经元都跟其它神经元相连接的神经网络。

对应的代码：

https://github.com/yosukekatada/Hopfield_network

2.4 Markov chains (MC or discrete time Markov Chain, DTMC)

马尔可夫链或离散时间马尔可夫链，算是BMs和HNs的雏形。

对应的代码：

Markov chains：https://github.com/jsvine/markovify

DTMC：https://github.com/AndrewWalker/dtmc

2.5 Boltzmann machines (BM)

玻尔兹曼机，和Hopfield网络很类似，但是：一些神经元作为输入神经元，剩余的是隐藏层。

对应的代码：

https://github.com/yell/boltzmann-machines

2.6 Restricted Boltzmann machines (RBM)

受限玻尔兹曼机，和玻尔兹曼机以及Hopfield网络都比较类似。

对应的代码：

https://github.com/echen/restricted-boltzmann-machines

2.7 Autoencoders (AE)

自动编码，和FFNN有些类似，它更像是FFNN的另一种用法，而不是本质上完全不同的另一种架构。

对应的代码：

https://github.com/caglar/autoencoders/blob/master/ae.py

2.8 Sparse autoencoders (SAE)

稀疏自动编码，跟自动编码在某种程度比较相反。

对应的代码：

https://github.com/caglar/autoencoders/blob/master/sa.py

2.9 Variational autoencoders (VAE)

变分自动编码，和AE架构相似，不同的是：输入样本的一个近似概率分布。这使得它跟BM、RBM更相近。

对应的代码：

https://github.com/mattjj/svae

2.10 Denoising autoencoders (DAE)

去噪自动编码，也是一种自编码机，它不仅需要训练数据，还需要带噪音的训练数据。

对应对应的代码：

https://github.com/caglar/autoencoders/blob/master/da.py

2.11 Deep belief networks (DBN）

深度信念网络，由多个受限玻尔兹曼机或变分自动编码堆砌而成。

对应的代码：

https://github.com/albertbup/deep-belief-network

2.12 Convolutional neural networks (CNN or deep convolutional neural networks, DCNN)

卷积神经网络，这个不解释也都知道。

对应的代码：

CNN：https://github.com/bamtercelboo/cnn-lstm-bilstm-deepcnn-clstm-in-pytorch/blob/master/models/model_CNN.py

DCNN：https://github.com/bamtercelboo/cnn-lstm-bilstm-deepcnn-clstm-in-pytorch/blob/master/models/model_DeepCNN.py

2.13 Deconvolutional networks (DN)

去卷积网络，又叫逆图形网络，是一种逆向的卷积神经网络。

对应的代码：

https://github.com/ifp-uiuc/anna

2.14Deep convolutional inverse graphics networks (DCIGN)

深度卷积逆向图网络，实际上是VAE，且分别用CNN、DNN来作编码和解码。

对应的代码：

https://github.com/yselivonchyk/TensorFlow_DCIGN

2.15 Generative adversarial networks (GAN)

生成对抗网络，Goodfellow的封神之作，这个模型不用解释也都知道。

对应的代码：

https://github.com/devnag/pytorch-generative-adversarial-networks

2.16 Recurrent neural networks (RNN)

循环神经网络，这个更不用解释，做语音、NLP的没有人不知道，甚至非AI相关人员也知道。

对应的代码：

https://github.com/farizrahman4u/recurrentshop

2.17 Long / short term memory (LSTM)

长短期记忆网络，RNN的变种，解决梯度消失/爆炸的问题，也不用解释，这几年刷爆各大顶会。

对应的代码：

https://github.com/bamtercelboo/cnn-lstm-bilstm-deepcnn-clstm-in-pytorch/blob/master/models/model_LSTM.py

2.18 Gated recurrent units (GRU)

门循环单元，类似LSTM的定位，算是LSTM的简化版。

对应的代码：

https://github.com/bamtercelboo/cnn-lstm-bilstm-deepcnn-clstm-in-pytorch/blob/master/models/model_GRU.py

2.19 Neural Turing machines (NTM)

神经图灵机，LSTM的抽象，以窥探LSTM的内部细节。具有读取、写入、修改状态的能力。

对应的代码：

https://github.com/MarkPKCollier/NeuralTuringMachine

2.20 Bidirectional recurrent neural networks, bidirectional long / short term memory networks and bidirectional gated recurrent units (BiRNN, BiLSTM and BiGRU respectively)

双向循环神经网络、双向长短期记忆网络和双向门控循环单元，把RNN、双向的LSTM、GRU双向，不再只是从左到右，而是既有从左到右又有从右到左。

对应的代码：

BiRNN：https://github.com/cstghitpku/cnn-lstm-bilstm-deepcnn-clstm-in-pytorch/tree/master/models

BiLSTM：https://github.com/bamtercelboo/cnn-lstm-bilstm-deepcnn-clstm-in-pytorch/blob/master/models/model_BiLSTM.py

BiGRU：https://github.com/bamtercelboo/cnn-lstm-bilstm-deepcnn-clstm-in-pytorch/blob/master/models/model_BiGRU.py

2.21 Deep residual networks (DRN)

深度残差网络，是非常深的FFNN，它可以把信息从某一层传至后面几层（通常2-5层）。

对应的代码：

https://github.com/KaimingHe/deep-residual-networks

2.22 Echo state networks (ESN)

回声状态网络，是另一种不同类型的（循环）网络。

对应的代码：

https://github.com/m-colombo/Tensorflow-EchoStateNetwork

2.23 Extreme learning machines (ELM)

极限学习机，本质上是随机连接的FFNN。

对应的代码：

https://github.com/dclambert/Python-ELM

2.24 Liquid state machines (LSM)

液态机，跟ESN类似，区别是用阈值激活函数取代了sigmoid激活函数。

对应的代码：

https://github.com/kghose/Liquid

2.25 Support vector machines (SVM)

支持向量机，入门机器学习的人都知道，不解释。

对应的代码：

https://github.com/ajtulloch/svmpy

2.26 Kohonen networks (KN, also self organising (feature) map, SOM, SOFM)

Kohonen 网络，也称之为自组织（特征）映射。

对应的代码KN/SOM：

https://github.com/mljs/som

后续建议

我个人感觉能力提升最快的方式是：先横向学习一个领域，做到全面的认识；然后从头到尾一项一项去突破，做到有深度。如果今天学点这个，明天学点那个，水平提升很慢，建议顺着技术发展的主线从头到尾学完。技术是无止境的，积累很重要，但有量远远不够，还得讲究方法。

对应到本文，学会并实现和优化这些模型，远远不够。我建议还可以有如下尝试：

单层模型实现之后，试试多层或者模型stack；

试试模型的结合，比如LSTM/GRU+CNN/DCNN、CNN/DCNN+LSTM/GRU、LSTM/GRU+CRF等；

在一些模型上加attention（这里很多模型适合加）；

利用这些模型解决一些比较简单的小问题，比如用CNN识别数字、LSTM+CRF做NER等；

性能方面的提升，比如支持分布式训练、支持GPU等；

把这些模型做成一个框架，到时候记得通知我，我一定拜读。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4570

浏览量
98714
模型

模型

+关注

关注
1

文章
2704

浏览量
47674
深度学习

深度学习

+关注

关注
73

文章
5235

浏览量
119893

原文标题：上手！深度学习最常见的26个模型练习项目汇总

文章出处：【微信号：rgznai100，微信公众号：rgznai100】欢迎添加关注！文章转载请注明出处。

列举了20个最常见的电路

为电子工程师的你，已经掌握了多少模拟电路呢？还应该掌握多少图纸和原理呢？本文列举了20个最常见的电路，并粗略的推断出不同层次的发烧对线路的不同理解程度，快来对照看看你是哪个程度的电子工程师。　　一

发表于 05-21 07:35

为什么说FPGA是机器深度学习的未来？

都出现了重大突破。深度学习是这些领域中所最常使用的技术，也被业界大为关注。然而，深度学习模型需要

发表于 10-10 06:45

labview测试tensorflow深度学习SSD模型识别物体

安装labview2019 vision，自带深度学习推理工具，支持tensorflow模型。配置好python下tensorflow环境配置好object_detection API下载SSD

发表于 08-16 17:21

labview调用深度学习tensorflow模型非常简单，附上源码和模型

本帖最后由 wcl86 于 2021-9-9 10:39 编辑 `labview调用深度学习tensorflow模型非常简单，效果如下，附上源码和训练过的模型：[hide][/h

发表于 06-03 16:38

深度融合模型的特点

深度融合模型的特点，背景深度学习模型在训练完成之后，部署并应用在生产环境的这一步至关重要，毕竟训练出来的

发表于 07-16 06:08

深度学习存在哪些问题？

深度学习常用模型有哪些？深度学习常用软件工具及平台有哪些？深度

发表于 10-14 08:20

深度学习模型是如何创建的？

具有深度学习模型的嵌入式系统应用程序带来了巨大的好处。深度学习嵌入式系统已经改变了各个行业的企业和组织。

发表于 10-27 06:34

什么是深度学习？使用FPGA进行深度学习的好处？

什么是深度学习为了解释深度学习，有必要了解神经网络。神经网络是一种模拟人脑的神经元和神经网络的计算模型。作为具体示例，让我们考虑一

发表于 02-17 16:56

根据美团“猜你喜欢”来深度学习排序模型实践

本文将主要介绍深度学习模型在美团平台推荐排序场景下的应用和探索。

发表于 04-02 09:35 •6107次阅读

基于深度学习模型的点云目标检测及ROS实现

近年来，随着深度学习在图像视觉领域的发展，一类基于单纯的深度学习模型的点云目标检测方法被提出和应用，本文将详细介绍其中一种

发表于 11-05 16:47 •1.7w次阅读

详解机器学习和深度学习常见的正则化

说到正则化大家应该都不陌生，这个在机器学习和深度学习中都是非常常见的，常用的正则化有L1正则化和L2正则化。提到正则化大家就会想到是它会将权重添加到损失函数计算中来降低

发表于 01-29 17:52 •1982次阅读

深度模型中的优化与学习课件下载

深度模型中的优化与学习课件下载

发表于 04-07 16:21 •3次下载

移植深度学习算法模型到海思AI芯片

本文大致介绍将深度学习算法模型移植到海思AI芯片的总体流程和一些需要注意的细节。海思芯片移植深度学习算法

发表于 01-26 19:42 •11次下载

大模型为什么是深度学习的未来？

与传统机器学习相比，深度学习是从数据中学习，而大模型则是通过使用大量的模型来训练数据。

发表于 02-16 11:32 •1658次阅读

深度学习框架是什么？深度学习框架有哪些？

高模型的精度和性能。随着人工智能和机器学习的迅猛发展，深度学习框架已成为了研究和开发人员们必备的工具之一。目前，市场上存在许多深度

发表于 08-17 16:03 •1739次阅读

搜索历史

深度学习最常见的26个模型汇总

评论

列举了20个最常见的电路

为什么说FPGA是机器深度学习的未来？

labview测试tensorflow深度学习SSD模型识别物体

labview调用深度学习tensorflow模型非常简单，附上源码和模型

深度融合模型的特点

深度学习存在哪些问题？

深度学习模型是如何创建的？

什么是深度学习？使用FPGA进行深度学习的好处？

根据美团“猜你喜欢”来深度学习排序模型实践

基于深度学习模型的点云目标检测及ROS实现

详解机器学习和深度学习常见的正则化

深度模型中的优化与学习课件下载

移植深度学习算法模型到海思AI芯片

大模型为什么是深度学习的未来？

深度学习框架是什么？深度学习框架有哪些？