0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

讲解CNN+RNN的各种组合方式,以及CNN和RNN的对比

Dbwd_Imgtec 来源:未知 作者:李倩 2018-09-13 15:22 次阅读

一、前述

CNN和RNN几乎占据着深度学习的半壁江山,所以本文将着重讲解CNN+RNN的各种组合方式,以及CNN和RNN的对比。

二、CNN与RNN对比

1、CNN卷积神经网络与RNN递归神经网络直观图

2、相同点:

2.1. 传统神经网络的扩展。

2.2. 前向计算产生结果,反向计算模型更新。

2.3. 每层神经网络横向可以多个神经元共存,纵向可以有多层神经网络连接。

3、不同点

3.1. CNN空间扩展,神经元与特征卷积;RNN时间扩展,神经元与多个时间输出计算

3.2. RNN可以用于描述时间上连续状态的输出,有记忆功能,CNN用于静态输出

3. 3. CNN高级100+深度,RNN深度有限

三、CNN+RNN组合方式

1. CNN 特征提取,用于RNN语句生成图片标注。

2. RNN特征提取用于CNN内容分类视频分类。

3. CNN特征提取用于对话问答图片问答。

四、具体应用

1、图片标注

基本思路

目标是产生标注的语句,是一个语句生成的任务,LSTM?描述的对象大量图像信息,图像信息表达,CNN?CNN网络中全连接层特征描述图片,特征与LSTM输入结合。

具体步骤:

1.1 模型设计-特征提取全连接层特征用来描述原图片LSTM输入:word+图片特征;输出下一word。

1.2 模型设计-数据准备

1. 图片CNN特征提取2. 图片标注生成Word2Vect 向量3. 生成训练数据:图片特征+第n单词向量:第n+1单词向量。

1.3 模型训练:

1. 运用迁移学习,CNN特征,语句特征应用已有模型2. 最终的输出模型是LSTM,训练过程的参数设定:梯度上限(gradient clipping), 学习率调整(adaptivelearning)3. 训练时间很长。

1.4 模型运行:

1. CNN特征提取2. CNN 特征+语句开头,单词逐个预测

2、视频行为识别 :

视频中在发生什么?

2.1常用方法总结:

RNN用于CNN特征融合1. CNN 特征提取2. LSTM判断3. 多次识别结果分析。

不同的特征不同输出。

或者:所有特征作为一个输出。

2.2 RNN用于CNN特征筛选+融合:

1. 并不是所有的视频 图像包含确定分类信息2. RNN用于确定哪些frame 是有用的3. 对有用的图像特征 融合。

2.3 RNN用于,目标检测

1. CNN直接产生目标候选区2. LSTM对产生候选区融合(相邻时刻位置近 似)3. 确定最终的精确位置。

2.4 多种模型综合:

竞赛/应用中,为了产生最好结果,多采用 多模型ensemble形式。

3、图片/视频问答

3.1 问题种类

3.2 图片问答意义

1. 是对纯文本语言问答系统的扩展2. 图片理解和语言处理的深度融合3. 提高人工智能应用范围-观察,思考,表达

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cnn
    cnn
    +关注

    关注

    3

    文章

    327

    浏览量

    21297
  • 迁移学习
    +关注

    关注

    0

    文章

    72

    浏览量

    5501
  • rnn
    rnn
    +关注

    关注

    0

    文章

    67

    浏览量

    6803

原文标题:深度学习篇——CNN和RNN结合与对比,实例讲解

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于数字CNN与生物视觉的仿生眼设计

    简单的物体,完成一些简单的视觉任务[2]。本文采用基于CNN[3-4]的数学模型以及相关的数字指令来建立一个能并行、快速处理视觉信号的数字CNN信号处理系统。在研究视网膜信号处理以及
    发表于 09-19 09:35

    TF之CNNCNN实现mnist数据集预测

    TF之CNNCNN实现mnist数据集预测 96%采用placeholder用法+2层C及其max_pool法+隐藏层dropout法+输出层softmax法+目标函数cross_entropy法+
    发表于 12-19 17:02

    RNN算法的三个关键步骤

    DL之RNNRNN算法相关论文、相关思路、关键步骤、配图集合+TF代码定义
    发表于 12-28 14:20

    利用RNN进行文章生成

    利用RNN进行文章生成
    发表于 05-24 08:35

    大家是怎么压榨CNN模型的

    【技术综述】为了压榨CNN模型,这几年大家都干了什么
    发表于 05-29 14:49

    递归神经网络(RNN

    递归神经网络(RNNRNN是最强大的模型之一,它使我们能够开发如分类、序列数据标注、生成文本序列(例如预测下一输入词的SwiftKey keyboard应用程序),以及将一个序列转换为另一个序列
    发表于 07-20 09:27

    如何将DS_CNN_S.pb转换为ds_cnn_s.tflite?

    MIMRTX1064(SDK2.13.0)的KWS demo中放置了ds_cnn_s.tflite文件,提供demo中使用的模型示例。在 read.me 中,声明我可以找到脚本,但是,该文档中的脚本
    发表于 04-19 06:11

    CNNRNN结合与对比,实例讲解

    由 mengqiqi 于 星期三, 2018-09-05 09:58 发表 一、前述 CNNRNN几乎占据着深度学习的半壁江山,所以本文将着重讲解CNN+RNN
    发表于 09-06 22:32 567次阅读

    一文带你了解(神经网络)DNN、CNN、和RNN

    很多“长相相似”的专有名词,比如我们今天要说的“三胞胎”DNN(深度神经网络)、CNN(卷积神经网络)、RNN(递归神经网络),就让许许多多的AI初学者们傻傻分不清楚。而今天,就让我们一起擦亮眼睛,好好
    发表于 03-13 14:32 3302次阅读

    CNNRNN对比 CNN+RNN组合方式

    相同点: 传统神经网络的扩展。 前向计算产生结果,反向计算模型更新。 每层神经网络横向可以多个神经元共存,纵向可以有多层神经网络连接。
    发表于 02-08 19:07 7238次阅读

    深度分析RNN的模型结构,优缺点以及RNN模型的几种应用

    神经网络是深度学习的载体,而神经网络模型中,最经典非RNN模型所属,尽管它不完美,但它具有学习历史信息的能力。后面不管是encode-decode 框架,还是注意力模型,以及自注意力模型,以及更加
    的头像 发表于 05-13 10:47 2.3w次阅读
    深度分析<b class='flag-5'>RNN</b>的模型结构,优缺点<b class='flag-5'>以及</b><b class='flag-5'>RNN</b>模型的几种应用

    RNN以及LSTM

    循环神经网络(Recurrent Neural Network,RNN)是一种用于处理序列数据的神经网络。相比一般的神经网络来说,他能够处理序列变化的数据。比如某个单词的意思会因为上文提到的内容不同而有不同的含义,RNN就能够很好地解决这类问题。
    的头像 发表于 03-15 10:44 1578次阅读

    cnn卷积神经网络简介 cnn卷积神经网络代码

    以解决图像识别问题为主要目标,但它的应用已经渗透到了各种领域,从自然语言处理、语音识别、到物体标记以及医疗影像分析等。在此,本文将对CNN的原理、结构以及基础代码进行
    的头像 发表于 08-21 17:16 2025次阅读

    Vitis AI RNN用户指南

    Vitis AI 递归神经网络 (RNN) 工具是 Vitis™ AI 开发环境的一个子模块,专注于在 Xilinx® 硬件平台(包括 Alveo™ 加速器卡)上实现 RNN。这些工具由优化的 IP
    发表于 09-13 17:32 0次下载
    Vitis AI <b class='flag-5'>RNN</b>用户指南

    精选 25 个 RNN 问题

    ,非常适合RNN。与其他神经网络不同,RNN具有内部存储器,允许它们保留来自先前输入的信息,并根据整个序列的上下文做出预测或决策。在本文中,我们将探讨RNN的架构、它
    的头像 发表于 12-15 08:28 293次阅读
    精选 25 个 <b class='flag-5'>RNN</b> 问题