0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用PyTorch提取CNNs图像特征

汽车玩家 来源:人工智能遇见磐创 作者:人工智能遇见磐创 2020-05-05 08:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

目录

简要介绍PyTorch、张量和NumPy

为什么选择卷积神经网络(CNNs)?

识别服装问题

使用PyTorch实现CNNs

1.简要介绍PyTorch、张量和NumPy

让我们快速回顾一下第一篇文章中涉及的内容。我们讨论了PyTorch和张量的基础知识,还讨论了PyTorch与NumPy的相似之处。

PyTorch是一个基于python的库,提供了以下功能:

用于创建可序列化和可优化模型的TorchScript

以分布式训练进行并行化计算

动态计算图,等等

PyTorch中的张量类似于NumPy的n维数组,也可以与gpu一起使用。在这些张量上执行操作几乎与在NumPy数组上执行操作类似。这使得PyTorch非常易于使用和学习。

在本系列的第1部分中,我们构建了一个简单的神经网络来解决一个案例研究。使用我们的简单模型,我们在测试集中获得了大约65%的基准准确度。现在,我们将尝试使用卷积神经网络来提高这个准确度。

2.为什么选择卷积神经网络(CNNs)?

在我们进入实现部分之前,让我们快速地看看为什么我们首先需要CNNs,以及它们是如何工作的。

我们可以将卷积神经网络(CNNs)看作是帮助从图像中提取特征的特征提取器。

在一个简单的神经网络中,我们把一个三维图像转换成一维图像,对吧?让我们看一个例子来理解这一点:

使用PyTorch提取CNNs图像特征

你能认出上面的图像吗?这似乎说不通。现在,让我们看看下面的图片:

我们现在可以很容易地说,这是一只狗。如果我告诉你这两个图像是一样的呢?相信我,他们是一样的!唯一的区别是第一个图像是一维的,而第二个图像是相同图像的二维表示

空间定位

人工神经网络也会丢失图像的空间方向。让我们再举个例子来理解一下:

使用PyTorch提取CNNs图像特征

你能分辨出这两幅图像的区别吗?至少我不能。由于这是一个一维的表示,因此很难确定它们之间的区别。现在,让我们看看这些图像的二维表示:

在这里,图像某些定位已经改变,但我们无法通过查看一维表示来识别它。

这就是人工神经网络的问题——它们失去了空间定位。

大量参数

神经网络的另一个问题是参数太多。假设我们的图像大小是28283 -所以这里的参数是2352。如果我们有一个大小为2242243的图像呢?这里的参数数量为150,528。

这些参数只会随着隐藏层的增加而增加。因此,使用人工神经网络的两个主要缺点是:

丢失图像的空间方向

参数的数量急剧增加

那么我们如何处理这个问题呢?如何在保持空间方向的同时减少可学习参数?

这就是卷积神经网络真正有用的地方。CNNs有助于从图像中提取特征,这可能有助于对图像中的目标进行分类。它首先从图像中提取低维特征(如边缘),然后提取一些高维特征(如形状)。

我们使用滤波器从图像中提取特征,并使用池技术来减少可学习参数的数量。

在本文中,我们不会深入讨论这些主题的细节。如果你希望了解滤波器如何帮助提取特征和池的工作方式,我强烈建议你从头开始学习卷积神经网络的全面教程。

3.问题:识别服装

理论部分已经铺垫完了,开始写代码吧。我们将讨论与第一篇文章相同的问题陈述。这是因为我们可以直接将我们的CNN模型的性能与我们在那里建立的简单神经网络进行比较。

你可以从这里下载“识别”Apparels问题的数据集。

https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-apparels/?utmsource=blog&utmmedium=building-image-classification-models-cnn-pytorch

让我快速总结一下问题陈述。我们的任务是通过观察各种服装形象来识别服装的类型。我们总共有10个类可以对服装的图像进行分类:

使用PyTorch提取CNNs图像特征

数据集共包含70,000张图像。其中60000张属于训练集,其余10000张属于测试集。所有的图像都是大小(28*28)的灰度图像。数据集包含两个文件夹,一个用于训练集,另一个用于测试集。每个文件夹中都有一个.csv文件,该文件具有图像的id和相应的标签;

准备好开始了吗?我们将首先导入所需的库:

加载数据集

现在,让我们加载数据集,包括训练,测试样本:

该训练文件包含每个图像的id及其对应的标签

另一方面,测试文件只有id,我们必须预测它们对应的标签

样例提交文件将告诉我们预测的格式

我们将一个接一个地读取所有图像,并将它们堆叠成一个数组。我们还将图像的像素值除以255,使图像的像素值在[0,1]范围内。这一步有助于优化模型的性能。

让我们来加载图像:

如你所见,我们在训练集中有60,000张大小(28,28)的图像。由于图像是灰度格式的,我们只有一个单一通道,因此形状为(28,28)。

现在让我们研究数据和可视化一些图像:

使用PyTorch提取CNNs图像特征

以下是来自数据集的一些示例。我鼓励你去探索更多,想象其他的图像。接下来,我们将把图像分成训练集和验证集。

创建验证集并对图像进行预处理

我们在验证集中保留了10%的数据,在训练集中保留了10%的数据。接下来将图片和目标转换成torch格式:

同样,我们将转换验证图像:

我们的数据现在已经准备好了。最后,是时候创建我们的CNN模型了!

4.使用PyTorch实现CNNs

我们将使用一个非常简单的CNN架构,只有两个卷积层来提取图像的特征。然后,我们将使用一个完全连接的Dense层将这些特征分类到各自的类别中。

让我们定义一下架构:

现在我们调用这个模型,定义优化器和模型的损失函数:

使用PyTorch提取CNNs图像特征

这是模型的架构。我们有两个卷积层和一个线性层。接下来,我们将定义一个函数来训练模型:

最后,我们将对模型进行25个epoch的训练,并存储训练和验证损失:

使用PyTorch提取CNNs图像特征

可以看出,随着epoch的增加,验证损失逐渐减小。让我们通过绘图来可视化训练和验证的损失:

使用PyTorch提取CNNs图像特征

啊,我喜欢想象的力量。我们可以清楚地看到,训练和验证损失是同步的。这是一个好迹象,因为模型在验证集上进行了很好的泛化。

让我们在训练和验证集上检查模型的准确性:

训练集的准确率约为72%,相当不错。让我们检查验证集的准确性:

正如我们看到的损失,准确度也是同步的-我们在验证集得到了72%的准确度。

为测试集生成预测

最后是时候为测试集生成预测了。我们将加载测试集中的所有图像,执行与训练集相同的预处理步骤,最后生成预测。

所以,让我们开始加载测试图像:

现在,我们将对这些图像进行预处理步骤,类似于我们之前对训练图像所做的:

最后,我们将生成对测试集的预测:

用预测替换样本提交文件中的标签,最后保存文件并提交到排行榜:

你将在当前目录中看到一个名为submission.csv的文件。你只需要把它上传到问题页面的解决方案检查器上,它就会生成分数。链接:https://datahack.analyticsvidhya.com/contest/practice-problem-identify-the-apparels/?utmsource=blog&utmmedium=building-image-classification-models-cnn-pytorch

我们的CNN模型在测试集上给出了大约71%的准确率,这与我们在上一篇文章中使用简单的神经网络得到的65%的准确率相比是一个很大的进步。

5.结尾

在这篇文章中,我们研究了CNNs是如何从图像中提取特征的。他们帮助我们将之前的神经网络模型的准确率从65%提高到71%,这是一个重大的进步。

你可以尝试使用CNN模型的超参数,并尝试进一步提高准确性。要调优的超参数可以是卷积层的数量、每个卷积层的滤波器数量、epoch的数量、全连接层的数量、每个全连接层的隐藏单元的数量等。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • python
    +关注

    关注

    57

    文章

    4857

    浏览量

    89580
  • pytorch
    +关注

    关注

    2

    文章

    813

    浏览量

    14698
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    京东拍立淘API开发指南:从零开始构建图像搜索应用

    京东图片识别搜索API(拍立淘)是基于深度学习的视觉搜索服务,通过卷积神经网络提取图像特征向量,结合近似最近邻搜索算法实现商品精准匹配‌。该技术解决了传统文字搜索难以描述商品外观的痛点,支持以图搜图的智能购物体验‌。
    的头像 发表于 11-09 17:40 1948次阅读

    淘宝图片搜索接口开发实战:从 CNN 特征提取到商品匹配(附避坑手册 + 可复用代码)

    本文详解淘宝图片搜索接口开发全流程,涵盖CNN特征提取、商品匹配、参数配置及400/429等高频报错解决方案,附合规避坑指南与可复用代码,助你高效实现图像搜商品功能。
    的头像 发表于 10-21 10:03 260次阅读

    大电流起弧过程中电弧声压/超声波信号的特征提取与故障诊断

    接触不良、绝缘破损、元件老化等故障时,电弧的燃烧状态会发生改变,相应的声压超声波信号也会出现异常变化。因此,通过提取这些信号中的关键特征,并结合特征变化规律进行分析,就能实现对大电流起弧过程中故障的精准诊
    的头像 发表于 09-29 09:27 267次阅读
    大电流起弧过程中电弧声压/超声波信号的<b class='flag-5'>特征提取</b>与故障诊断

    高光谱成像技术在指纹提取的研究和应用

    指纹作为个体独特的生物特征,广泛应用于法医学、身份认证和安防领域。传统的指纹提取技术(如光学成像、电容式传感器、化学显影等)在面对复杂表面材质(如金属、玻璃、潮湿表面)或降解指纹时存在局限性。近年来
    的头像 发表于 09-26 17:55 1172次阅读
    高光谱成像技术在指纹<b class='flag-5'>提取</b>的研究和应用

    基于LockAI视觉识别模块:C++使用图像的统计信息

    图像处理中,统计信息可以帮助我们了解图像的特性,例如区域内的像素分布、颜色转换以及特定区域的分析。本文将介绍基于LockAI视觉识别模块如何提取兴趣区域(ROI)、转换颜色通道、计算均值和标准差
    发表于 05-08 10:31

    在友晶LabCloud平台上使用PipeCNN实现ImageNet图像分类

    利用深度卷积神经网络(CNN)进行图像分类是通过使用多个卷积层来从输入数据中提取特征,最后通过分类层做决策来识别出目标物体。
    的头像 发表于 04-23 09:42 877次阅读
    在友晶LabCloud平台上使用PipeCNN实现ImageNet<b class='flag-5'>图像</b>分类

    概伦电子标准单元库特征化解决方案NanoCell介绍

    标准单元库包括电路设计、版图设计和特征提取,它对芯片设计至关重要。其中标准单元库的特征提取需要大量仿真、模型提取和验证,在标准单元库开发中占据了三分之一以上的时间。
    的头像 发表于 04-16 09:49 772次阅读
    概伦电子标准单元库<b class='flag-5'>特征</b>化解决方案NanoCell介绍

    给个思路也可以(不知道这个无线通信模块怎么实现)

    有偿定做一个智能考勤机 要求:(1)指纹模块:采集指纹图像和传输指纹信息,对指纹图像进行预处理,消除噪声干扰,还原图像的真实特征信息。完成特征提取
    发表于 03-21 16:50

    【米尔RK3576开发板评测】+项目名称RetinaFace人脸检测

    一、简介 Pytorch_Retinaface‌是一个基于PyTorch框架实现的人脸检测算法,它能够快速而准确地检测出图像中的人脸,并提供丰富的特征信息。该算法的核心思想是使用多尺度
    发表于 02-15 13:28

    FPGA上的图像处理算法集成与优化

    本文详细介绍了多种图像处理技术,包括RG/GB单通道提取、亮度和对比度调整、图像反转、均值滤波、高斯滤波、图像锐化、中值滤波、阈值分割、边缘检测(Sobel算子)、
    的头像 发表于 02-14 13:46 1151次阅读
    FPGA上的<b class='flag-5'>图像</b>处理算法集成与优化

    操作指南:pytorch云服务器怎么设置?

    设置PyTorch云服务器需选择云平台,创建合适的GPU实例,安装操作系统、Python及Anaconda,创建虚拟环境,根据CUDA版本安装PyTorch,配置环境变量,最后验证安装。过程中需考虑
    的头像 发表于 02-08 10:33 606次阅读

    SparseViT:以非语义为中心、参数高效的稀疏化视觉Transformer

      背景简介 随着图像编辑工具和图像生成技术的快速发展,图像处理变得非常方便。然而图像在经过处理后不可避免的会留下伪影(操作痕迹),这些伪影可分为语义和非语义
    的头像 发表于 01-15 09:30 809次阅读
    SparseViT:以非语义为中心、参数高效的稀疏化视觉Transformer

    【「具身智能机器人系统」阅读体验】+两本互为支持的书

    最近在阅读《具身智能机器人系统》这本书的同时,还读了 《计算机视觉之PyTorch数字图像处理》一书,这两本书完全可以视为是互为依托的姊妹篇。《计算机视觉之PyTorch数字图像处理》
    发表于 01-01 15:50

    使用机器学习改善库特征提取的质量和运行时间

    基于静态时序分析(STA)的现代设计流程非常依赖标准单元、IO、存储器和定制模块的特征化Liberty模型。高效、准确的库特征提取是全芯片或模块级设计流程的关键步骤之一,因为它能确保所有库单元在所
    的头像 发表于 12-26 11:15 738次阅读
    使用机器学习改善库<b class='flag-5'>特征提取</b>的质量和运行时间

    利用Arm Kleidi技术实现PyTorch优化

    PyTorch 是一个广泛应用的开源机器学习 (ML) 库。近年来,Arm 与合作伙伴通力协作,持续改进 PyTorch 的推理性能。本文将详细介绍如何利用 Arm Kleidi 技术提升 Arm
    的头像 发表于 12-23 09:19 1619次阅读
    利用Arm Kleidi技术实现<b class='flag-5'>PyTorch</b>优化