通过卷积神经网络实现MNIST数据集分类-电子发烧友网

问题

对比单个全连接网络，在卷积神经网络层的加持下，初始时，整个神经网络模型的性能是否会更好。

方法

模型设计

两层卷积神经网络（包含池化层），一层全连接网络。

选择 5 x 5 的卷积核，输入通道为 1，输出通道为 10：

此时图像矩阵经过 5 x 5 的卷积核后会小两圈，也就是4个数位，变成 24 x 24，输出通道为10；
选择 2 x 2 的最大池化层：

此时图像大小缩短一半，变成 12 x 12，通道数不变；
再次经过5 x 5的卷积核，输入通道为 10，输出通道为 20：

此时图像再小两圈，变成 8*8，输出通道为20；
再次经过2 x 2的最大池化层：

此时图像大小缩短一半，变成 4 x 4，通道数不变；
最后将图像整型变换成向量，输入到全连接层中：

输入一共有 4 x 4 x 20 = 320个元素，输出为 10.

代码

准备数据集

batch_size = 64

transform = transforms.Compose([

transforms.ToTensor(),

transforms.Normalize((0.1307,), (0.3081,))

])

train_dataset = datasets.MNIST(root='data’,

train=True,

                          download=True,

                          transform=transform)

train_loader = DataLoader(train_dataset,

shuffle=True,

                     batch_size=batch_size)

test_dataset = datasets.MNIST(root='data',

train=False,

                         download=True,

                         transform=transform)

test_loader = DataLoader(test_dataset,

shuffle=False,

                    batch_size=batch_size)

建立模型

class Net(torch.nn.Module):

def init (self):

super(Net, self).__init__()

   self.conv1 = torch.nn.Conv2d(1, 10, kernel_size=5)

   self.conv2 = torch.nn.Conv2d(10, 20, kernel_size=5)

   self.pooling = torch.nn.MaxPool2d(2)

   self.fc = torch.nn.Linear(320, 10)

def forward(self, x):

batch_size = x.size(0)

   x = F.relu(self.pooling(self.conv1(x)))

   x = F.relu(self.pooling(self.conv2(x)))

   x = x.view(batch_size, -1)

   x = self.fc(x)

   return x

model = Net()

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

model.to(device)

构造损失函数+优化器

criterion = torch.nn.CrossEntropyLoss()

optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.5)

训练+测试

def train(epoch):

running_loss = 0.0

for batch_idx, data in enumerate(train_loader, 0):

inputs, target = data

   inputs,target=inputs.to(device),target.to(device)

   optimizer.zero_grad()

   outputs = model(inputs)

   loss = criterion(outputs, target)

   loss.backward()

   optimizer.step()

   running_loss += loss.item()

   if batch_idx % 300 == 299:

       print('[%d,%.5d] loss:%.3f' % (epoch + 1, batch_idx + 1, running_loss / 2000))

       running_loss = 0.0

def test():

correct=0

total=0

with torch.no_grad():

for data in test_loader:

       inputs,target=data

       inputs,target=inputs.to(device),target.to(device)

       outputs=model(inputs)

       _,predicted=torch.max(outputs.data,dim=1)

       total+=target.size(0)

       correct+=(predicted==target).sum().item()

print('Accuracy on test set:%d %% [%d%d]' %(100*correct/total,correct,total))

if name ==' main ':

for epoch in range(10):

train(epoch)

   test()

运行结果

（1）batch_size：64，训练次数：10

（2）batch_size：128，训练次数：10

（3）batch_size：128，训练次数：10

结语

对比单个全连接网络，在卷积神经网络层的加持下，初始时，整个神经网络模型的性能显著提升，准确率最低为96%。在batch_size：64，训练次数：100情况下，准确率达到99%。下一阶在平均池化，3*3卷积核，以及不同通道数的情况下，探索对模型性能的影响。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

代码

代码

+关注

关注
30

文章
4557

浏览量
66826
数据集

数据集

+关注

关注
4

文章
1179

浏览量
24362
卷积神经网络

卷积神经网络

+关注

关注
4

文章
284

浏览量
11716

全连接神经网络和卷积神经网络有什么区别

全连接神经网络和卷积神经网络的区别

发表于 06-06 14:21

基于赛灵思FPGA的卷积神经网络实现设计

FPGA 上实现卷积神经网络 (CNN)。CNN 是一类深度神经网络，在处理大规模图像识别任务以及与机器学习类似的其他问题方面已大获成功。在当前案例中,针对在 FPGA 上

发表于 06-19 07:24

卷积神经网络如何使用

卷积神经网络(CNN)究竟是什么，鉴于神经网络在工程上经历了曲折的历史，您为什么还会在意它呢? 对于这些非常中肯的问题，我们似乎可以给出相对简明的答案。

发表于 07-17 07:21

卷积神经网络的层级结构和常用框架

　　卷积神经网络的层级结构　　卷积神经网络的常用框架

发表于 12-29 06:16

如何用卷积神经网络方法去解决机器监督学习下面的分类问题？

人工智能下面有哪些机器学习分支？如何用卷积神经网络（CNN）方法去解决机器学习监督学习下面的分类问题？

发表于 06-16 08:09

卷积神经网络一维卷积的处理过程

以前的神经网络几乎都是部署在云端（服务器上），设备端采集到数据通过网络发送给服务器做inference（推理），结果再通过网络返回给设备端。

发表于 12-23 06:16

图像预处理和改进神经网络推理的简要介绍

为提升识别准确率，采用改进神经网络，通过Mnist数据集进行训练。整体处理过程分为两步：图像预处理和改进

发表于 12-23 08:07

卷积神经网络模型发展及应用

的过程中存在梯度消失的问题[23]，神经网络再次慢慢淡出人们的视线。1998 年 LeCun 发明了 LeNet-5，并在 Mnist 数据集达到 98%以上的识别准确率，形成影响

发表于 08-02 10:39

卷积神经网络简介：什么是机器学习？

的理想集。卷积神经网络与其他类型的网络之间的主要区别在于它们处理数据的方式。通过过滤，将连续检查

发表于 02-23 20:11

卷积神经网络的基本原理卷积神经网络发展卷积神经网络三大特点

中最重要的神经网络之一。它是一种由多个卷积层和池化层（也可称为下采样层）组成的神经网络。CNN 的基本思想是以图像为输入，通过网络的

发表于 08-21 16:49 •1457次阅读

卷积神经网络层级结构卷积神经网络的卷积层讲解

像分类、目标检测、人脸识别等。卷积神经网络的核心是卷积层和池化层，它们构成了网络的主干，实现了对

发表于 08-21 16:49 •4529次阅读

卷积神经网络的介绍什么是卷积神经网络算法

卷积神经网络的介绍什么是卷积神经网络算法卷积神经网络涉及的关键技术

发表于 08-21 16:49 •1436次阅读

搜索历史

通过卷积神经网络实现MNIST数据集分类

准备数据集

评论

全连接神经网络和卷积神经网络有什么区别

基于赛灵思FPGA的卷积神经网络实现设计

卷积神经网络如何使用

什么是图卷积神经网络？

卷积神经网络的优点是什么

请问为什么要用卷积神经网络？

卷积神经网络的层级结构和常用框架

如何用卷积神经网络方法去解决机器监督学习下面的分类问题？

卷积神经网络一维卷积的处理过程

图像预处理和改进神经网络推理的简要介绍

卷积神经网络模型发展及应用

卷积神经网络简介：什么是机器学习？

卷积神经网络的基本原理卷积神经网络发展卷积神经网络三大特点

卷积神经网络层级结构卷积神经网络的卷积层讲解

卷积神经网络的介绍什么是卷积神经网络算法