当前位置:首页 期刊杂志

基于卷积神经网络的手写数字识别研究

时间:2024-05-04

安丽娜 蒋锐鹏

摘   要:随着科技的不断发展,卷积神经网络被广泛应用于各个领域之中,研究热点之一就是手写数字的识别。文章基于深度学习卷积神经网络,用MNIST数据集作为训练集和测试集,同时对卷积神经网络中的卷积层、池化层和全连接层以及激活函数进行介绍,并在Python的环境下输入手写数字图片,然后通过卷积神经网络经典模型运用到所提供的数据集进行效果识别,将卷积神经网络数据集进行训练,在训练好的卷积神经网络中取得了较好的实验效果,最终该手写数字识别实验准确精度可以达到99.1%。

关键词:手写数字识别;深度学习;卷积神经网络

1    MNIST数据集介绍

深度学习就像人脑学习的过程一样非常复杂,要通过上课对新知识的理论有一定理解之后,再将所学到的理论知识运用到实践中去,经过不断地思考和训练,以及对实验参数的优化,才能得到一个学习模型。其中,卷积神经网络(Convolutional Neural Networks,CNN)是包含卷积计算且具有深度结构的前馈神经网络[1]。本文用MNIST数据集[2]作为训练集和测试集,想要得到一个好的学习模型,根据图像数据的类型选择适用的分类器很关键。深度学习随着时间的推移而更加深入,将深度学习运用到手写数字识别中也逐步成熟。目前手写数字识别的方法主要有模板匹配法、统计决策法、句法结构法、模糊判别法、逻辑推理法和神经网络法等[3-6]。国内外的研究人员也通过自身的努力取得了一定的研究成果和突破,而且大部分研究成果在市场上随处可见,给人们的生活带来了极大的便利。

本文研究的主要内容是基于卷积神经网络的图像识别方法,将卷积神经网络和图像识别进行结合,在海量的图像数据中得到有效的信息。根据传统图像识别方法的缺点和不足之处,提出了自己的优化模型,并对影响实验结果的参数进行调整,训练出更有效果的卷积神经网络模型,改进之后的学习模型在图像检测中有了较大的进步。

2    理论基础

2.1  卷積运算

文中所提到的卷积实则是两个变量的一种代数运算,卷积运算表示:

在此公式中,ω为有意义的概率密度函数,当所提供的参数为负值时,则ω=0。卷积运算过程中的第一个参数,叫作输入值,通过运算,得到的第二个参数,叫作核函数。

2.2  池化层和激活函数

在卷积神经网络模型中通常使用的池化操作有平均值池化(mean-pooling)和最大值池化(max-pooling),均值操作最后的值为平均值,最值操作最后的值为最大值。池化操作和卷积操作不同的是不需要参数学习,使用的过程中只需确定好池化的类型以及池化核的特定大小和步长。

ReLU函数是深度学习和机器学习中运用最为广泛的激活函数之一,能够有效避免参数的数值过大所引起的梯度饱和现象,并且该函数可以加快梯度下降法的收敛速度。

ReLU函数在数学中就是一个分段函数,其表达式为:

通过函数的性质,可以知道梯度在x≥0时为1,当x<0时为0。

2.3  全连接层

Softmax分类器是logistic回归模型在多分类情况上的推广[7]。令输入特征x(i)和样本y(i),k表示向量的维数,该函数表达式为:

式中,θ1, θ2, ……,θk∈是模型参数,所有的概率总和为1。

3    实验分析

该学习模型采用MNIST训练数据集进行图像识别,该数据集中有训练集和测试集,共70 000张不同的图片,其中训练集的图片有60 000张,测试集的图片有10 000张,并且每张图片都是28×28的像素。在本文数字图像识别中用到的卷积是二维卷积核与二维图像做卷积操作[8],该实验在Windows电脑系统下完成,运用深度学习结构和Python语言编码进行仿真实验。

本文的卷积神经网络模型的结构主要包括:输入层、卷积层、池化层、全连接层、Soft max输出层。MNIST数据集中的图像是由数字0~9组成。首先,输入的图像通过卷积操作后得到有效信息;其次,确定卷积核的大小以及步长。全连接层在卷积神经网络中用于“分类”,以概率的形式去确定识别结果。从图1—2中可以客观地评价本文卷积神经网络模型的有效性,最终实验结果表明手写数字的识别准确精度可以达到99.1%。

[参考文献]

[1]程国建,岳清清.卷积神经网络在岩石薄片图像检索中的应用初探[J].智能计算机与应用,2018(2):43-46.

[2]林大贵.TensorFlow+Keras深度学习人工智能实践应用[M].北京:清华大学出版社,2018.

[3]马媛媛,史加荣.卷积神经网络及其在手写体数字识别中的应用[J].湖北工程学院学报,2017(6):68-74.

[4]张翼成,陈欣,杨红军,等.基于组合特征的BP神经网络数字识别方法[J].计算机系统应用,2013(3):113-116.

[5]刘高平,赵杜娟,黄华.基于自编码神经网络重构的车牌数字识别[J].光电子·激光,2011(1):144-148.

[6]杜选,高明峰.人工神经网络在数字识别中的应用[J].计算机系统应用,2007(2):21-22.

[7]刘洋洋,嵇启春.一种改进的模板匹配的数字识别算法[J].工业控制计算机,2010(5):76-77.

[8]李金洪.深度学习之TensorFlow入门、原理与进阶实战[M].北京:机械工业出版社,2018.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!