基于深度学习的字符识别

时间：2024-05-04

张杨

摘要：一般来说，传统的文字识别算法提取存在着识别困难，提取特征难的问题。对此，本文研究一种基于深度学习的字符识别方法。在实际应用过程中，首先，通过OSTU能够对文字区域进行全面的提取。而后，借助投影统计法，对单个文字图片进行切割。切割完成后，能够对神经网络层的变化情况以及神经元数量进行识别。从而对网络模型进行分析。通过研究能够发现，基于深度学习的字符识别能够有效提升模型识别的正确率，经过优化后的卷积神经网络识别正确率能够达到99.98%。具有良好的应用效果。

关键词：深度学习;光学字符识别;卷积神经网络

中图分类号：TP391.41;TP18文献标识码：A文章编号：1672-9129（2020）07-0126-01

Abstract：In general， the traditional text recognition algorithm is difficult to extract the recognition， the extraction of features is difficult. In this paper， a character recognition method based on deep learning is studied. In practice， first of all， the text area can be fully extracted by OSTU. Then， with the help of projection statistics， a single text image is cut. After cutting， the changes of the neural network layer and the number of neurons can be identified. Then the network model is analyzed. Through the research， it can be found that the character recognition based on deep learning can effectively improve the accuracy of model recognition， and the optimized convolutional neural network recognition accuracy can reach 99.98%. It has good application effect.

Key words：deep learning;Optical character recognition;Convolutional neural network

1引言

随着网络信息化的迅速发展，传统的文字识别算法已经逐渐被时代淘汰。由于文字识别算法在实际应用中存在特征提取难的问题。由此，为了能够进一步提升字符识别的效率，本文研究一种基于深度学习的字符识别方法。借助神经网络层，可以对神经元数量进行识别。并且能够对优化过后的网络模型进行全面的分析。基于深度学习的字符识别模型识别率更高，准确率更佳，能够应用到多个领域，具有良好的应用效果。

2网络结构与优化策略

2.1 网络优化策略。深度学习作为当代人工智能的一个分支，也是机器学习的衍生部分。深度学习不仅能够实现任务学习，还能够对学习对象的特征、特质等进行模仿。而且能够对学习对象的简单特征进行提取，从而捕捉到更加复杂的特征，展开学习。通过展开网络结构优化，能够弥补其中存在的问题。本文中通过英语多层神经网络，可以解决运算异常等问题。神经网络一般采取多层结构。其中，搭建神经网络的输入层也是神经网络的第一层，没个神经层中的神经元都有一个与之对应的取值。同层节点之间相互保持独立，并不存在关联性。依照神经层同层的传递方向，与后一层的节点进行连接，最终达到输出层。也就是神经层的最后一层。通常情况下，神经层的传递都是按照统一的方向性进行的，并且在传递的过程中只能够支持单项的路径传递，传递的过程不可逆。隐藏层分布在输入/输出层之间。在整个网络中，全部的神经元都具有同样的特征，并且结构完全相同。

2.2 参数取值以及学习率的控制。在网络优化过程中，还需针对网络的参数取值进行合理的选择[1]。本文中所进行的网络优化策略中，主要结合BP算法以及梯度下降法，对网络中的参数进行选取。在应用神经网络的过程中，通过参数调优，能够有效提升神经网络的学习效果，并且能够提升网络的优化率，将会对神经网络的识别性能的优劣产生直接的影响。参数调优作为其中最为关键的步骤，采取梯度下降法，可以对神经网络的识别性能进行优化处理。通过将单一的参数进行迭代，使之更新到最优值，可以更加有效的确认参数取值。与此同时，借助反向传播算法，与用梯度下降算法相结合，可以有效地提升参数取值的整体质量。通過学习率控制参数更新的幅度，能够保证参数的更新始终维持在一个较为平和的水平范围内。学习率作为控制神经网络最为关键的部分，也是神经网络的超级参数。在对学习率进行控制时，应先设置初始学习率，避免由于学习率过大或者过小，造成参数的浮动范围变大，参数的取值不合理等情况出现。

3识别实验结果比对

3.1 基于模版的方法kNN。为了能够对本文总所提到的算法识别性能进行验证，展开识别实验，并且对最终的实验结果进行分析。首先，根据切割算法及归一化处理能够得到，在应用切割算法过程中，在规定的大小区域中，通过切割所得到的字符相对较为固定。因此，借助模板匹配法结合kNN算法，对其进行识别。众所周知，kNN算法也被称作最近邻法。由于每个字符的取值不同，因此选取一定数值并且具有代表性的字符，通过对这些不同相态的字符进行集合，将之看成是一个标准的模板[2-3]。在进行图片识别工作时，借助图片的像素点作为检测对象，针对模板内部的全部图片，对其像素点进行计算，得到像素点的灰度差值。将计算过后的模板与图片的灰度差值进行处理，求出像素差值绝对之和选取5张模版，与待识别图片像素差值绝对值之和最小的图片展开统计，并且对图片进行归类。最终可以根据排序的结果，作为判断的依据。

3.2 卷积神经网络。卷积神经网络在近几年得到了较为迅猛的发展，此种神经网络也是一种深度前馈人工神经网络。在实际应用过程中，具有无可替代的优势。首先，选择应用卷积神经网络，借助神经网络中特有的卷积层，能够将不同神经层的输入/出进行连接。下一层的输出层可以与上一层的输入层进行连接。与此同时，借助权值共享，能够删减掉不必要的网络参数量。这样一来，就减少了网络的冗余。卷积神经网络架构包括输入层、全连接层以及卷积层。其中输入层中包含卷积层以及池化层。在神经网络运行过程中，往往需要经过多次的卷积层、池化层处理，卷积神经网络在输出前通常会经过全连接层。本次实验中为了能够更好的对神经网络的字符识别进行研究，选用了8层的卷积网络，其中包含3个池化层以及2个卷积层。

3.3 实验结果以及分析。通过展开深度学习的字符识别实验，能够看出，借助神经网络自动学习，能够有效提升字符识别的效率。并且借助深度学习的特性，避免了以往字符识别检测提取过程的繁琐。通过分析实验结果，能够看出，使用神经网络识别识别正确率更高，识别速度更快，具有良好的应用前景。

4结论

综上所述，深度学习作为人工智能的一个分支，在计算机技术发展日益加快的今天，具有重要意义、对此，本文主要研究一种基于深度学习的字符识别方法，并且展开了相关的实验。通过分析实验结果能够看出，基于深度学习的字符识别方法识别效果更佳，正确率更高。

参考文献：

[1]王光军. 基于神经网络的自然场景中的字符识别算法的研究与实现[D].电子科技大学，2020.

[2]李颖. 基于BERT-DPCNN的垃圾弹幕识别改进及应用[D].上海师范大学，2020.

[3]陈泽瀛.一种基于自适应非极大值抑制的文本检测算法[J].数字技术与应用，2020，38（03）：117-120.