手写体数字笔画特征提取改进方案*

时间：2024-06-19

陈奋,郑子伟

(厦门城市职业学院电子与信息工程系，福建厦门 361008)

手写体数字笔画特征提取改进方案*

陈奋,郑子伟

(厦门城市职业学院电子与信息工程系，福建厦门 361008)

手写数字识别是一个很有潜力和挑战的研究方向，对于相关行业有着实质性的影响，其中手写体数字特征的提取是识别中至关重要的一步.该文分析了传统的特征提取方法的不足，提出了手写体数字笔画特征提取改进方案，并利用VC++编程工具建立识别系统做实验分析，与传统的特征提取方法进行了比较，提高了手写数字识别率，在实验中取得了较好的效果.

特征提取；手写数字识别；改进方案

1 概述

手写数字识别作为计算机模式识别领域的热点研究方向一直被科研人员关注着，虽然手写数字个数少，貌似很容易识别，但事实并非如此，经过测试总结得出，手写数字的正确识别率并不高，比联机手写汉字的识别率还要低.

目前手写体数字识别主要的应用领域[1]：①在海量数据统计中的应用，如人口普查、行业年检等；②在财务、税务、金融领域应用，如自动处理大量的税务、财务、支票等；③在快递邮件分拣中的应用.因此，提高手写数字识别率就显得尤为重要，能够大大减轻工作量.

在模式识别领域中，特征提取是一个重要环节，手写体数字识别也不例外.特征提取是影响识别效果的一个关键步骤，本文通过分析与总结前人的成果提出一种适应性较好、识别率较高的特征提取改进方案，并利用VC++编程工具建立识别系统做实验分析.

特征提取的目的就是分析数字的拓扑结构，提取出其结构特征，减小手写体数字的位移、大小变化等干扰，把反映图像特征的信息提供给神经网络，经过特征提取后的数字图像，会明显减少数据量，神经网络规模也会大大减小.特征提取的优劣决定着网络的规模与最终识别的效果，所以所选用的特征必须能充分反映字符的本质特征.提取的特征一般具有以下原则：

(1)充分性原则[2]：提取的特征能充分保持原模式的信息量；满足充分性的基础上，尽量减小特征维数.

(2)方便性原则：为了不影响速度，提取特征的计算量不能太大；特征的抽取速度要快，稳定性能好，分类能力强.

(3)正交性原则：特征之间的相关性越小越好.

2 常用的特征提取方法

目前手写数字特征向量提取方法通常有以下几种方法：

(1)逐像素特征提取法[3]：此方法是扫描图像每行每列，黑像素令特征值为1，白像素令特征值为0，之后形成了像素点个数与维数相同的特征向量矩阵.此方法的特点是简单，速度快，神经网络收敛效果好，训练效果好，但适应性不强.

(2)骨架特征提取法[3]：此法是利用细化的方法来提取骨架.对两张图像进行细化线条后，使它们有相同的宽度，然后把骨架作为特征的提取，适应性得到了加强，不足的是图像如果出现偏移识别就困难了.

(3)垂直方向数据统计特征提取法[3]：此方法是自左向右逐列扫描图像，得出每列黑像素的数据，接着自上而下逐行扫描图像，得出每行黑像素的数据，把结果作为特征向量进行提取，但此方法得出的结果适应性不强.

3 手写数字笔画特征提取法

上述的特征点提取法都在一定程度上存在适应性不强及识别率相对较低的不足[4]，本文提出一种适应性较好且识别率较高的手写数字笔画特征提取法.

由于数字笔画简单，因可以从横、竖、撇、捺、环等5个特征着手,可以用1、2、3、4、5来定义这5个笔画的特征值.假设被处理的点为P0和它周围的8个点分别称为P1、P2、P3、P4、P5、P6、P7、P8，形成一个3×3的9点矩阵[5],如图1所示.

图1 9点矩阵

定义纵切点是弧线段与垂直线的切点，横切点是弧线段与水平线的切点，以手写体数字“6”为例，如图2所示.假设处理点P0为1，计算P1，P2，P3，P4，P5，P6，P7，P8的和；若和为1则P0为始端点，和为2则P0为一般连点，和为3则P0为三叉点，和为4则P0为四叉点.

图2 数字“6”纵切点、横切点

图3 笔画横、竖、撇、捺

由于一个环上有两个纵切点和至少一个横切点，根据上文的假设，存在将一个环上的两个纵切点之间的两段弧线误判为横笔画的可能或将两个横切点之间的两段弧线误判为竖笔画的可能.为了处理这个问题，在识别笔画时，对环进行优先识别，判断横切点和纵切点的个数,以及它们之间的相对位置，若识别出环后，环上的横纵切点就不计，不作为进行其他笔画识别的依据.

根据以上描述，一个手写数字最多有5个笔画，每个笔画的特征值也已给出，将0补在少于5个笔画的特征值之后.为了减小网络规模、提高网络识别的速度，输入笔画特征值可以按照从上到下、从左到右的顺序进行.对于5个笔画其中的环，数字“6”、“8”、“9”均有环笔画，容易被误判，所以只把这5个特征值作为特征输入还不能达到理想的识别效果，为了解决这一问题，增加各数字的环个数作为一个特征值输入，这样加上前述的5个笔画特征共构成6个特征值输入，将把环数作为第一个特征输入，紧接着输入剩下的5个笔画的特征值.以数字“6”为例，经过一系列的预处理后，得到5×6的二值化点阵，可以判断点(1，4)为端点；两个横切点和两个纵切点，而且有环笔画，环个数为1；点(1,4)与点(3,1)之间的像素点组成笔画撇.因此，数字“6”的笔画特征值按照从上到下、从左到右的顺序，依次为:撇-环，如图4所示.这样，[1，3，5，0，0，0]T则为神经网络输入特征向量.

图4 数字“6”笔画

4 建立识别系统

4.1 系统简介

本识别系统是笔者利用VisualC++6.0编写而成，系统由图像预处理和神经网络识别两块，预处理是对手写数字图像特征向量的提取，识别系统分别进行手写数字笔画特征、骨架特征、逐像素特征,以及垂直方向数据统计特征的提取，特征向量提取后就由BP神经网络来训练和识别，最后输出识别结果，流程如图5所示：

图5 识别系统设计流程

其中，测试样本和训练样本经过都是经过规一化、二值化、平滑、细化24*33处理后的图像[6]，预处理后再提取特征向量值，接着训练样本，训练之后保存为指定格式的识别网络文件，然后去选择已保存的网络文件对已经过预处理待识别的手写数字图像进行识别，最后输出识别结果，共有10个输出，代表了0到9共10个数字，如图7所示.

4.2 实验结果

系统启动初始界面，选择网络选项，如图6所示.

图6 网络选项

识别界面，网络输出最高值为识别结果，如图7所示.

图7 系统主界面

实验结果得出，相对于其他的特征提取方法，采用数字笔画特征提取方法，加快了识别速度，明显减少特征提取时间，识别率也得到了提高,实验结果如图8所示.

图8 几种特征提取训练速度、识别率比较

5 结束语

综上所述，采用数字笔画特征提取方法，可以减少样本训练的次数，缩短样本训练的时间，提高了识别率.识别率方面，虽然对样本与测试集的识别率较高，但是对于其他较为复杂的手写数字图像识别率就相对较低，可以通过增加一些比较复杂的手写数字图像样本来提高识别率，当然，提高识别率最为关键的特征提取方法也有待进一步地研究与改善.

[1]吴佑寿，丁晓青.汉字识别-原理、方法与实现[M].北京:高等教育出版社，1992.

[2]邓丽华,等.基于人工神经网络的手写体数字识别[J].三峡大学学报(自然科学学报),2005,27(3):254-256.

[3]曾旭峰.一种新的特征提取法在手写数字识别中的运用[J].电脑知识与技术,2009(5):1207-1208.

[4]宋日聪，胡伟.手写体数字识别系统中一种新的特征提取方案[J].计算机科学,2007(9).

[5]邓丽华，崔志强.手写体数字识别系统中一种新的特征提取方案[J].湖州师范学院学报,2005,27(2).

[6]杨淑莹.VC++图像处理程序设计[M].北京:清华大学出版社,2003.

10.13877/j.cnki.cn22-1284.2015.08.016

2015-03-28

福建省教育厅 B 类科技研究项目“基于移动App 的厦门城市职业学院品牌传播”( JB13679S );厦门城市职业学院院级课题“HTML5 应用研究”(KYKJ2014-3)

陈奋，福建莆田人，讲师;郑子伟，福建莆田人，副教授.

TP391.1

1008-7974(2015)04-0040-03