时间:2024-07-29
洪汉玉,朱 浩,魏和洪,秦实宏,俞喆俊,王 澍
(1.武汉工程大学 图像处理与智能控制研究所,湖北 武汉430205;2. 武汉钢铁股份有限公司 条材总厂,湖北 武汉430083)
由于钢坯端面粗糙不平、轧钢生产线环境复杂、温度高、光照环境变化和钢坯成像背景复杂等因素的影响,加上打印的嵌入字符与背景的对比度低,使得钢坯的在线检测识别面临着巨大的困难和挑战,钢铁制造行业生产过程的监控水平迄今为止仍无法提高。目前,国内外钢铁产业和大型轧钢厂对钢坯的识别主要靠人工检测识别。
钢坯字符识别中常用字符识别算法主要有基于模板匹配的字符识别方法和基于神经网络的字符识别方法[1-2]。而生产线实际检测的钢坯字符会出现诸如模糊、变异、倾斜、污染和残缺等复杂情况,如图1 所示。在复杂情况下,模板匹配字符识别有一定的局限性,对缺损的字符识别率较低。
图1 钢坯端面字符图像
为解决上述问题,笔者提出了一种基于字符结构特征的电子显示识别方法,该方法弥补了模板匹配识别算法的不足。主要特点有:①以字符特有的特征作为基础,避免了以大量图像作为模板,降低了图像采集过程中对工作环境的要求,提升了识别率。并且不需要人工采集和制作大量模板图像,节省了时间和人力消耗。②对于模板匹配,需要编译十分复杂的相似性计算公式,容易产生误差。而新方法能够便捷地提取出字符图像的特征,并针对其特征快速识别出字符,避免了繁琐易错的过程。③该方法具有一定的自适应性,对手写字符能正确识别,不仅能应用于钢坯识别,还能应用于手写板和车牌的识别等。
电子显示识别方法基于电子仪器中的电子数字显示的逆过程,电子数字显示的主要过程为先将计算机可识别的数字0 ~9,转换到电路,通过排列成日字形的二极管显示出来。笔者所采用的算法原理为逆向地推出图像上数字的过程,包括定位、切分、细化的预处理。字符识别包含投影变换和电子显示识别。
生产线钢坯字符检测系统的工作流程为:钢坯在生产线上,通过红外光电传感器触发信号给高精度相机,触发采集钢坯字符图像,然后通过网线传输给工业控制计算机,通过软件识别出钢坯字符信息。
软件系统运作分为3 个过程:①预处理。主要用于字符信息的获取,包含定位、切分、细化。②字符识别。它分为投影变换及电子显示识别两个步骤。③编码识别。它将图像转换的编码识别为与之对应的字符。其流程如图2 所示。
图2 钢坯字符识别流程图
找出钢坯图像中钢坯字符所处的位置是字符识别中的初始步骤,定位的准确与否直接影响着识别系统的识别率。由于工作环境恶劣、光照复杂、钢坯端面位置变化较大等原因,使得钢坯字符精确定位有较大的难度。针对生产线喷印型钢坯字符与嵌入型钢坯字符的特点,笔者基于OTUS的递归分割与基于边缘检测相结合的方法来获得钢坯字符信息[3-5]。
首先,利用Mean Shift 对复杂场景图像进行平滑处理,突出兴趣区域,抑制背景噪声。其次,采用多级分割滤波与边缘检测相结合的方法找出字符串目标区域。最后,采用距离度量及投影方法计算出投影波形的平均宽度及波形之间的间距,根据得到的数据和先验知识(宽度小,分布较分散)去除多余噪声波,以可度量的数据来准确定位字符目标。定位结果保留原有字符特征,并拥有各自字符的位置和形态特性,为后续切分提供依据。图1 的定位结果如图3 所示。
图3 钢坯端面字符串定位图
切分是将图像中的字符串分割为单个字符的过程。在该项目中,笔者采用基于智能多代理者的字符切分处理方法。智能多代理者切分算法由3 层的分层式控制结构组成,每一层为不同的代理者,各层代理者具有各自的任务与功能。首先,将分控制层中的字符区域分割与切分、区域合并、区域分裂、特征计算等功能子程序作为个体代理者,主控制层作为主控代理者对这些个体代理者根据具体需要进行统一分工协调。其次,各子代理者的切分信息反馈给主控代理者作为分析、控制各子代理者的重要因素。切分主体路线为判断—切分—校正,直到共同完成钢坯字符的精确切分,才由主控代理者终止算法执行,进而完成钢坯号字符的精确切分[6-8]。钢坯端面字符切分如图4 所示。
图4 钢坯端面字符切分
细化的目的是得到与原来目标区域形状近似,由简单曲线组成的骨架图形,以利于特征提取和分析工作。细化的要求包括:①保持目标的连续性,不能由于细化造成断开;②细化为单线,即骨架宽度只有一个像素;③保持原有目标的拓扑、几何特征。在得到细化的图像后,可以利用字符变形将细化后的数字图像中的字符特征进行变换,将变换后的特征进行整理,去掉伪特征的干扰,并加强目标特征的信息。钢坯端面字符细化图例如图5 所示。
图5 钢坯端面字符细化图例
选定好的基础投影点,能让投影变换的效果最优化。
基础投影点的选定原则有以下两点:①不要落在细化后的图像字符上。②要选定在整个数字的中间部分,即纵向上不要使图像大部分出现在最下基础点之下,或者最上基础点之上,否则识别结果会为一条直线。横向上同理,否则所得结果图像只会为竖直的一条直线。
这里选用的基础投影点如图6(a)所示,在横坐标为1/2 图像宽度、纵坐标为3/4 高度的位置选定a 点,在横坐标为1/2 图像宽度、纵坐标为1/4 高度的位置选定b 点,则a、b 两点作为基础投影点。
图6 字符图像的变换原理示意图和投影判别示意图
投影变换的目的是最大化地让数字字符的特征暴露出来,为后续的识别过程做准备。其变换原则是:①细化后的数字字符上每点都要有横向纵向两次投影。②多个点可以重合在一起,在接收投影的基准线上算一个点。
设定分别以a 与b 为中点的矩形M 和矩形N。矩形M 的下边和N 的上边重合,形成日字形的框架。分别在a、b 两点对细化后的字符信息做4 个方向的投影。如图6(a)所示,例如矩形M中,小于a 点横坐标的点往左投影,大于a 点横坐标的点往右投影。小于a 点纵坐标的点往上投影,大于a 点纵坐标的点往下投影。
进行a 和b 两个基础投影点的投影之后,单元1 到单元7 上就会出现如图7(c)中的线段(1~7)。为了消除伪特征的干扰,并且加强需要的字符特征,应对其进行电子字符处理[9-10]。
判别方法有以下几种:①消除的伪特征并非是不需要的,将其与空单元一样对应函数表示为数字0。②加强的单元能明确地表示出字符的形态,其对应的函数以数字1 表示。③结合各个单元对应的函数汇整成数字编码。
基于上述方法,对于数字0、5 在日字框架上的单元1 ~7 依次进行判断,对大于阈值的单元进行补全,小于阈值的单元进行消除。其过程和结果如图7 所示。数字字符0 与5 可完好地提取出字符特征。接下来对线段1 到线段7 上的白点进行统计,保存于单元1 到单元7 所对应的函数中。则单元1 到单元7 中每个单元都有个数字代替图像上的线段。接下去则是对单元1 到单元7 所对应的函数进行信息判断。
图7 数字字符投影变换
如图8 所示,单元1 到单元7 的每个单元都有对应的数值,排列出来作为判别数字字符的编码。
图8 数字字符对应识别编码
为了验证所提出钢坯字符识别算法的可靠性与适应性,采集了复杂场景下的钢坯号字符图像并进行了实验。算法在VC + +6.0 的环境下进行了字符定位、切分和变换等试验。
钢坯图像(图1)经字符定位与二值化处理后如图9(a)所示。图9(b)为图9(a)中字符串切分后的结果。将切分后单一字符图像(图9(b))变换成图9(c)所示电子显示效果,而后综合各个单一的结果合成为图9(d)。最终图1 中钢坯端面字符识别结果如图9(e)所示。
图9 钢坯字符识别
针对生产线钢坯字符识别的难题,提出了基于字符特征转换的电子显示识别方法,利用字符结构特征来弥补模板匹配方法的一些不足之处。实验结果表明,所提出的电子显示识别算法能较好地适应钢坯端面字符的识别,具有较好的实时性和适应性。
[1] 张天序.成像自动目标识别[M].武汉:湖北科学技术出版社,2005:43-98.
[2] 洪汉玉. 现代图像图形处理与分析[M]. 武汉:中国地质大学出版社,2011:65-154.
[3] 李智,刘佳辉. 基于分区OTSU 法的沥青混合料图像分割技术[J]. 武汉理工大学学报,2011,33(6):87-90.
[4] 柴治,陶青川,余艳梅,等.一种快速实用的车牌字符识别方法[J].四川大学学报:自然科学版,2002,39(3):465-468.
[5] 阚伟,朱秋煜.一种新的用于集装箱字符的识别方法[J].东北师大学报:自然科学版,2000,32(4):20-24.
[6] 俞喆俊,洪汉玉,章秀华,等.生产线复杂场景钢坯检测识别的定位方法研究[J]. 光电工程,2012,39(1):54-61.
[7] 郑胜林,潘保昌,徐杜,等.IC 卡在线检测的码号定位分割方法研究[J]. 中国图象图形学报,2004,9(12):1430-1436.
[8] 洪汉玉,杨义军.基于智能多代理的复杂场景钢坯字符切分算法[J].光电工程,2012,39(5):91-100.
[9] 杨义军,洪汉玉. 重轨生产线钢坯字符识别方法[J].武汉工程大学学报,2012,34(5):64-67.
[10]JUNG C,LIU Q,KIM J.A new approach for text segmentation using a stroke filter[J]. Signal Processing,2008,88(7):1907-1916.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!