时间:2024-07-28
徐留明 吴金文 于磊磊
(1钟山职业技术学院;2南京工业大学浦江学院;3南京交通技师学院 江苏南京 210049)
图像硬件采集技术不断优化、图像处理技术的迭代更新为机器视觉在工业领域广泛应用构建了良好的技术氛围[1]。机械零件加工质检环节、安装使用环节需要了解印刻在零件表面的型号,这些型号信息往往由字母与数字的形式构成,以往人工检测机械加工零件缺陷、检测零件表面信息的工作量巨大,人为因素干扰时常出现误检错检等问题,而机器视觉技术可以避免人工检测的多种问题[2],并且可以较大程度上提升零件检测的效率。为此将机器视觉用于机械零件表面符号信息识别,提升机械加工的智能化水平。借助机器模拟人类视觉观察功能,以现实物体为对象采集其图像并进行处理、运算、对比、检测与分析的过程即机器视觉表面检测技术运行原理[3]。
文章综合运用机器视觉图像采集系统、图像分割算法、深度玻尔兹曼机网络完成图像采集、感兴趣区域分割以及零件表面符号信息分类工作。这种自动检测零件表面符号信息的方法有利于提升零件型号检测的效率,并且将大量人力资源从中解放出来,一定程度上推动了机械加工领域自动化、智能化与现代化进程。
基于机器视觉检测机械零件表面符号信息本质上分为两个步骤:图像符号信息检测与符号信息分类。该研究根据实际的机械零件生产环境设计了针对性的机器视觉图像采集系统,系统硬件主要包括工业专用高精度摄像机、光源照明模块、图像采集与处理中心、显示终端等部分,负责采集原始机械零件图像,并进行图像预处理、图像分割、符号特征提取、信息识别等工作[4];软件主要包括图像处理类、自动检测识别类的软件,大大减少了逐个校正机械零件符号的人力资源消耗,符号信息检测的效率同步提升。据此原理设计的机器视觉图像采集系统如图1所示。
图1 基于机器视觉的机械零件表面图像采集系统
其中,图像采集设备选用面阵CCD工业相机,直观采集二维图像信息;照明模块选用占用空闲少、寿命长、效率高的LED光源,并且可以不间断工作10万个小时,是当前机器视觉以及多种照明领域使用频率较高的光源技术[5]。图像采集系统工作过程中,待检测的机械零件置于工作台上,光源模块向检测对象进行照明,摄像机负责采集高清的零件表面图像;控制单元负责零件的自动行走工作,将零件自动置于被检测区域内,同时负责向计算机传输图像采集处理等命令[6];图像采集完毕传输至计算机端进行预处理、分割、特征提取等工作,精准识别零件表面的符号信息。
机械零件在有限的照明环境影响下,机器视觉系统采集的表面图像信息难免存在纹理信息分布不均,目标区域过亮、背景区域过暗等问题。因此固定阈值法分割零件表面图像容易导致感兴趣区域分割误差较大,影响零件表面符号信息识别效果[7]。为此基于公式(1)和公式(2)所示的动态阈值法分割零件图像中的符号信息区域:
E(x,y)=M(x,y)-H(x,y)≥λ
(1)
E(x,y)=M(x,y)-H(x,y)<λ
(2)
其中,原始图像、滤波处理后的图像分别采用M(x,y)、H(x,y)表示;E(x,y)表示零件图像符号信息区域分割结果,λ为动态变化的阈值。动态阈值分割算法首先需要获取图像的背景灰度信息,其次基于两公式分别分割比背景亮以及比背景暗的区域[8]。
动态阈值分割算法执行效果主要由滤波器的尺寸和分割阈值决定,分别定义为L和λ,两者适中的情况下图像分割效果最优。但是人工尝试组合滤波器尺寸与分割阈值需要耗费较长时间,因此此处利用自动寻优法获得最佳的滤波器尺寸与分割阈值组合[9],步骤如下:
(1)将含有符号信息的机械零件图像作为样本,人工找出符号信息位置并精准标记保存;
(2)求取L和λ组合分割结果,与人工标记结果进行比较并计算二者相似度;
(3)最佳的L和λ组合即为图像样本相似度之和最大的那一组,由此确定动态阈值分割算法的L和λ参数。此过程中采用公式(3)求取相似度:
(3)
(4)
当公式(4)取值最大时对应算法的L和λ参数即为最优参数,由此确定动态阈值分割算法的平滑滤波器尺寸与阈值两个关键参数,使机械零件表面符号信息图像分割效果达最优。
动态阈值分割算法初步提取到可能存符号信息的图像区域,基于背景差分法提取可能的符号信息区域;然后以图像分割为基础进行感兴趣区域合并处理,进行连通区域处理,然后以面积、圆度、矩形度三个变量为特征依据进行符号信息的边缘提取,作为最后进行符号信息分类的样本数据[10]该步骤的处理流程见图2。
图2 机械零件表面符号信息特征边缘提取步骤
深度玻尔兹曼机是一种典型的深度学习方法,在深度信念网络(DBN)基础上优化得到的概率生成模型,弥补了DBN无法由上至下训练反馈的不足。该研究以上述提取的图像特征信息为依据,作为深度玻尔兹曼机网络的输入样本,网络输出结果即为零件表面符号信息类型,由此完成符号信息检测与识别。深度玻尔兹曼机(DBM)的基本结构如图3所示。
图3 深度玻尔兹曼机网络的基本结构
深度玻尔兹曼机与深度信念网络在层次结构上看起来相似,最大区别在于前者的全部网络结构采用无向连接方式,而后者只有顶端的两层采用无向连接。
(5)
(6)
式(6)中,归一化因子用z表示。
深度玻尔兹曼机预训练后进行微调处理可以较大程度上避免后期的分类误差,此处基于反向传播算法完成深度玻尔兹曼机的微调处理。反向传播算法优势是可以训练多层次结构的前馈神经网络训练,调整隐含层戒饭连接权值与阈值的效果良好。研究具体基于梯度下降法约束深度玻尔兹曼机网络输出与预期输出的误差平方和尽可能小,获取最优的分类效果。公式(7)为基于梯度下降法误差定义:
(7)
式(7)中,权值向量采用w表示,深度玻尔兹曼机网络输出集合为A,训练样本g的第k个相关输出值采用描述akg、bkg。由此基于梯度下降法搜索权值,对深度玻尔兹曼机网络进行合理微调,优化网络在图像符号信息分类中的精度[12]。此外,参数初始化是决定深度玻尔兹曼机主要性能的关键步骤,为了解决深度玻尔兹曼机每一层性质差异问题,同时使用灰度值初始采样与二值化初始采样混合的方式对网络参数进行初始化设置。
为验证文章提出的基于机器视觉的机械零件表面符号信息检测与识别方法的可靠性及性能优势,进行仿真实验与测试。实验采用的计算机为Windows 7 64位系统,运行内存为8G。借助机器视觉专用软件HALCON进行图像采集、处理与分析活动。文章方法的平滑滤波尺寸取值为7、动态阈值分割算法阈值取值13。同时采用卷积神经网络符号检测方法、DBN符号检测方法作为对比测试方法。
在文章方法部署的机器视觉图像采集系统支持下成功采集机械零件的表面符号信息图像,图4为采集的原始图像,带有大量的噪声,画面模糊。图5描述了三种方法进行零件符号信息特征提取的结果。
图4 原始图像
(a)文章方法
对比图4和图5能够看出,文章方法不仅能够精准提取零件表面的数字符号结果,并且具有较优的图像滤波去噪功能。原始图像中分布大量噪声点,由于外部环境的影响图像中存在少量的点状杂质,干扰零件表面符号信息识别的效果。文章方法自带平滑滤波器对原始图像进行高精度滤波处理,有效缓解了噪声点对符号内容识别的干扰,完整提取出画面中的英文字母与数字信息,图像表面平滑、噪声量极少。
卷积神经网络符号检测方法提取符号信息过程中,对图像噪声滤除的效果不明显,导致特征提取结果中混入了两个噪声点,造成符号识别结果误差;另外,该方法提取的符号边缘平滑度较差,边缘存在多处毛刺问题,符号识别效果不理想。DBN零件符号检测方法虽然没有将噪声点归入特征提取结果中,但是同样存在边缘平滑度差的问题,并且字母“O”识别结果误差较大。
为进一步评估三种方法识别机械零件表面符号信息的性能,选取50个带有不同符号信息的零件作为识别对象,统计了三种方法识别零件符号信息内容的识别准确率与响应时间,如表1所示。
表1 三种方法的零件符号信息内容识别性能统计
表1数据显示,文章方法是被零件表面符号信息的平均用时最短,且准确度最高。这是因为文章方法能够精准提取出样本图像中的符号特征区域,以此为基础利用优化后的深度玻尔兹曼机网络进行符号信息分类,呈现了良好的信息检测与识别结果。
文章提出一种基于机器视觉的机械零件表面符号信息检测与识别方法,首先利用机器模仿人类观察事物的原理采集零件表面图像;其次利用动态阈值分割算法高精度分割带有符号信息的感兴趣区域,进而获取精准的边缘特征信息;最后构建深度玻尔兹曼机识别符号信息的类别,完成信息检测与识别。文章构建的深度玻尔兹曼机网络利用梯度下降法对预训练后的网络进行微调处理,同时使用灰度值初始采样与二值化初始采样混合的方式对网络参数进行初始化设置,大大降低了网络分类符号信息的误差,取得了较高的识别准确率,并且减少了多余的检测时间开销。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!