当前位置:首页 期刊杂志

模式识别及其在计算机视觉中的实现研究

时间:2024-05-04

郭宏博

(延安大学 陕西省延安市 716000)

1 概念界定

1.1 模式识别概念

模式识别更倾向于视觉逻辑,在计算机视觉中才能发挥应有作用,即模式识别是一种将环境与客体统称为模式,再通过计算机获取模式信息,将信息视作样本,分析获取样本特征后对样本进行分类,最后根据分类情况得到识别结果,以数控刀具为例,模式识别中刀具所处的环境与刀具本身组成了待识别模式,通过计算机可获取刀具环境温度、刀具规格,围绕刀具磨损问题,不断获取刀具环境温度与刀具规格的信息,如果信息没有超过标准值,就将两组信息归类为“正常”项,反之则归类为“异常”项,因此根据分类项目可知刀具磨损是否超过极限,若超过就要及时更换,说明模式识别了当前信息,给出了准确的结果。模式识别的系统一般由支持向量机、图像处理、计算机接口等组成,其中支持向量机是核心,能解决模式识别中的回归问题,而图像处理则负责采集图像信息,图像信息的形式众多,包括文字、图片等,这些信息可以给向量机提供图像坐标,因此向量机能够获取坐标特征,随即进行分类,而特征识别后的信息会通过计算机结构进入计算机,实现信息与计算机视觉的对接。总体而言,模式识别是计算机视觉的逻辑支撑,运作流程一般可分为样本采集、样本预处理、特征分析三个环节,结合计算机技术能对信息进行识别。另外,模式识别在实际应用中能够根据现实需求构成两种模式,其一是监督模式,该模式要对目标进行实时监督,获取信息,以便形成信息对比,上述中提到的数控刀具案例就采用的是监督模式,其二是非监督模式,该模式只进行一次信息采集,一般应用于目标位置、信息项目有限的情况下[1]。

1.2 计算机视觉概念

计算机视觉是一个相对抽象的概念,其中“视觉”实际上是指计算机获取信息,并根据信息识别结果对事物进行认知的一个过程,而这个过程与人类视觉与大脑处理信息的过程非常相似,即人通过知识视觉神经网络能够采集到大量信息,信息将被传输到大脑,大脑结合记忆、认知等对信息进行识别,故人才能确认事物具体情况。计算机视觉的实现涉及到多个学科,诸如计算机科学和工程、信号处理、应用数学、统计学等,通过这些技术构建计算机视觉系统,就能让计算机代替人的双眼与大脑对事物进行认知,在认知过程中计算机视觉可以分为前、中、后三个阶段才能实现识别与认知,其中前阶段的视觉被称为“低层次视觉”,用于获取二维图像信息,诸如图像的亮度及亮度变化、结构组成、位置分布、几何形状等;中阶段的视觉被称为“中间层次视觉”,主要以主体为中心形成坐标系,通过观察等方式可得事物的表面方向、深度值和不连续轮廓等信息;后阶段的视觉被称为“高层次视觉”,结合以主体为中心的坐标系,获取体积基元、面积基元以及两大基元构成的模块化多层次,这些信息可用于空间组织形式的描述中。另外在计算机技术层面上,“低层次视觉”主要负责处理原始图像,功能主要借助图像处理技术、算法来实现,诸如图像滤波、图像增强、边缘检测、线条检测、角点检测等,而“低层次视觉”的信息结果将给后两个层次视觉提供支撑,后两者视觉信息均来源于“低层次视觉”原始信息。

2 模式识别应用方式

采用相关方法可以在计算机视觉中实现模式识别,而要充分发挥模式识别作用,在模式识别实现之前还要了解其具体应用方式。目前,比较常见的模式识别方式为:结构模式识别、统计决策、人工智能三种方式,具体如下:

2.1 结构模式识别

结构模式识别的特点是根据信息结构来识别信息,常用于文字翻译等领域,过程中可根据语法结构对文字进行识别,可知语义,故可得准确翻译结果。结构模式识别需要先确认识别目标,再将目标结构拆分,得到若干组成部分,随即依照语法逻辑进行匹配度分析,如果匹配分析结果显示目标结构与语法逻辑结构一致,则输出结果,反之更换语法逻辑结构继续进行匹配度分析,直到找到匹配结果。值得注意的是,结构模式识别存在一定的缺陷,其不能应用于非规则结构的计算机视觉应用中,原因在于非规则结构具有不可预测性,因此无法预先构筑语法逻辑或其他结构,故无法识别。

2.2 统计决策

统计决策是典型的数理模式识别方式,应用中主要以概率、数据统计结果作为支撑,能通过各种参数法或非参数法对信息识别,其中较具代表性的方法是贝叶斯决策下的参数方法,能够有效降低决策结果的误差性,原因在于统计决策能够根据实际概率条件、概率密度去衡量模式识别过程、结果的精度,如果精度不足就会进行调整。统计决策常用于复杂图像分割识别中。

2.3 人工智能

目前,人工智能已经与计算机应用相结合,围绕计算机技术人工智能可起到多种作用,其中就包括了模式识别,即人工智能的核心是神经网络系统,该系统是借助软件、硬件模拟人类神经系统运作方式得出的,能建立对应的神经元节点,各节点依照标准关系结合可形成神经网络,在该网络基础上采用机器学习方式提高模式识别准确性,后依照统计方法去分析模式识别目标类型、概率分布,判断各信息之间的关联度,这样能够得出一个独立的经验模型,而模型将被保存在知识库中,下一次遇到相同信息就能依照对应模型直接识别。总体上,人工智能综合了多种模式识别方式,功能性更强、应用范围更加广泛,诸如可以通过人工智能建立网络安全防护系统,其安全防护力度非常高。

3 模式识别的实现方法

3.1 总体框架

模式识别的总体框架见图1。

图1:模式识别总体框架

根据图1,信息采集层是物理层,一般由各种具备信息采集能力的设备组成,随后信息会被导入信息处理层,接受信息预处理,目的是去除重复信息,以保障后续处理效率。预处理后信息将通过计算机结构进入支持向量机进行特征分析,依照分析结果将特征完全一致或高度相似的信息分为一类,根据分类结果即可识别信息,最后输出结果[2]。

3.2 实现方法

以图像信息的监督模式为例,模式识别实现方法大体可以分为四个步骤,具体如下。

3.2.1 信息采集层

信息采集层的设备安装比较简单,一般选择若干数量的图像采集装置,再将其安装在正确位置即可,图像采集装置泛指摄像设备等,此处不多加赘述。但除此以外,还要使用图像识别技术进行信息采集,即图像识别技术依托于物理学、统计学等理科学科而诞生的一项技术,主要功能是对采集所得图像信息进行储存与识别,应用中借助摄像设备不间断拍摄图像,获得原始图像信息,通过信息可得图像的特征与变化,这样就完成了信息采集。在图像识别技术中主要的计算方法为空域算法:该算法主要是以某个空间域为基础,在域内对数字图像进行处理,主要原理是对图像像素进行灰度变换,或者对图像中的小区域模板进行空域滤波处理,这样能初步识别图像,为后续环节做好准备。

3.2.2 信息处理层

本文主要采用微机技术来构建信息处理层,即使用微机技术建立微机图像处理系统,通过微机扩展槽的带帧存储器采集卡读取计算机内存中的信息,随后对读取所得信息进行处理,除了后的图像信息信息会被送回图像帧存储器[3]。信息处理层的实现方法虽然简单,但出于使用价值考虑,在该层实现后必须确立对应的流程逻辑,一般包括:第一图像颜色空间变换,因为实际情况中多数图像都是彩色的,所以在图像信息处理中必须重视颜色空间的变换,以比较常见的RGB图像为例,预先经过灰度处理后必须着手建立RGB模型,该模型以三色源光谱为基础(红、绿、蓝三色),任何颜色都将在光谱中显示,且黑色对应原点、白色对应定点,可以在笛卡尔坐标系统下对红、绿、蓝三色进行分析,获取三原色与图像信息结合后各原色中其他颜色的比例,这样就能对图像的基础特征进行识别,如果发现特征完全一致或高度像素的图像信息,就会选择删除其中一条图像信息,若有需要可以手动恢复。

3.2.3 支持向量机

支持向量机是当前新兴的一种数据挖掘方法,可有效解决模式识别中的诸多问题,包括时间序列分析、分类、判别分析等,这些问题分别属于回归问题与识别问题,在以往数据挖掘方法中这些问题造成了较严重的困扰,因此支持向量机根据优势。本质上支持向量机是一般化线性分类器,具有能同时实现最小化经验误差、最大化几何边缘区,这也是支持向量机的一大特点。关于支持向量机的实现方法,首先将预处理后图像的输入向量、输出向量、内积导入向量机系统,其中输入向量为Pi,是13维特征向量、输出向量是Ti,是13维目标向量,两者结合可与13种不同的图像目标对应,其次假设每一种图像的目标值是Si,特征值为(xi1, xi2,…, xi13),其中x是图像目标的序号,则目标值与特征值之间的关系为Si=f(xi1,xi2,…, xi13)。在这层关系下通过支持向量机训练可以得到具体关系,训练中先提取若干样本构成训练集,后提取数量相同的样本作为测试集,结合径向基核函数获取核宽度参数P、容量误差参数C,随即从训练集中导出支持向量α,最后选择训练结果中数据误差最小的一组作为标准组。本文参照以上方式,选择了7个象棋棋子图像为目标进行了训练,结果见表1,根据表中结果可知支持向量机能够获取棋子图像的汉字。

表1:支持向量机图像特征提取结果

3.2.4 信息分类

支持向量机通过训练可得图像目标的特征值,可以看出不同图像之间的特征值完全不同,差值较大,因此其中没有重复的数据,故直接依照向量机训练结果可以对信息进行分类,即依照表1特征值,每个象棋棋子图像各为一类,但如果存在特征值完全相同或高度相似的情况,则相关图像为一类。

4 结语

综上,计算机视觉是计算机应用的关键节点,目的是让计算机识别信息,并作出对应决策,但要实现这一点模式识别非常重要,可以说缺少模式识别计算机视觉就难以成型。着眼于这一点,从模式识别的基本概念着手,相关人员要了解其具体应用方式,以便结合实际需求选型,再使用对应方法在计算机视觉中实现模式识别,全面开发计算机应用方式。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!