当前位置:首页 期刊杂志

人工智能中的图像识别技术探讨

时间:2024-05-18

石铁山

摘 要:近年来,伴随着图像处理技术的飞速发展,图像识别技术被广泛应用在各个领域中,发挥着越来越重要的作用。图像识别技术作为一种建立在信息技术基础上的技术,其主要是借助计算机替代人工,快捷地处理各种物理信息。本文就人工智能中的图像识别技术进行简单探讨。

关键词:人工智能 图像识别 技术

中图分类号:G64 文献标识码:A 文章编号:1672-3791(2018)12(c)-0015-02

伴随着计算机技术和微电子技术的快速发展,推动了图像识别技术的产生和发展,并逐渐成为人工智能领域中重要的组成部分,并广泛地运用于面部识别、指纹识别、医疗诊断、卫星云图识别等领域中,发挥重要作用。

1 图像识别技术概述

1.1 图像识别技术的含义

图像识别技术主要指的是通过对比存储的信息(存储在记忆中的信息)和当前信息(进入感官的信息)从而识别图像的一种技术。图像识别技术是建立在图像描述的基础上,而描述主要指的是通过符号或者数字等对景物中或者图像中的相关特征予以描述,甚至描述目标相互之间的关系,从而获得目标特征以及相互之间关系的一种抽象表达。在应用图像识别技术提取图像或者景物中的个性特征时,可以借助模板匹配模型。在具体应用实践中,特别识别除了要弄清识别的对象具有是什么样的物体外,还应该明确其所在的位置和姿态。当前图像识别技术已经被广泛应用的各个领域中,例如交通领域中的车牌号识别、交通标志识别;军事领域中的飞行物识别、地形勘察;安全领域中的指纹识别、人脸识别等。

1.2 图像识别技术的原理

众所周知,人眼才能产生视觉效果,可见人的眼睛具有很强的图像识别能力。当图像所处的位置、角度、距离等发生改变时,视觉效果也会相应改变,在人眼视网膜上形成的图像形状和大小也会相应改变,但是这并不会影响人们对图像的判断。图像识别作为人工智能中重要的构成部分,该技术的原理其实跟人眼识别的原理存在相似性,都是基于图像具有明显的特征。图像特征作为图像识别的重点,以英文大写字母“A”为例,该字母有一个突出的尖角,O存在一个圈,而Y可以看作是有钝角、锐角、线条共同构成,通过捕捉和识别这些特殊信息,便可以实现图像的识别。另外,客观地判断图像的性质和内容,并对其代表的含义进行分析。图像识别技术更为贴切地模仿人眼识别图像的原理,缩小该技术和人眼识别效果二者的差异,借助专门的计算机程序,模拟人类对图像的识别过程,从而获得更多涉及图像识别的模型。当计算机捕捉到某个图像时,假如该图像特征能够匹配到人记忆中的感官刺激,便可以成功识别出该图像[1]。

2 人工智能中图像识别技术的过程

由于图像识别技术的产生是基于人工智能的基础上,所以计算机图像识别的过程与人脑识别图像的过程大体一致,而计算机图像识别仅仅是通过科技和技术的形式展现出来,归纳起来,该过程主要包括4个步骤:第一,获取信息数据。获取信息数据是图像识别的前提,获取数据主要是借助各种传感器将光、声音等特殊信号转变成电信号,以获得相应的信息和数据,在图像识别技术中,获取的信息通常为图像的特征以及特殊数据,并且保证这些数据和信息能够用于区分不同图形的特征,并将其存储在计算机数据库中,以便为接下来识别做准备。第二,预处理信息数据。这一过程的操作主要包含对图像去噪、变换、平滑等,主要目的是凸显图像的特征和重要信息。第三,抽取和选择特征。抽取和选择图像的特征作为图像识别技术中核心部分,特别是在识别这一模式下,对图形的特殊提出了严格的要求,主要是因为抽取和选择图像特征质量直接影响着图像最终是否能够被成功识别,简而言之这一过程就是提取不同图像的特殊特征,提取不同图形的特殊特征,选择出能够区分图像的特征,然后有选择地存储这些特征,并让计算机对这些特征进行记忆。第四,设计分类器并分类决策。该步骤乃图像识别的最后一步,设计分类器主要指的是通过某种程度制定出一个识别规则,通过该规则能够根据某种规律来识别图像,从而提高图像识别过程的辨识率,通过该规律能够凸显出相似的特征,从而提高图像识别过程的辨识率,此后再通过识别特殊特征,最终实现对图像的评价和确认[2]。

3 人工智能中的图像识别技术的常见形式

3.1 模式识别形式

在人工智能的图像识别技术中,最有效的模型便是模式识别,模式识别能够在大量数据和信息的基础上识别图像。模式识别形式是相关领域研究者在总结多年实践经验和对图像识别的认知基础上,运用计算机开展相关计算,再应用数学原理进行推理,从而自动完成识别图像的形状、字符、格式、曲线等各个特征,在识别的同时评价这些特征。模式识别模式主要由两个阶段构成:一是学习阶段,该阶段的实质为存储过程,即提前采集并存储图像特殊的特征、信息、样本等,在利用计算机的存储记忆功能按照既定的识别规律对这些熟悉聚合信息进行分类和识别,最后构成对应的图像识别程序。二是实现阶段,该阶段要求图像必须跟脑中的模板完全符合,这样才能确保识别程序的完成,站在现实角度分析,计算机的识别功能和人脑识别功能存在较大的差异,对计算机而言,其在识别过程中可以按照之前存储的特征、信息、数据等,将其与最新获得的图像信息作匹配,假如按照一定的规律二者可以成功匹配,那么证实该图像已经被识别。值得注意的是:这种识别是有限的,因此假如某些特征非常相似,便很有可能识别错误。

3.2 神经网络图像识别形式

这种识别属于一类比较新型的识别形式,神经网络图像识别形式是在传统图像识别的基础上融合神经网络算法。该形式中,神经网络属于人工神经网络中最具代表性的类型,但是其并不是动物本身存在的神经网络,而是人类模仿动物神经网络后通过人工的形成产生的。在神经网络图像识别形式中,遗传算法和BP网络二者有机融合构成的神经网络图像识别是最具代表性的一类,并且被广泛应用在各个领域中。运用神经网络图像识别形式对图像识别时,通常需要先对图像的特征进行提取,再将提取到的图像所有特征映射到神经网络上,通过这种方式对图像识别分类。

3.3 非线性降维识别形式

对计算机图像识别技术而言,其最大特征为异常高维,这主要体现于不管图像其自身的分辨率高低,该图形形成的数据信息大部分拥有多维性特征,如此一来便增加了计算机识别难度。如果要想提升计算机图像识别的能力,降维是最直接也最有效的方式。降维又由两类构成,一是线性降维;二是非线性降维。其中比较常见的线性降维方法有主成分分析(PCA)和线性奇异分析(LDA)两类,线性降维最大优点为理解,不难理解,但是线性降维是对整体的数据集合开展处理,因此获得的投影为最优低维度。但是在将线性降维运用在实践中,发现运算的过程很复杂,并且需要占据较大的空间,耗费较长的时间。非线性降维是在线性降维的基础上诞生的,这种图像识别技术属于一类高效的非线性特征提取方法。非线性降维识别形式能够有效发现图像的非线性机构,并且能够在保证不破坏其基本结构的前提下实现降维,从而确保了计算机图像识别尽可能在最低的维度上运行,极大地提升了识别的速率[3]。

4 结语

综上所述,随着科技的不断发展和进步,图像识别技术作为现代科技发展的产物,受到了社会各界的广泛关注,并且逐渐被广泛运用在各行各业中。本人坚信,在未来的发展中,图像识别技术将不断得到推广和普及,造福人类。

参考文献

[1] 张嘉丰.关于人工智能中图像识别技术的研究[J].电子技术与软件工程,2018(23):250-251.

[2] 孟广仕.图像识别技术在人工智能中的应用[J].信息與电脑:理论版,2018(12):152-153.

[3] 宋炯,柏松平,燕华.基于人工智能的图像识别技术探讨[J].科技传播,2018,10(1):106-107.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!