时间:2024-05-20
杨焯雅
摘 要 随着互联网的发展,网络上的图像数据呈现爆炸式增长,基于内容的图像检索技术应运而生。文章描述了基于内容的图像检索(CBIR)系统的设计与实现。该系统使用颜色矩、旋转不变局部二值模式、Harris角点检测分别对图像的颜色特征、纹理特征和角点分布情况进行描述,采用局部敏感哈希(LSH)实现相似性检索。可以根据用户输入的图像,输出图像库中的相似图像。该特征描述方法特征向量维数小,对图像旋转、尺寸变化具有鲁棒性,且有较高的识别率和较短的识别时间。
关键词 图像识别;颜色矩;旋转不变LBP;Harris角点检测;局部敏感哈希
中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2018)211-0137-05
图像具有直观、生动的特点,现已成为信息表达和资源共享的主要形式。Facebook平均每天新增照片3亿5 000万张,用户累计上传图像达2 500亿。如何高效地利用丰富的图像资源,对图像的内容进行描述、组织和检索,是未来的机遇与挑战。
传统的图像检索基于文本信息(TBIR),依赖用户上传图像时设定的标签或标题,或者采取人工的方式对图像进行标注、分类。传统的TBIR存在以下问题:
1)人工标注具有主观性,且图像包含的信息丰富,难以用文本全面描述。
2)图像数量庞大,人工标注效率低、成本高。
3)世界范围内语言种类庞大,同样的图像对应若干种不同语言的文本信息,难以统一[ 1 ]。
为了跨越语义的鸿沟,实现图像的自动分类,基于内容的图像检索技术应运而生并得到迅速发展。本文所述的CBIR模型用Matlab GUI搭建用户交互界面,用颜色矩、旋转不变局部二值模式、Harris角点检测提取图像特征,用局部敏感哈希实现相似性检索。对图像旋转、尺寸变化具有鲁棒性,且有较高的识别率和较短的识别时间。
1 数据集描述
数据集有1 000张图片,19个类别,包括建筑、人物、自然、布料、食物等多个方面。图片的长边像素、宽边像素在100px~3000px之间不等。部分图片及数据集描述如图1、表1所示。
2 图像特征提取
2.1 颜色特征
2.1.1 颜色矩
颜色特征作为最显著、稳定的视觉特征,是人识别图像的主要感知方式。与其他特征相比,颜色特征对图像的方向、尺寸、视角,依赖性较小,具有较高的鲁棒性。常见的颜色特征表示方式有颜色直方图、颜色矩、颜色熵。其中颜色矩维数较小,简洁高效,可以对图像进行快速有效地初步筛选。
Stricker和Orengo提出了颜色矩的图像特征提取方法[ 2 ],利用图像3个颜色分量上的一阶矩、二阶矩、三阶矩表示图像的颜色特征。具体计算公式如下:
2.2 纹理特征
2.2.1 旋转不变局部二值模式
纹理特征是图像重要的底层特征,与颜色特征相比,不容易被人感知。图像的纹理特征通过像素及其周围邻域的灰度分布来表现,描述了图像中反复出现的局部模式和他们的排列规律。常见的纹理特征表示方式有灰度共生矩阵(GLCM)、局部二值模式(LBP)、小波变换等。
局部二值模式(LBP)由Ojala等人提出[3],较GLCM计算复杂度低,简单高效。又可以分为灰度不变LBP(Gray Scale Invariant Pattern)、旋转不变LBP(Rotation Invariant Pattern)、等价LBP(Uniform Invariant Pattern)。其中旋转不变LBP采用二进制循环移位的原理,将灰度不变LBP的模式由256种减少至36种,同时增强了LBP算子对图像旋转变化的鲁棒性,是对图像纹理特征的有效描述。旋转不变LBP的计算方式如下:
以中心像素gc(xc,yc)为圆心R(单位:像素)为半径作圆。选取圆上均匀分布的P个像素点。P = 4,R =1.0,P = 8,R =1.0时,如图2所示。
2.3 角點分布情况
2.3.1 Harris角点检测
Harris算子是Harris于1988提出的角点检测子[5]。算法基本思想是使用一个固定窗口在图像上进行任意方向的微小移动,比较移动前后,窗口中像素的灰度变化程度。如果任意方向的移动,都有较大的灰度变化,那么可以认为该窗口中存在角点。
基于内容的图片检索系统主要分为.mat图像特征库和Matlab GUI两部分。要实现基于内容的图片检索,实际上就是将输入图片的特征向量与数据库中已有图片的特征矩阵进行相似性匹配。分为以下几步:
1)建立已有图像的特征库。依据之前叙述的方法,计算每张图片颜色矩特征向量Fcolor(9维)、LBP特征向量Flbp(36维)、Harris特征向量Fharris(25维)。对图像库中的1000张图片进行预处理,得到大小为1000×70的特征矩阵。与图像的其他信息封装成结构体,存储在.mat图像特征库中。
2)GUI界面处理用户的请求,与用户交互。用户在GUI界面选择一张图片输入生成该图片对应的70维特征向量,作为相似性检索的输入。
3)进行相似性查找。根据输入图像的特征向量,在图像特征库中,利用局部敏感哈希算法进行相似性查找,得到相似性最高的前m个图像的编号。
4)将查找到的相似图片显示在Matlab GUI上。
5 系统测试与分析
本文实验是在Mac PC机上进行的,采用MatlabR2017b作为仿真实验平台。图像特征库包括1 000张图片,19个类别,包括建筑、人物、自然、布料、食物等多个方面。图片的长边像素、宽边像素在100px—3000px之间不等。系统界面与识别效果如图6。
在系统的测试中,每个类别随机选取5张图片,依据Matlab GUI上图像的显示情况,计算每个类别的识别准确率。5次实验平均准确率大于70%的类别如表4。表4中2-6列表示五次实验识别准确的图片数量。
准确率较低的类别如表5。
从中可以看出,当图像具有明显的颜色特征时,如crayfish、Aquatics;或者具有明显的纹理特征时,如mb,识别效果较好。ls类图像虽然色彩各异,但角点分布规律,以碎花图案为中心在整幅图像均匀分布,识别效果较好。系统对于人物活动类图像,Running、RidingBike,识别准确率较低。人物活动类图像,色彩、纹理和角点分布相似,系统对于人物动作的分析能力有限。
6 结论
本文描述了基于内容的图像检索(CBIR)系统的设计与实现。该系统使用颜色矩、旋转不变局部二值模式、Harris角点检测分别对图像的颜色特征、纹理特征和角点分布情况进行描述,采用局部敏感哈希(LSH)实现相似性检索。对于具有明显颜色特征、纹理特征、角点分布特征的图像,识别效果较好。特征提取算法对图像旋转、尺寸变化具有鲁棒性,特征向量维数较小,简洁高效。系统具有较高的识别率和较短的识别时间。
参考文献
[1]王爱芳.基于内容的图像检索系统的设计与实现[D].马鞍山:安徽工业大学,2017.
[2]Stricker A M A, Orengo M. Similarity of Color Images[J]. Proc Spie Storage & Retrieval for Image & Video Databases, 1995,2420:381-392.
[3]Ojala T, Pietik?inen M, M?enp?? T. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[C]// European Conference on Computer Vision. SpringerVerlag,2000:404-420.
[4]于亞风.基于局部二值模式的纹理特征研究与应用[D].成都:西南交通大学,2017.
[5] Harris C. A combined corner and edge detector[J]. Proc Alvey Vision Conf,1988, 1988(3):147-151.
[6]卢伟家,刘缠牢.一种基于Harris特征点检测的改进算法[J].仪表技术与传感器,2017(12):98-100,104.
[7] Gionis A, Indyk P, Motwani R. Similarity Search in High Dimensions via Hashing[C]// International Conference on Very Large Data Bases. 1999:518-529.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!