时间:2024-07-28
王令
(广州科技职业技术学院,广东广州510550)
对视觉信息的检索需要根据图像所表达的内容来进行。基于内容的图像检索方法是获取和利用视觉信息的有效手段,只有根据内容进行检索才可能有效地获取需要的信息,同时在掌握信息内容的基础上才有可能有效地管理数据库中的信息。基于内容的查询还能帮助计算机调度图像,对分布式多媒体数据库,可减少网络上的传输量。基于内容的图像检索是借助对视觉媒体从低层到高层进行处理、分析和理解的过程获取其内容并根据内容进行检索。它涉及到对图像的视觉信息进行有效地查询、索引、浏览、搜索和提取,而且这种工作是直接根据图像的内容含义而展开和进行的。
基于内容的图像检索系统(图1)支持根据视觉内容的检索。对视觉信息的访问不仅在概念层利用关键字进行(与在文字领域类似),而且也在感知层利用对图像内容的客观测量和合适的相似模型进行。在离线状态,不仅注解员可通过一定的方法对数据库内容进行注解,而且系统也自动地对数据库图像进行分析、提取特征,从而提供出在线应用时所需的多维索引。用户不仅可以借助文字查询方法,也可以借助视觉浏览和范例查询方法,利用搜索引擎进入索引进行检索,返回的结果仍可以用可视化的手段显示给用户,使用户能借助相关反馈开始新一轮查询。由此可见,对原始数据的处理和分析是系统功能不可缺少的一部分。HSL、YIQ)以及分块加权HSV颜色直方图比较的实验结果,并且综合图像的颜色和纹理特征以及纹理和形状特征进行图像检索时,采用了基于灰度共生矩阵的纹理特征提取和基于不变矩的形状特征提取方法,并在此基础上加入了基于权重调整的相关反馈机制,使用户可以参与检索过程,通过调整权重使得检索结果最终满足用户的检索要求。
图1 第二代基于内容的图像检索系统工作流程图
文中给出了六种颜色空间(HSV、YUV、RGB、XYZ、
图2 基于内容的图像检索系统基本框架
颜色和纹理、纹理和不变矩是图像检索中使用最为频繁的视觉特征。人眼观察图像时往往不是只基于某一个特征,而是综合多种特征。因此综合多特征的检索算法比单一特征的检索算法更符合人的视觉感受。在这里先计算各个子特征的距离度量,再组合这些子特征距离得到全局相似距离。
由于特征向量中各个分量具有不同的物理意义和取值范围,需要对特征向量进行内部归一化。本文采用了效果较好且最常用的高斯归一化方法。一个N维的特征向量可记为:F=[f1,f2,…,fN]。如果用I1,I2,…,IM代表图像库中的图像,则对其中任一幅图像Ii,其对应的特征向量为Fi=[fi,1,fi,2,…,fi,N]。假设特征分量值系列[f1,j,f2,j,…,fM,j]符合高斯分布,可计算出其均值mj和标准差σj,然后利用下式将fij归一化至区间[-1,1]:
根据公式(1)归一化后,各个fi,j均转变成具有N(0,1)分布的。图像的相似性度量采用绝对值距离,因为绝对值距离计算复杂度小,且能取得比较好的检索结果,即:
其中Xk,Xj表示两个样本的特征向量。xki,xji则是相应的第i个分量。
基于内容的相似性检索可以划分为三种类型:
①区间查找:从数据库找出所有符合如下条件的图像:图像特征的值分别在用户指定的区间内。
②K-最近邻查找:从数据库返回与检索样本最相似的前K个图像。
③限定误差范围内查找(a-cut):从数据库找出与检索样本的相似度不小于a的所有图像。
本文采用第②种方法,当图像由多个不同的底层视觉特征描述子表示时,把这些特征参数组成一个向量是比较自然的想法。比如把x1,x2,…,xk个特征描述子用k维向量空间中的一个向量(空间中的点)代表。在向量表示的特征空间中进行区域查找等同于查找位于空间中的超立方体中的点。
为了支持最近邻查找,特征空间必须具备相似性度量的能力。两个向量的相似性可以用多种方法进行度量,一般分为距离度量和非距离度量两大类。
本文采用一般的欧式距离,一般的欧式距离公式:
K为正定的,不一定为协方差阵。
高维数据索引是数据库、信息检索等多个领域的研究热点,并且新的研究结果在不断涌现,比如高维索引方法一般分为向量空间方法和度量空间方法。本文采用高维索引方法时中的度量空间方法。
度量空间方法检索数据库对象的距离而不是数据对象本身。其优点是可以灵活选择合适的距离度量方法,减少检索时的度量计算开销。度量空间法可以很好地支持最近邻查找,但是一般并不支持区间查找。常用的度量空间法高维索引结构为:VP-树和M-树。
为配合空间地理遥感卫星图片研究,实验数据库特采用中国科学院“全国资源环境遥感数据库”,它是像素栅格图形数据库的地图投影,其数学基础为ALBERS等积圆锥投影。
对一幅给定的检索图像,设N是图像库中相似图像的总数,n是提取出的相似图像数,T是系统提取出的总图像数,则检索效率定义为:
当进行了一系列检索实验时,如果在某些实验中N>T而在另一些实验中N<T,那么根据式(2),某些实验结果就会比其它实验结果被赋予较大的权重。为了避免这个问题,以在一致的条件下比较不同的技术,需要提取比相似图像的总数更多的图像,即总要取N<T,这样不仅可以确定是否所有相似图像都提取出来了,还可以确定这些图像的排序是否正确。
本文实验中取M=8类进行检索,并且N>20,T=20检索率结果取百分整数。
表1 纹理和不变矩综合特征检索效率
从实验数据可以看出采用综合特征检索后。纹理权重占50%时平均检索率最高。图像特征入库提取的平均速度也很快,在海量的遥感卫星图片中,要提取自己想找到的图片可以通过这种方法进行特征比对。
图3 纹理权重对应检索率
从图3可以看出,综合纹理和不变矩特征检索的平均最高检索率比综合纹理和颜色特征的平均最高检索率高出约2%,并且当纹理权重占50%时平均检索率最高。
图4是依据本文理论设计的图像检索系统,待检索的目标图像已提取出来,将图像按纹理和不变矩特征入库,然后按纹理加权权重检索图像。
经过上面的分析和比较,基于内容的图像检索要分析被检索图像本身的特征,要从海量的图像里快速检索目标图像,必须针对图像本身的特征应用不同的方法提取图像的特征入库,实验证明卫星遥感图片便用纹理加权权重和不变矩综合检索的效率较高。
图4 检索系统检索卫星遥感图片截图
[1]G.Ayala,J.Domingo,Spatial size distributions.Applications to shape and texture analysis,IEEE Trans.Pattern Anal.Mach.Intell.23(12)(2001)1430-1442.
[2]章毓晋.基于内容的视觉信息检索[M].北京:科学出版社,2003.
[3]唐立军,段立娟,高文.基于内容的图像检索系统[J].计算机应用,2000,10(7):41245.
[4]李向阳,鲁东明,潘云鹤.基于内容的图像检索技术与系统[J].计算机研究与发展,2001,38(3):344-354.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!