当前位置:首页 期刊杂志

基于图像检索与GPS定位相结合的地标识别系统

时间:2024-09-03

于岭岭,李 莉

(天津职业技术师范大学电子工程学院,天津 300222)

随着无线网络的发展和移动智能手机的普及,面向移动设备的地标识别成为当今学者们研究的热点之一。地标识别的对象一般是标志性建筑物或自然物。用户通过移动设备捕捉地标的视觉特征,便可获取该地标背景知识及其周边的商业信息、交通状况、景点环境等相关信息[1]。徐祥振[2]提出了一种基于SIFT 算法的地标识别方法,通过尺度不变特征变换(scale-invariant feature transform,SIFT) 图像匹配算法,完成对旅游景点的信息确认,但图像匹配并不能完全准确。罗文城[3]根据惯性导航数据规划建筑结构的路径图,实现惯性导航数据和图像地标相结合的室内定位方法,但由于传感器的限制,随着时间的增加,海拔信息的精度将下降。孙亚丽[4]设计了基于多传感器融合的室内地标识别系统,由于采集数据的传感器设备可能存在硬件性偏差,会对分析造成细微的误差。范音[5]提出了一种面向全景图的地标识别方法,若拍摄的图像间无重叠部分时,则无法实现有效拼接且易出现耗时长的问题。针对图像匹配的优势和不足,本文提出了一种使用图像检索与全球定位系统相结合的地标识别系统,旨在提高检索正确率和缩短检索时间,该研究采用加速稳健特征(speeded up robust features,SURF)算法对地标图像进行特征匹配,采用随机抽样一致性(random sample consensus,RANSAC)算法对特征点进行提纯,再次验证其有效性。

1 地标识别匹配算法

在用于地标识别的匹配算法中,SIFT 算法首先由Lowe[6]于1999 年在计算机视觉国际会议上提出,2004年再次经Lowe[7]完善后发表。该算法对于光线、噪声、微视角改变的容忍度很高,拥有大量信息,能够在海量数据库中快速准确地匹配。SURF算法由Bay 等[8]于2006 年提出,作为一种新兴的特征提取方法,它在可重复性、唯一性和鲁棒性方面接近或超越过去提出的类似方法,并在计算效率方面具有明显的优势。SURF算法的速度约为SIFT 算法的3 倍,检测到的特征点数约为SIFT 算法的1/3。此外,SURF算法还与图像大小、纹理复杂度和算法参数设置有关[9]。

SURF算法一般分4 步进行[10],算法匹配基本步骤如图1所示。

图1 算法匹配基本步骤

1.1 尺度空间的建立

图像的尺度空间可定义为原始图像和可变尺度的二维高斯函数的卷积运算[11]。在计算机领域中,尺度空间被象征性地表述为一个图像金字塔。其中,对于SIFT 算法的尺度空间建立,需要重复使用高斯函数对图像进行平滑处理并且下一层图像由上一层图像降采样得到,通过连续采样,一层一层直到塔顶,因此在特征点检测时运算量过大,消耗时间较长。而SURF算法是通过改变矩形滤波器的大小而不是改变图像的大小来获得尺度空间,同时使用积分图像来加速卷积运算。SURF算法直接使用不同尺寸的滤波器,实现多层图像同时被处理,从而减少时间,提高了运算速度。高斯金字塔如图2所示,从图2(a)中可知,SIFT 算法采用传统方式建立位于金字塔结构,并且图像的大小需要重置。

1.2 特征点提取

SURF算法在建立尺度空间之后,对于特定尺度图像下的关键点提取是基于Hessian 矩阵实现的。图像中像素点的Hessian 矩阵:

图2 高斯金字塔

因为特征点要具备尺度无关性,所以先要经过高斯滤波再构造Hessian 矩阵。经过滤波后的Hessian矩阵为:

式中:Lxx(x,σ)、Lxy(x,σ)、Lyy(x,σ)分别为高斯滤波二阶导数同I(x,y)卷积的结果

最后通过计算H 行列式的值判别特征点,为了方便应用,使用近似值代替。每个像素的Hessian 矩阵行列式的近似值为:

式中:Dxx,Dxy,Dyy为矩形滤波器同图像卷积运算后的值;w 为权重系数,一般取0.9,其为平衡准确值与近似值的误差而被引入。

1.3 特征描述子

SURF 中,在特征点的一个圆形区域中找到一个主方向,并且根据主方向选择边长为20 s(采样步长取s)的正方形窗口区域[12],然后将该区域分成16 个子区域,每个子区域计算5 s×5 s 范围内的小波响应。因此,在每个子区域中形成四维分量的向量并且求出每个子区域的特征向量,形成4×4×4=64 维的描述向量。该64 维的描述向量即为构成特征点的SURF 描述子,对于SIFT 算法而言,其描述子是4×4×8=128 维的描述向量。

1.4 特征匹配

描述子生成后,将两图像中各个尺度的描述子进行欧氏距离计算,距离越短则匹配度越高,再根据Hessian 矩阵迹(矩阵特征值的和)的正负号是否相同判断2 个特征点能否匹配。SIFT 算法与SURF算法基本类似,唯一不同的是SURF算法添加了Hessian 矩阵迹的判断,优点是当2 个特征点欧氏距离为0 时,若它们的Hessian 矩阵迹的正负号不同,则这2 个特征点不能匹配。

1.4.1 RANSAC算法

由于两图像中不同的2 点的纹理属性或颜色亮度相同而使得2 点的特征描述也很相似,进而导致了两图像之间出现大量误匹配[13]。因此,本文中的特征匹配过程中结合了RANSAC 算法剔除误匹配。RANSAC算法最早由Fischler 等[14]于1981 年提出,是一种鲁棒性的参数估计方法。该算法可以接受金字塔构造过程中产生的图像噪声,且最大程度地剔除误匹配点[15-16]。其原理是先随机抽取观测数据子集,假设所选取的子集是内点(即满足估计参数的点),然后使用该内点拟合适合于假设内点的模型,通过不断地迭代数据子集找到符合足够多数据的模型。

RANSAC 算法从SURF算法预匹配的数据集中随机删除一些匹配点对,并计算变换矩阵H,记为模型M。然后计算模型M 与数据集中数据的投影误差,如果误差小于阈值,则加入内点集I。最后,判断当前内点集I 是否大于最优内点集,若大于则更新最优内点集为I,同时更新迭代次数k。若此时得到的模型符合足够多的数据,则退出;否则迭代次数增加1 并重复上述步骤。迭代次数k 计算式为:

式中:p 为置信度,一般取0.995;w 为内点个数与所有点的比例;m 为计算模型需要的样本数,最小样本数一般取4。

2 系统设计与实现

2.1 地标识别系统

地标识别系统主要分为用户端和服务端两大部分。用户端部分主要是图像采集与获取定位结果,在图像采集过程中移动设备的GPS 服务需要处于开启状态。服务端部分包括数据库模块、位置信息提取模块、特征提取模块和地标识别匹配模块。数据库模块用于存储数据集的数据信息,供查询使用;位置信息提取模块的作用是提取图像位置信息为数据库模块实现基于位置信息的初步筛选;特征提取模块是提取图像的特征;地标识别匹配模块将候选图像与查询图像进行特征匹配,最后通过特征点数量的多少判定匹配的结果,将结果输出。地标识别系统结构如图3所示。

图3 地标识别系统结构

2.2 系统实验

移动设备在拍摄图像时通过内部GPS 定位获取信息。该系统实验的图像数据来源于OPPO 手机拍摄的天津职业技术师范大学的建筑物,共有4 个不同的地标收集图像数据集。取其中30 幅图像作为数据库图像,剩余的16 幅图像视为查询图像。数据库中的地标位置信息使用的是谷歌地球上的定位位置。

本系统实验的查询图像利用SURF算法和RANSAC 算法与经过位置信息筛选的候选图像进行匹配。对于匹配准确度而言,采用内部测试的方法,即将数据库里的图像逐一与其余的图像进行匹配查询,并将其结果视为本系统的准确度。选取的4 个建筑物的相对位置如图4所示。

图4 4个建筑物的相对位置

2.3 实验结果与分析

2.3.1 RANSAC提纯

SURF算法特征点匹配结果如图5所示。相应地,RANSAC 算法提纯的最优匹配结果如图6所示。从图6 中能够看出,提纯后匹配点数明显减少,提纯的效果比较可观,剔除了误匹配。

图5 SURF算法特征点匹配结果

图6 RANSAC 算法提纯的最优匹配结果

2.3.2 不同因素影响下的图像匹配

不同因素影响的图片匹配效果对比如图7所示。SURF算法针对图片的平移、旋转、光度变化做了测试,通过测试验证了SURF算法不会因为照片拍摄的不良因素对检测结果造成较大的影响。

2.3.3 检测精确度与时间

本文测试数据集的内部准确性,精度对比结果如表1所示。SIFT 算法、SURF算法分别在无GPS 位置信息与结合GPS 位置信息的情况下进行测试。

图7 不同因素影响的图片匹配效果对比

表1 精度对比结果

从表1 中可以看出,SURF算法在有GPS 位置信息的判别下,得到的识别精度比无GPS 位置信息精准,精度可高达96.67%。SIFT 算法同SURF算法一样,在无GPS 位置信息的辅助下识别精度比较差,结合GPS 位置信息后,其精度也达到96.67%。还可观察到SURF算法识别的准确率很大程度上依赖GPS 位置信息的辅助,才能达到理想效果。实验中发现,因为学校建筑物较为集中,某些建筑物的距离很近,在某些位置有多于1 个建筑物的GPS 信息且都在计算的距离差值之内,则只对距离差值最小的前3 个建筑物进行图像匹配识别,并最终选取匹配点数最多的建筑物为结果。此外,校园中树木、高楼等遮挡比较多的地方,GPS 信号比较弱,初始定位误差较大,导致SURF算法无法实现匹配;遇到植物较多、图像复杂的情况,则定位结果主要依赖GPS,如果此时GPS 信号也弱,则无法实现正确匹配。

对于检测时间而言,将同一图片在不同的条件下进行检测,每个条件下分别测试了500 次并对获得的检测时间结果求平均值,测试时间对比如表2所示。

表2 测试时间对比

从表2 中可以看出,SURF算法结合GPS 位置信息筛选候选图像在一定程度上提高了算法时间效率,但SIFT 算法如预期一样消耗时间最长。实验表明,与图像特征提取SIFT 算法相比,SURF算法在时间效率上有了很大的提高,并且在结合GPS 位置信息后检测时间进一步缩短。对一幅480×640 的建筑物图片分别用SURF算法和SIFT 算法检测,在执行时间上相差3~4 倍,这与SURF算法采用了Haar 小波响应和积分图像的概念有很大的关系。

3 结 语

本文提出了一种基于图像检索与GPS 定位相结合的地标识别系统。通过实验验证了结合GPS 定位信息对地标图像匹配精度提高明显,以及SURF算法结合GPS 位置信息识别地标过程在时间上的优势。后续将针对地标识别算法做更进一步的优化研究,使系统运行时间更快,精度更高并能完成手机端的系统设计,然后运用公共数据库对其进行验证。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!