时间:2024-05-04
王晶仪 王艳霞 朱原雨润 张领
摘要:眼动追踪的应用很广泛,而瞳中心孔定位是眼动跟踪中的一项基本任务。基于图像梯度的瞳孔中心定位算法比较精确,但是难以在精度和速度之间取得平衡,因此使用ALO优化算法对其改进,在保证精度的同时,大幅提升其算法速度。经过实验证明,改进之后的算法,对于一张32×24大小的图片,其瞳孔中心定位速度由4秒提升到1秒以内,中心点平均误差在1.2个像素差左右。
关键词:ALO算法;图像梯度;瞳孔定位;眼动追踪;眼球中心
中图分类号:TP301 文献标识码:B
文章编号:1009-3044(2022)17-0086-03
眼动跟踪一直是个值得研究的领域,它有着广泛的应用,如自闭症谱系障碍早期诊断[1],利用自闭症儿童与普通儿童不同的注视模式,可以进行自闭症儿童的辅助诊断。人机交互[2]方面,通过眼睛操作虚拟现实场景或游戏,既可以减缓眼睛的疲劳,又可以通过捕捉用户注视点,增强注视点区域图像,从而呈现出高质量图像,提升用户体验。神经学营销[3]领域,追踪顾客视线的移动轨迹,可以发现顾客对什么产品更感兴趣。疲劳驾驶检测[4]领域,及时跟踪判断驾驶员的视线注意力情况,连续提醒驾驶员预防疲劳驾驶。可见眼动追踪的应用领域十分广泛,而瞳孔中心定位是眼动跟踪的基本任务,具有很高的研究价值。
在瞳孔中心定位领域中,Daugman等人[5]提出了一种利用图像梯度进行精确和稳定的瞳孔中心定位的方法,后文简称MOG瞳孔中心算法。该方法给出了一个只包含点积的目标函数,这个函数的最大值对应于大多数图像梯度向量相交的位置,由此确定眼睛的中心。
MOG算法精度很高,但是计算量大,对于每个像素,都需要计算其目标函数值。因此,本文使用ALO优化算法[6](antlion optimization)对其进行改进。ALO算法即蚁狮算法,是2015年被人提出来的一种仿生优化算法,具有全局优化、调节参数少、收敛精度高、鲁棒性好的优点,已被应用到SVM[7]、Elman神经网络[8]等场合。经过验证,将ALO优化算法与MOG瞳孔中心算法结合,可以大幅提升定位算法速度,同时也保持了算法的精确度。
1相关技术
1.1 图像梯度
图像的梯度是指图像某像素点在[x]和[y]两个方向上的变化率,假设有一幅图像[f],且[f(x,y)]是像素点[(x,y)]的灰度值,那么點[(x,y)]在[x]方向和y方向的梯度分别为:
[gx=?f(x,y)?x=fx+1,y-f(x,y)] (1)
[gy=?f(x,y)?y=fx,y+1-f(x,y)] (2)
其中,点[(x,y)]的梯度向量就是[(gx,gy)]。
1.2 MOG瞳孔中心算法
MOG瞳孔中心算法给出了一个用于确定瞳孔中心的适应度函数,适应度最大的像素点就是瞳孔中心。其算法原理如下:假设有人眼图片中有一个圆形的虹膜,首先在图像中取2个坐标点:[o]和[xi],其中点[o]是假设的瞳孔中心点,点[xi]是虹膜边缘上的点,如图1所示。
其次计算两个向量:[di]和[gi],其中[di]是点[o]到点[xi]的向量,[gi]为点[xi]处的梯度向量。
[o=(x0,y0)],[xi=(x1,y1)] (3)
[di=xi-o=(x1-x0,y1-y0)] (4)
[gi=(gx,gy)] (5)
根据向量的点积公式可知,当两个向量都是单位向量,那么它们的夹角[θ]越小,则点积值越大。[di]与[gi]两个单位向量的点积如下所示。
[di?gi=digicosθ] (6)
[di=xi-o∥xi-o∥2,?i:∥gi∥2=1] (7)
如图1(a)所示,当[di]与[gi]两个单位向量方向不同,它们的点积值范围是[[-1,1)];如图1(b)所示,当它们方向相同(即夹角为0°),则点积为最大值1,而此时点[o]恰好是正确的圆心点。因此,可以通过计算[di]与[gi]向量的点积来求取最优圆心点。
又因为与巩膜、皮肤相比,瞳孔通常是暗的,因此将每一个像素点的亮度权值[wc]融入目标函数中,当某像素点灰度值越小(图像越暗),[wc]取值越大。最终,瞳孔中心的适应度函数如下所示,当某个像素点的适应度最大时,就是瞳孔中心点。
[C=1Ni=1Nwc(dTigi)2] (8)
[wc=255-fx,y] (9)
1.3 ALO优化算法
ALO算法包含以下几个角色:蚂蚁,蚁狮,精英蚁狮。蚂蚁表示尝试解,蚁狮表示局部最优解,精英蚁狮表示全局最优解。蚂蚁围绕蚁狮随机走动,还会因为陷阱会滑向蚁狮。在每次蚂蚁随机走动之后,根据蚂蚁和蚁狮的适应度大小来更新蚁狮。每轮迭代完成会选取适应度最优的蚁狮作为精英蚁狮,这样可以避免陷入局部最优解。通过不断地迭代,在局部最优解附近寻找更优解,最后得到一个比较精确的全局最优解。
2基于ALO优化的MOG瞳孔中心算法
在MOG瞳孔中心定位算法中,需要求解最大值的目标适应度函数是公式(8),解空间是图像中的像素坐标范围[(x,y)]。使用ALO算法对其进行求解,首先初始化蚂蚁、蚁狮的坐标,使用轮盘赌算法让每一只蚂蚁随机选择一只蚁狮进行随机游走,蚁狮的适应度越大,被选择的概率越大。然后通过随机游走函数[Xt]确定蚂蚁随机游走的步数集合。
[w=-1, 0 [Xt=i=0tw] (11) 其中t是迭代的轮次,[r]是0到1之间的随机数。 确定游走步数集之后,还要根据蚁狮的陷阱范围确定其游走范围。蚁狮的陷阱范围只与当前迭代次数有关,随着迭代次数的增加,陷阱比例逐渐减小,蚂蚁随机游走的范围也会逐渐减小,这里将陷阱比例I改为如下公式。 [I=0.8, t<0.5T0.6, 0.5T≤t<0.6T0.4, 0.6T≤t<0.7T 0.3, 0.8T≤t<0.9T 0.2, t≥0.9T] (12) 其中[T]为算法迭代轮次总数。 蚂蚁在选择的蚁狮陷阱内随机游走的坐标范围如下公式: [cti=antliontj+c×I] (13) [dti=antltontj+d×I] (14) 其中,[c]是坐標取值范围的最小值,[d]是坐标取值范围的最大值,[I]是陷阱比例,[cti]是第[t]轮第[i]个蚂蚁坐标取值范围的最小值,[dti]是第[t]轮第[i]个蚂蚁坐标取值范围的最大值,[antliontj]是第[t]轮第[i]个蚂蚁选择的蚁狮坐标位置。 得到游走步数和游走范围之后,就可以计算蚂蚁的具体游走坐标。为了防止蚂蚁游走到坐标范围之外,因此还需要通过以下公式对游走坐标进行规范化。 [Rti=Xti-Xmini×(Xmaxi-cti)(dti-Xmini)+cti] (15) 其中,[Xti]是第[t]轮第[i]个蚂蚁随机游走的步数,[Xmini是]第[i]个蚂蚁随机游走步数集合中的最小值,[Xmaxi是]第[i]个蚂蚁随机游走步数集合中的最大值。 蚂蚁的游走范围还会受到精英蚁狮的影响,要算出蚂蚁围绕选择蚁狮和精英蚁狮的随机游走坐标,取其平均值得到蚂蚁最终的游走坐标。 [Antti=RtA+RtE2] (16) 其中[RtA]是第[i]个蚂蚁第[t]轮绕着轮盘赌选择的蚁狮随机游走的位置,其中[RtE]是第[i]个蚂蚁第[t]轮绕着精英蚁狮随机游走的位置,[Antti]是第[i]个蚂蚁第[t]轮的最终像素坐标。 2.1算法流程伪代码 N: 种群数量; dim: 解的维度; t: 当前迭代次数; T: 最大迭代次数; ant: 蚂蚁的坐标;antlion: 蚁狮的坐标; elite: 精英蚁狮坐标 antlion_finess: 蚁狮适应度值; elite_fitness: 精英蚁狮适应度值 根据适应度函数公式(8)计算第一代蚁狮的适应度值并按降序排序 elite更新为适应度最大的蚁狮 while t for i = 1∶N 根据蚁狮适应度值,蚂蚁使用轮盘赌方法选择蚁狮, 根据公式(10)~(15)计算蚂蚁围绕被选中蚁狮的随机游走的坐标 根据公式(10)~(15)计算蚂蚁围绕精英蚁狮随机游走的坐标 根据公式(16)更新蚂蚁最终的游走坐标 计算蚂蚁游走后的适应度值并与上一代蚁狮合并,并按适应度按降序排序 选择适应度值最大的前 N 个个体为当代蚁狮种群antlion if antlion_finess( 1)elite_fitness = antlion_finess( 1) end if t++ end while 3实验结果及分析 为了验证本研究改进的算法的速度提升和准确度可靠性,在一台Intel(R) Core(TM) i5-9300H2.40 GHz16GB的PC机上进行实验。使用20张眼睛图像进行实验,每张图片大小为32×24像素。首先使用原始的MOG瞳孔中心算法计算出每张图片的瞳孔中心坐标,如图3所示,每张图片适应度最大的点就是瞳孔中心点。 然后使用基于ALO改进的梯度相应定位算法对其进行中心点计算,实验结果如表1所示。在以下的参数设置中,最短运行时间为542ms,其误差为1.363像素;最长运行时间为792ms,其误差为1.072像素。而原始的MOG瞳孔中心算法对于一张32×24的图片计算需要3800ms。可见使用ALO优化算法改进之后,在速度上得到了很大的提升,同时也保持了瞳孔中心定位的精确性。 4结论 本文将ALO优化算法应用基于梯度响应的瞳孔定位算法,进行瞳孔中心适应度函数寻优,可以提升定位速度,同时保证其精确度。可以将一张32x24图片的定位速度由3.8秒减少到0.6秒左右,误差只有1.2个像素点左右,定位速度快而且较为精确。但是对于包含了眼睛、眉毛的图片,由于定位算法和优化算法二者本身的局限性,容易陷入局部最优解,还有待改进。 参考文献: [1] SolovyovaA,DanylovS,OleksiiS,etal.Earlyautism spectrum disorders diagnosis using eye-tracking technology[J].arXiv preprint arXiv:2008.09670,2020. [2] Clay V,K?nigP,K?nigS.Eye tracking in virtual reality[J].Journal of Eye Movement Research,2019,12(1):10. [3] MustikawanA,SwastyW,Naufalina F E.Utilization of eyetracking technolog yindesign and marketing decisionmaking[J].ASEAN Marketing Journal,2021,13(2). [4] S A,MBA,DS,etal.Drowsydriver detection using eye-tracking through machine learning[C]//2021 Second International Conference on Electronics and Sustainable Communication Systems (ICESC).August4-6,2021,Coimbatore,India.IEEE,2021:1916-1923. [5] Timm F,Barth E.Accurate eye centrelocalisation by means of gradients[J].Visapp,2011,11: 125-130. [6] MirjaliliS.The ant lion optimizer[J].Advances in Engineering Software,2015,83:80-98. [7] 趙世杰,高雷阜,于冬梅,等.带混沌侦查机制的蚁狮优化算法优化SVM参数[J].计算机科学与探索,2016,10(5):722-731. [8] 崔东文,王宗斌.基于ALO-ENN算法的洪灾评估模型及应用[J].人民珠江,2016,37(5):44-50. 收稿日期:2022-02-15 作者简介:王晶仪(1996—),江苏无锡人,硕士研究生,研究方向为深度学习,语义分割,眼动追踪;王艳霞,山东青岛人,副教授,研究方向为计算机视觉,深度学习,膜计算;朱原雨润(1997—),河南焦作人,硕士研究生,研究方向为深度学习,微表情识别;张领(1995—),湖北黄冈人,硕士研究生,研究方向为深度学习,表情识别。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!