时间:2024-05-22
贾 伟,黄小天,谢 椿,王正勇
(四川大学 电子信息学院图像信息研究所,四川 成都 610064)
随着机器视觉技术的发展,其应用受到越来越多的关注,如研究人员应用计算机视觉技术对苹果[1]、葡萄[2]、西红柿等蔬菜[3]水果进行检测和分类,对棒材、烟支等静态目标进行检测与计数。而用于对行人[4-6]、车辆等动态目标的检测方法主要有帧差法、背景减法、光流法。其中帧差法是基于多帧图像的相关性而提出的方法,通过将相邻两帧或者多帧的灰度值做差,当差值很小时,则标记为背景,反之,则被认为是运动目标,该方法具有算法简单、对光照与环境变化具有适应性等特点。背景减法将序列图像当前帧与背景图像做差,当差值很小时,被认为是背景区域,相反则被标记为目标区域。背景差分可以通过背景建模的方式提高对环境变化的适应能力,常见的建模方法有中值、均值滤波法、单高斯模型背景更新[7]、混合高斯模型法更新、码书背景建模等。
本文首先以传送带上运动的物料袋为研究对象,针对帧差法和背景减法在性能上互补[8]的特点,提出了一种融合五帧差分与高斯模型的运动物料袋快速检测方法。首先以传送带和物料袋为研究对象,采用改进的五帧差分法提取目标区域,以减小环境光照的影响;同时以物料袋为研究对象,利用单高斯模型进行背景的更新,将中间帧图像与背景图像做差,得到目标区域,通过运动策略分析,最后将两个目标区域进行形态学“与”运算,从而消除了传送带在物料袋检测过程中的影响。
设 Fk(x,y)、Fk+1(x,y)分别表示第 k帧和 k+1帧的图像,Hk(x,y)为差分结果,即:
式中(x,y)表示像素值的坐标。帧间差分算法中通常用一个阈值T分离运动目标与背景区域,当差分值大于T时,像素值取为1,相反则为0,从而将检测区域分为黑白两个区域。设Rk(x,y)表示运动区域,则:
原始的帧差算法中阈值T是一个固定值,采用固定的阈值往往由于光线的变化容易产生噪声,对环境变化的适应能力差,从而影响检测效果。常见的阈值分割方法有3σ法则、自适应阈值法、最大间类法等。本文针对参考文献[9]的方法进行了改进,相对于均值的方法,采用中值更能适应环境的变化,随着循环次数的增加,对运动区域局部信息的检测也更加精确。T值的具体计算过程为:
(1)首先确定灰度图像灰度值的最大值Max1和最小灰度值 Mink,则初始值 Tk定义为:
(2)根据Tk值将图像分割成目标和背景两个区域,求前后两部分区域图象像素灰度值的中值XF、XE。
(3)求阈值 Tk+1:
(4)当 Tk=Tk+1时,结束运算;否则 k=k+1,转到步骤(2)。
单高斯模型是一种经典的基于统计学的背景提取方法,假设图像中每个像素都是独立的,并服从一维正态分布,于是:
式中xi表示图像的灰度值,μ表示图像在 xi附近的均值,σ2表示图像在 xi附近的方差,P(xi)表示灰度值等于xi的概率。单高斯模型采用如下具体公式更新背景,具体为:
式中 a为更新系数,其中 βt、βt-1、It分别表示当前背景、前一帧背景和当前输入图像。本文采用基于单高斯模型的背景更新,更新方法如下:
(1) 设 Fk-2、Fk-1、Fk、Fk+1、Fk+2为连续的五帧图像序列,Fk为 NumFrm=k,NumFrm为帧数,当k=3||k%5==3时,进行背景更新,否则继续。
(2)为了补偿背景更新对其他图像帧的影响,采用图像加运算的补偿方法,当帧数满足((k-1)%5==0)||((k+1)%5==0)时,保存该图像帧,再对该帧相邻帧图像进行加运算,其中NumFrm=k,NumFrm为帧数,最后得到前景图像。
首先从视频流中获取五帧视频,判断中间帧是否满足上述条件,然后利用改进的五帧差分算法提取初步的物料袋图像;同时对获取的中间帧进行单高斯模型背景更新,再用背景减法获得物料袋图像,针对帧差法和背景差法互补的特点,最后获取物料袋前景图像。
由于存在时间间隔与延迟,从而使某些帧信息丢失。为此,本文对该视频帧进行了统计分析,如图1所示。结果显示,当帧数满足 ((nFrmNum-1)%5==0)||((nFrmNum+1)%5==0)时,检测到较为完整的物料袋,而相邻帧图像出现了局部空洞图像,如图1(d)所示。针对非刚体物料袋表面绝大部分具有相似性的特点,本文通过完整物料袋图像的表面图像来补偿相邻帧不完整的图像,最终得到了完整的物料袋目标图像,如图1(e)所示。
实验所采用的视频来源于成都某食品公司的仓库,视频中的物料袋为玉米袋,视频内容为玉米袋装车时在传送带上的运动情况,视频中包含了本文研究所包含的各种影响因素,具体包括:运动的人、光线的变化(明暗变化)、复杂的背景等。实验中计算机的配置:CPU为Pentium T4400,主频 2.21 GHz,内存 2.00 GB;硬盘空间320 GB。实验中视频格式为AVI,分别采用单包、连包情况下的 3段视频进行试验,视频设为 I、II、III,时长分别为 1′17"、46"、1′5"。 其中单高斯模型的更新系数为 a=0.05。
图2所示为采用视频I,并对传统的混合高斯模型(GMM)、单高斯模型(SGM)、五帧差分法(FFD)、以及本文算法(Proposed Algorithm)进行对比研究的结果,其中图2(a)、图2(b)、图2(c)分别表示对视频第 459帧、第732帧、第895帧的原始帧 (Original Frame)图像及其检测效果。结果显示,虽然各种算法针对的运动物体的检测条件不同,而当选择传送带跟物料袋为整体研究对象时,本文算法具有非常明显的优势。视频中人体局部在运动,并且光照在时明时暗的变化条件下,对检测结果影响不大。图中第459帧中的光线较其他帧图像强,第895帧光线变暗。
图1 相邻图像帧的补偿过程
图3所示为采用视频II和视频III对横向连包和纵向连包情况下的物料袋检测结果。图4所示为前景图像中白色区域的面积随时间的变化关系,P(t)表示前景图像中像素点的实时分布概率。结果显示,图4(a)对横向连包的检测结果比较明显,曲线与横坐标所围的面积约为单包时的2倍。视频III中,由于受传送袋上散落玉米粒的影响,在66.7 ms~133.3 ms时间段内出现了两个峰值,图4(b)中连包时峰值与相邻极小值所围的面积约为单包的2倍。
图3 两种连包的检测结果
图4 两种连包的实时检测曲线
本文对传送带上运动的物料袋进行了研究,针对帧差法与背景减法互补的特点,提出了一种运动物料袋快速检测方法。该方法对环境变化有较好的鲁棒性,实验结果得到了较好的检测效果,因此可以应用于基于计算机视觉技术的物料袋在线检测、统计等相关研究与应用中。但是,当传送带发生剧烈晃动时,本文方法检测效果不太理想,检测结果会出现局部面积较小的空洞。
[1]赵延军,徐丽明.基于机器视觉的苹果果袋检测方法[J].中国农业大学学报,2006,11(1):87-90.
[2]陈英,廖涛,林初靠,等.基于计算机视觉的葡萄检测分级系统[J].农业机械学报,2010,42(3):169-172.
[3]丁筠,殷涌光.蔬菜中大肠杆菌的机器视觉快速检测[J].农业机械学报,2012,43(2):134-139.
[4]陈浩,王景中,姚光明.基于类园分割的棒材计数图像识别[J].工程图学学报,2004(4):89-103.
[5]李衡宇,何小海,吴炜,等.基于计算机视觉的公交车人流统计系统[J].四川大学学报(自然科学版),2007,44(4):825-830.
[6]章东平,童超,芦亚飞.基于粒子视频的高密度人群主流运动检测[J].电子技术应用,2012,38(4):123-125.
[7]WREN C R,AZARBAYEJANI A J,DARRELL T J,et al.Pfinder:real-time tracking of the human body[C].Photonics East′95.International Society for Optics and Photonics,1996.
[8]郝毫刚,陈家琪,远博,等.基于五帧差分和背景差分的运动目标检测算法[J].计算机工程,2012,38(4):146-148.
[9]王耀明,董建萍,严炜,等.图像阈值分割的统计迭代算法[J].桂林电子科技大学学报,2000,20(2):6-7.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!