融合五帧差分与高斯模型的运动物料袋检测

时间：2024-05-22

贾伟，黄小天，谢椿，王正勇

(四川大学电子信息学院图像信息研究所，四川成都 610064)

随着机器视觉技术的发展，其应用受到越来越多的关注,如研究人员应用计算机视觉技术对苹果[1]、葡萄[2]、西红柿等蔬菜[3]水果进行检测和分类，对棒材、烟支等静态目标进行检测与计数。而用于对行人[4-6]、车辆等动态目标的检测方法主要有帧差法、背景减法、光流法。其中帧差法是基于多帧图像的相关性而提出的方法，通过将相邻两帧或者多帧的灰度值做差，当差值很小时，则标记为背景，反之，则被认为是运动目标，该方法具有算法简单、对光照与环境变化具有适应性等特点。背景减法将序列图像当前帧与背景图像做差，当差值很小时，被认为是背景区域，相反则被标记为目标区域。背景差分可以通过背景建模的方式提高对环境变化的适应能力，常见的建模方法有中值、均值滤波法、单高斯模型背景更新[7]、混合高斯模型法更新、码书背景建模等。

本文首先以传送带上运动的物料袋为研究对象，针对帧差法和背景减法在性能上互补[8]的特点，提出了一种融合五帧差分与高斯模型的运动物料袋快速检测方法。首先以传送带和物料袋为研究对象，采用改进的五帧差分法提取目标区域，以减小环境光照的影响；同时以物料袋为研究对象,利用单高斯模型进行背景的更新，将中间帧图像与背景图像做差，得到目标区域，通过运动策略分析,最后将两个目标区域进行形态学“与”运算，从而消除了传送带在物料袋检测过程中的影响。

1 改进的五帧差分算法

设 Fk(x,y)、Fk+1(x,y)分别表示第 k帧和 k+1帧的图像，Hk(x,y)为差分结果，即：

式中(x,y)表示像素值的坐标。帧间差分算法中通常用一个阈值T分离运动目标与背景区域，当差分值大于T时，像素值取为1，相反则为0,从而将检测区域分为黑白两个区域。设Rk(x,y)表示运动区域，则:

原始的帧差算法中阈值T是一个固定值，采用固定的阈值往往由于光线的变化容易产生噪声，对环境变化的适应能力差，从而影响检测效果。常见的阈值分割方法有3σ法则、自适应阈值法、最大间类法等。本文针对参考文献[9]的方法进行了改进，相对于均值的方法，采用中值更能适应环境的变化，随着循环次数的增加，对运动区域局部信息的检测也更加精确。T值的具体计算过程为：

(1)首先确定灰度图像灰度值的最大值Max1和最小灰度值 Mink，则初始值 Tk定义为：

(2)根据Tk值将图像分割成目标和背景两个区域，求前后两部分区域图象像素灰度值的中值XF、XE。

(3)求阈值 Tk+1：

(4)当 Tk=Tk+1时，结束运算；否则 k=k+1，转到步骤(2)。

2 基于单高斯模型的背景更新

单高斯模型是一种经典的基于统计学的背景提取方法，假设图像中每个像素都是独立的，并服从一维正态分布，于是：

式中xi表示图像的灰度值，μ表示图像在 xi附近的均值，σ2表示图像在 xi附近的方差，P(xi)表示灰度值等于xi的概率。单高斯模型采用如下具体公式更新背景，具体为：

式中 a为更新系数，其中 βt、βt-1、It分别表示当前背景、前一帧背景和当前输入图像。本文采用基于单高斯模型的背景更新，更新方法如下：

(1) 设 Fk-2、Fk-1、Fk、Fk+1、Fk+2为连续的五帧图像序列，Fk为 NumFrm=k,NumFrm为帧数，当k=3||k%5==3时，进行背景更新，否则继续。

(2)为了补偿背景更新对其他图像帧的影响，采用图像加运算的补偿方法，当帧数满足((k-1)%5==0)||((k+1)%5==0)时,保存该图像帧，再对该帧相邻帧图像进行加运算,其中NumFrm=k，NumFrm为帧数，最后得到前景图像。

3 物料袋检测算法及描述

首先从视频流中获取五帧视频，判断中间帧是否满足上述条件，然后利用改进的五帧差分算法提取初步的物料袋图像；同时对获取的中间帧进行单高斯模型背景更新，再用背景减法获得物料袋图像，针对帧差法和背景差法互补的特点，最后获取物料袋前景图像。

由于存在时间间隔与延迟，从而使某些帧信息丢失。为此，本文对该视频帧进行了统计分析,如图1所示。结果显示,当帧数满足 ((nFrmNum-1)%5==0)||((nFrmNum+1)%5==0)时，检测到较为完整的物料袋，而相邻帧图像出现了局部空洞图像,如图1(d)所示。针对非刚体物料袋表面绝大部分具有相似性的特点，本文通过完整物料袋图像的表面图像来补偿相邻帧不完整的图像,最终得到了完整的物料袋目标图像,如图1(e)所示。

4 实验结果及分析

实验所采用的视频来源于成都某食品公司的仓库，视频中的物料袋为玉米袋，视频内容为玉米袋装车时在传送带上的运动情况，视频中包含了本文研究所包含的各种影响因素，具体包括：运动的人、光线的变化(明暗变化)、复杂的背景等。实验中计算机的配置：CPU为Pentium T4400，主频 2.21 GHz，内存 2.00 GB；硬盘空间320 GB。实验中视频格式为AVI，分别采用单包、连包情况下的 3段视频进行试验，视频设为 I、II、III，时长分别为 1′17"、46"、1′5"。其中单高斯模型的更新系数为 a=0.05。

图2所示为采用视频I，并对传统的混合高斯模型(GMM)、单高斯模型(SGM)、五帧差分法(FFD)、以及本文算法(Proposed Algorithm)进行对比研究的结果,其中图2(a)、图2(b)、图2(c)分别表示对视频第 459帧、第732帧、第895帧的原始帧 (Original Frame)图像及其检测效果。结果显示,虽然各种算法针对的运动物体的检测条件不同，而当选择传送带跟物料袋为整体研究对象时，本文算法具有非常明显的优势。视频中人体局部在运动，并且光照在时明时暗的变化条件下，对检测结果影响不大。图中第459帧中的光线较其他帧图像强,第895帧光线变暗。

图1 相邻图像帧的补偿过程

图3所示为采用视频II和视频III对横向连包和纵向连包情况下的物料袋检测结果。图4所示为前景图像中白色区域的面积随时间的变化关系，P(t)表示前景图像中像素点的实时分布概率。结果显示，图4(a)对横向连包的检测结果比较明显，曲线与横坐标所围的面积约为单包时的2倍。视频III中，由于受传送袋上散落玉米粒的影响，在66.7 ms～133.3 ms时间段内出现了两个峰值，图4(b)中连包时峰值与相邻极小值所围的面积约为单包的2倍。

图3 两种连包的检测结果

图4 两种连包的实时检测曲线

本文对传送带上运动的物料袋进行了研究，针对帧差法与背景减法互补的特点，提出了一种运动物料袋快速检测方法。该方法对环境变化有较好的鲁棒性，实验结果得到了较好的检测效果，因此可以应用于基于计算机视觉技术的物料袋在线检测、统计等相关研究与应用中。但是，当传送带发生剧烈晃动时，本文方法检测效果不太理想，检测结果会出现局部面积较小的空洞。

[1]赵延军,徐丽明.基于机器视觉的苹果果袋检测方法[J].中国农业大学学报,2006,11(1):87-90.

[2]陈英,廖涛,林初靠,等.基于计算机视觉的葡萄检测分级系统[J].农业机械学报,2010,42(3):169-172.

[3]丁筠,殷涌光.蔬菜中大肠杆菌的机器视觉快速检测[J].农业机械学报,2012,43(2):134-139.

[4]陈浩,王景中,姚光明.基于类园分割的棒材计数图像识别[J].工程图学学报,2004(4):89-103.

[5]李衡宇,何小海,吴炜,等.基于计算机视觉的公交车人流统计系统[J].四川大学学报(自然科学版),2007,44(4):825-830.

[6]章东平,童超,芦亚飞.基于粒子视频的高密度人群主流运动检测[J].电子技术应用,2012,38(4):123-125.

[7]WREN C R,AZARBAYEJANI A J,DARRELL T J,et al.Pfinder:real-time tracking of the human body[C].Photonics East′95.International Society for Optics and Photonics,1996.

[8]郝毫刚,陈家琪,远博,等.基于五帧差分和背景差分的运动目标检测算法[J].计算机工程,2012,38(4):146-148.

[9]王耀明,董建萍,严炜,等.图像阈值分割的统计迭代算法[J].桂林电子科技大学学报,2000,20(2):6-7.