动态环境下多媒体视频兴趣区的自动捕获系统设计

时间：2024-05-04

许金元

（湖南机电职业技术学院，湖南长沙　410151）

许金元

（湖南机电职业技术学院，湖南长沙410151）

摘要：动态环境下对多媒体视频兴趣区进行捕获时，图像背景是持续转变的，存在高低不平的布局问题，导致当前面向特定背景环境的目标捕获方法，无法获取清晰的图像，提出依据优化目标捕获算法，设计动态环境下多媒体视频兴趣区自动捕获系统。该系统通过多媒体视频图像采集模块采集多媒体视频图像的数据，利用数据格式转换模块变换获取多媒体视频图像数据，完成转换的视频图像数据可存储在数据缓存模块中，图像算法分析模块采用高斯混合模型提高图像背景的透明度，捕获清晰的视频兴趣区图像，并将捕获的图像目标传动核心芯片为ADV7123的视频图像显示模块进行显示。实验结果表明，所设计系统可准确捕获运动的视频兴趣区目标，并且目标清晰度较高。

关键词：动态环境；多媒体；视频；兴趣区；自动捕获

0　引　言

随着视频压缩编码技术以及互联网技术的快速发展，视频监控业务被广泛应用在不同的领域中。动态环境下多媒体视频兴趣区的目标捕获是计算机视觉领域研究人员的热点分析方向［1⁃3］。当前的目标捕获方法大都面向特定背景环境，无法有效处理动态环境下图像背景的高低不平布局问题，无法获取清晰的图像［4⁃5］。

现存的目标捕获方法存在一定的弊端，文献［6］提出的帧间差分法依据前后相邻帧图像像素灰度值的波动情况，采集兴趣目标，但是其仅可获取目标的外围信息，无法得到图像细节。文献［7］通过差分相邻帧，捕获兴趣目标，虽然提高了算法的鲁棒性，但是获取的目标中会存在空洞，目标图像模糊。文献［8］通过光流法将空间的运动场描述成图像中的光流场，完成目标的捕获，其可在摄像机运动条件下捕获出相应的运动目标，但是运算量较高，抗噪性能弱。文献［9］采用非参数模型捕获兴趣目标，该方法先获取包含目标的模板，再在序列图像中对目标进行跟踪，该方法存在耗时高的缺陷，局限于捕获较小的兴趣目标。

因为上述分析方法都存在一定的缺陷，因此，提出依据优化目标捕获算法，设计动态环境下多媒体视频兴趣区自动捕获系统。实验结果说明，所设计系统可准确捕获运动的视频兴趣区目标，并且目标清晰度较高。

1　系统硬件实现

1.1系统总体结构

动态环境下多媒体视频兴趣区的自动捕获系统，由视频图像采集和转换模块、总线模块设计、数据缓存模块、视频图像显示模块、图像算法分析模块构成，如图1所示。主要的目标是捕获动态目标，先采集多媒体视频图像的数据，再变换获取的多媒体视频图像数据，完成转换的视频图像数据可存储在数据缓存模块中，图像算法分析模块采用高斯混合模型针对高低不平的背景图像布局，增强图像背景的透明度，捕获清晰的视频兴趣区图像目标，并将捕获的图像目标传动到视频图像显示模块呈现给用户。

图1　系统结构图

1.2多媒体视频图像采集模块设计

多媒体视频图像采集模块对摄像头获取的多媒体视频图像数据进行传递、变换和操作，并对动态目标进行检测。通过多媒体视频输入部件也就是摄像机，获取外部视频数据，摄像机中的图像传感器可将外部图像光信号变换成模拟信号，通过模数变换后，形成系统可处理的数据信号。选择MT9M011型图像传感器，该传感器是有源像素数字图像传感器，拥有耗能低的优势。

1.3数据格式转换模块设计

多媒体视频兴趣区的自动捕获系统中的MT9M011图像传感器，会输出RAW RGB格式的图像数据，该种图像数据颜色格式的滤波阵列中，各感光点都独立完成釆样和分割，为了提高捕获视频图像的清晰度，要求捕获的图像的数据格式中的各像素点由R，G，B颜色分量构成。因此，需要将图像传感器获取的RAW RGB格式图像数据，变换成所需的位格式，要求R，G，B三种颜色分量均衡分配。具体的变换过程如下：

1.4视频图像显示模块设计

多媒体视频图像显示模块包括VGA Controller模块和ADV7123芯片，该模块设计了VGA时序，确保显示更加清晰的视频图像。VGA Controller从数据缓存模块中采集待显示的 8位 RGB目标图像数据，ADV7123视频编码芯片对图像数据进行A/D转换，将数字信号编码成模拟视频信号，再传递到VGA显示器上进行显示，ADV7123电路原理图如图2所示。

2　系统软件设计

2.1软件功能模块

依照系统操作步骤，系统软件可由视频输入及初始化模块、目标捕获及显示模块构成。视频输入及初始化模块对视频依次排列后进行输入并建立系统参数。视频需要输入的内容有采集 USB摄像头视频和翻译后的 AVI格式视频，而系统参数需要建立的内容有背景模型参数、目标捕获参数和目标跟踪参数；系统中的高斯混合目标捕获算法由目标捕获及显示模块实现，在图像帧里获取运动对象的捕获结果，并将其呈现到控件窗口上。系统软件的功能构架如图3所示。

2.2基于高斯混合模型的视频兴趣区自动捕获

多媒体视频兴趣区目标图像的捕获，需要判别视频帧图像排列中有无前景目标的展露，若有，需要先锁定对象，再实施查看对象的操作。在真实监测状态下，多媒体视频兴趣区图像背景是持续转变的，因此图像背景存在高低不平的布局特点，通过高斯混合模型可提高背景的透明度，捕获清晰的视频兴趣区图像。

图2　ADV7123电路原理图

图3　系统软件功能结构图

假设K为高斯模型，用于代表多媒体视频兴趣区的图像像素情况，K值描述了像素峰值散布的数量：

根据高斯混合模型，完成多媒体视频兴趣区图像的背景检测，主要借助模型创设、模型更新和背景模型估计及背景分割3大部分实现。以下为详细介绍：

当高斯散布模型被初始化之后，即将进入更新部分，可直接操纵第一帧的图像像素点的均值，此刻，应给出相对大一些的方差和相对小一些的权重。

在创设当前图像像素的全部高斯分布中，假设并没有能与Xt相配的高斯分布，则需将Xt当成均值授予最小权重的高斯分布，并更新高斯分布，将相对较小的权重和较大的方差给予高斯分布。经过一系列操作，完成配置后，根据式（6），将同样的像素中每个高斯分布的权重进行描述：

式（6）中，若将第i个高斯分布与Xt进行配置，那么Mi，t为1，反之为0。把全部高斯分布的权重都重新设置完成后，将其统一整理，进行接下来的操作。

（3）背景模型估计及前景分割

3　实验分析

实验在Visual Studio 2008平台下，通过 C#语言对本文设计的多媒体视频兴趣区自动捕获系统的性能进行检测。实验分别采用传统光流法以及本文方法，对在公园拍摄的两段视频（大小均为 520×460）进行分析。

实验结果1：两种方法对视频区行人目标的跟踪结果见图4、图5，可看出本文系统可准确捕获运动的行人目标，而光流法捕获的行人目标存在较高的偏差。

图4　本文方法捕获结果（一）

图5　光流法捕获结果（一）

实验结果2：两种方法完成了对快速骑车通过视频兴趣区的目标捕获情况，如图6和图7所示。由于骑车速度较快，可以看出光流法捕获的目标模糊，而本文方法能够清楚地捕获骑车目标，甚至可以看清骑车人的脸部，检测结果中存在较少的噪声点，具有较高的精确度。

图6　本文方法捕获结果（二）

图7　光流法捕获结果（二）

实验统计两种方法进行10次测试的视频兴趣区捕获误差，结果如表1所示。可以看出本文方法对应不同的视频兴趣区的捕获误差较低，并始终低于光流法，具有较高的优势。

表1　捕获误差对比

4　结　论

本文提出依据优化目标捕获算法，设计动态环境下多媒体视频兴趣区自动捕获系统。该系统通过多媒体视频图像采集模块采集多媒体视频图像的数据，采用数据格式转换模块变换获取的多媒体视频图像数据，完成转换的视频图像数据可存储在数据缓存模块中。图像算法分析模块采用高斯混合模型提高图像背景的透明度，捕获清晰的视频兴趣区图像，并将捕获的图像目标传动到核心芯片为ADV7123的视频图像显示模块进行显示。实验结果说明，所设计系统可准确捕获运动的视频兴趣区目标，并且目标清晰度较高。

参考文献

［1］Cisco Company.Cisco visual networking index：global mobile data traffic forecast update，2015-2020 White Paper［R/OL］. ［2016⁃02⁃01］.http//：www.cisco.com/en/US.

［2］温洪波.视频技术在多媒体课件中的应用［J］.计算机光盘软件与应用，2014（4）：208⁃209.

［3］贾金利.多媒体技术在新闻学课程教学中的合理运用［J］.中国轻工教育，2013（2）：78⁃80.

［4］李宇成，李聪.基于DM368的视频处理及软件设计［J］.计算机测量与控制，2013，21（10）：2865⁃2867.

［5］吴笑天，鲁剑锋，王宇庆，等.基于DM368的无人机视频压缩系统的设计［J］.液晶与显示，2014（12）：1117⁃1123.

［6］范新磊，张杰.基于FPGA的视频图像实时采集与显示研究［J］.电子制作，2013（4）：72.

［7］常高嘉，冯全源.基于FPGA的高速数据釆集系统的设计与实现［J］.电子器件，2012，35（5）：217⁃220.

［8］廖广军.复杂条件下的人脸检测与识别应用研究［D］.广州：华南理工大学，2014.

［9］曹健，陈红倩，毛典辉，等.基于局部特征的图像目标识别问题综述［J］.中南大学学报（自然科学版），2013（z2）：258⁃262.

中图分类号：TN948.64⁃34；TP391

文献标识码：A

文章编号：1004⁃373X（2016）16⁃0094⁃04

doi：10.16652/j.issn.1004⁃373x.2016.16.025

作者简介：许金元（1974—），男，湖南常德人，副教授。主要研究领域为计算机应用技术、计算机多媒体技术。

收稿日期：2015⁃12⁃30

基金项目：国家自然科学基金：连续模糊决策的词计算理论及其信息集成方法研究（71171048）

Design of automatic capture system for multimedia video ROI in dynamic environment

XU Jinyuan
（Hunan Mechanical&Electrical Polytechnic，Changsha 410151，China）

Abstract：When the multimedia video region of interest（ROI）is captured in dynamic environment，the available target capture method can’t acquire the clear image in a specific background environment due to the continuously changing image background and rough layout，so a capture algorithm based on optimal target is proposed to design the automatic capture system for multimedia video ROI in dynamic environment.In the system，the multimedia video image data is acquired by means of the multimedia video image acquisition module，transformed with data format conversion module，and then the converted multime⁃dia video image data can be stored in data cache module.The Gaussian mixture model is adopted in the image algorithm analy⁃sis module to improve the transparency of image background，and capture the clear video ROI image.The captured target image is sent to the core chip ADV7123 in the video image display module for display.The experimental results indicate that the de⁃signed system can capture the moving video ROI target accurately，and obtain high resolution target image.

Keywords：dynamic environment；multimedia；video；region of interest；automatic capture