时间:2024-05-04
唐晓晴 郭耀文
摘要:烟火检测是计算机视觉和图像处理领域的研究热点和难点,在无人基站监控、森林防火监控等方面具有广泛的应用。该文阐述了基于深度学习的烟火检测技术,全面分析了烟火检测技术以及深度学习理论的发展现状,研究了烟火检测技术的处理流程,并基于现有的YOLO v4模型进行了软件系统的实现。实验结果表明,深度学习技术在识别实时视频以及剪辑视频中对应的烟火时,均取得了较好的效果。最后,探讨了烟火检测技术在未来的进一步研究方向。
关键词:烟火检测;深度学习;YOLO;软件系统;图像处理
中图分类号:TP301 文献标识码:A
文章编号:1009-3044(2022)08-0085-03
1 引言
近年来,目标检测已成为图像处理方向研究的热点,烟火检测就是目标检测的一种,其核心内容是判断视频或者图像中是否含有烟火,并标记出烟火所在的位置。传统的烟火检测主要通过温度以及颜色等外观特征进行特征的学习,并使用对应的分类器判断特定区域内是否存在烟火[1-2]。但是该方法具有很大的局限性,研究者根据烟火的颜色特征,往往会将晚霞等目标误判为烟火。因此,仅通过外观特征不能够全面地描述物体的所有属性,很难满足实际的需求。
长期以来,研究者对烟火检测的研究主要基于外观属性特征的提取,因此在识别率方面一直未能取得很好的进展。直到深度学习理论的提出[3],研究者开始使用卷积神经网络进行特征的学习,并多次成为ImageNet大规模视觉识别竞赛(ImageNet Large Scale Visual Recognition Challenge, ILSVRC)[4]的优胜算法。研究人员发现基于深度学习学到的特征,能很好地表现出物体的外在和内在的关联特征,具有更好的表达性。随着深度学习的不断发展,越來越多的研究者将其运用于图像的目标检测中[5-7]。本文基于深度学习理论实现的烟火检测技术,在文章结构上主要包含深度学习的相关技术,烟火检测的处理流程,YOLO v4模型的训练,最后通过对烟火的分析验证系统的准确度和实时性。
2基于深度神经网络的检测技术
深度学习的核心是深度神经网络(Deep Neural Network,DNN)。卷积神经网络是深度神经网络的一种,目前已经在视频分析,特别是目标检测领域得到广泛研究。本文描述的烟火检测就是目标检测中的一种,对应的检测目标就是烟火,而不是其他的建筑物、晚霞等物体。
2015 年,研究者提出了YOLO(You Only Look Once)模型[8],并将其运用于目标检测。该模型的核心思想是通过无锚框(Anchor-Free)进行目标检测。随后,人们在YOLO模型的基础上产生了不同的版本,当前已经演进到YOLO v5[9-11]。YOLO v1与YOLO 进行相比,较好地解决了YOLO模型只能进行单目标,单分类的检测问题。随之而来的YOLO v2,在面对YOLO v1预测框不准确这一个问题,提出了一种并非直接预测bbox坐标的方法,而是改为预测基于grid的偏移量和基于anchor的偏移量。后来,研究者发现,YOLO v2也不是那么的完美,它在解决小目标的检测时,出现的错误率较高。因此,人们在YOLO v2的基础上又提出了YOLO v3,其基本核心思想是增加了多尺度预测, 并把YOLO v2的主干网络(Backbone)从19层的Darknet变为了53层的Darknet。随后的YOLO v4和YOLO v5都在原有YOLO架构的基础上,引入了卷积神经网络(CNN)领域中的优化策略,虽没有理论上的创新,但是在目标检测的识别率方面有了较大的提高。
3烟火检测系统
3.1检测流程
烟火检测最终的目的是将图像中的烟火标注出来,本文设计的烟火检测系统如图1所示。
(1)输入目标。本文主要的输入目标是视频源,需要对输入源进行解码操作。
(2)预处理。预处理阶段是指各种视频的前期操作,如去除块效应、校准以及增强图像等。
(3)帧过滤。该部分主要是过滤背景帧,提高后期目标检测的效率。
(4)特定目标检测。借助神经网络模型从视频流中检测火焰。
(5)烟火识别。将检测出的目标区域进行边界框标注,并给出相应的提示信息。
3.2 检测软件
烟火检测系统是一款基于C/S框架的软件系统,客户端主要完成视频的采集,服务端通过YOLO v4 模型的部署来完成视频的分析,检测出视频流中对应的烟火。
Python编程语言。Python与其他的Java,C++等语言相比,兼容神经网络以及机器学习等开源库,具有更好的兼容性。
软件前台GUI界面使用Qt开发库进行开发。主要用来开发图像用户界面(GUI)程序,也可以开发不带界面的命令行(CUI)程序。可支持 Windows、Linux等多种操作系统。该系统主要使用Qt中的QtGui模块,为程序提供GUI程序的基础功能,包括交互界面的创建以及交互事件的处理。
3.3 YOLO v4模型训练
YOLO v4模型的训练主要包含数据的标注、参数的调节、模型的训练、图像分类结果验证。具体步骤如下:
步骤1:标注数据集。在本文中,标注数据使用的标注工具是Labelimg。
步骤2:配置YOLO模型的参数。对于参数的选择,主要需要修改的模型参数包括batch、subdivisions、max_batches、steps4个主要的参数信息。
步骤3:模型训练。该步骤首先下载一个预训练模型,然后通过不断改变步骤2中的对应参数,得到一个训练完成的模型。
步骤4:分类验证。使用训练得到的模型,用新的测试数据验证得到的结果。
在学习结束后生成的模型loss在0.1503左右提前终止了训练,训练3万次左右,耗时38.36小时。详细的训练结果图如图2所示。
4系统验证
YOLO v4作为一个新兴的目标检测算法,有着很多其他系统没有的优点,它的最大的特点是实现快速检测的同时,还能具备高识别率。本系统除了可以识别上传普通视频中的烟火,还能有效识别实时视频中的烟火。
4.1实时视频验证
使用实时视频检测,需要当前系统检测摄像头打开,才可以开启检测,否则系统将会提示请检查设备,算法开始后如果检测到有烟火图像,系统将会显示dangerous并且会将检测到的烟火图像对应的时间记录下来,如图3所示。
4.2剪辑视频验证
如需检测视频,则将之前录制好的视频通过上传到系统中,等待上传成功后,点击检测按钮,即可验证视频中是否含有烟火等目标。若视频中包含对应的烟火目标,会展示一个对应的目标边界框。同时会在右下方的列表中显示视频出现的时间。详细结果信息如图4所示。
4.3识别成功率及分析
在系统验证过程中,除了上述比较简单且清晰度较高的视频外,本文还验证了一些复杂场景下的烟火视频,详细结果如表1所示。
从实验结果可以发现,在处理简单的烟火视频时,本系统的识别率能高达95%以上。判定为火焰。对于晚霞,太阳等颜色外观比较相似的烟火视频,也能较好地进行识别。但是在较为复杂的火灾现场视频中,存在少量误判,当天空被火焰映射时,部分天空也会被判定为烟火。
5结论
对于烟火的检测是近年來计算机视觉领域的一大热点问题,同时也是森林防火领域急需解决的技术问题。本文在现有的YOLOv4模型基础上,实现了基于深度学习的烟火检测系统。实验结果表明,卷积神经网络在进行烟火识别时,能够满足其在准确率和实时性方面的要求。
深度学习给烟火检测带来契机的同时,也带来了相应的问题。首先,与传统的机器学习方法相比,神经网络模型的训练需要使用的硬件设备要求更高。其次,深度学习训练需要大量数据集,在获取已标注的数据集和进行数据集的标注上,给研究者的研究带来了困难。再者,烟火检测采用的是目前通用的目标检测模型,在一些复杂场景的识别中,存在一定量的错误率,建立针对烟火的特定检测模型也是后续一个重要研究方向。
参考文献:
[1] 马忠.基于视频监控深度解析融合技术的实战应用[J].信息技术,2018,42(4):121-124.[2] 陈娟.基于多特征融合的视频火焰探测方法研究[D].合肥:中国科学技术大学,2009.
[3] Hinton G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
[4] RussakovskyO,DengJ,SuH,etal.ImageNetlarge scale visual recognition challenge[J].International Journal of Computer Vision,2015,115(3):211-252.
[5] 苏欣欣,郭元术,李妮妮.基于深度学习的车辆检测算法研究[J].信息技术与网络安全,2021,40(6):28-32.
[6] 石磊.基于深度学习的烟火检测算法研究与实现[D].天津:中国民航大学,2020.
[7] 陈涛,路红.基于深度学习的行人检测技术研究[J].软件导刊,2021,20(1):76-80.
[8] RedmonJ,DivvalaS,GirshickR,etal.You only look once:unified,real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition.June 27-30,2016,Las Vegas,NV,USA.IEEE,2016:779-788.
[9] RedmonJ,Farhadi A.YOLO9000:better,faster,stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition.July21-26,2017,Honolulu,HI,USA.IEEE,2017:6517-6525.
[10] Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao.YOLOv4: Optimal Speed and Accuracy of Object Detection[C]. IEEE Conference on Computer Vision and Pattern Recognition,2020.
【通联编辑:唐一东】
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!