时间:2024-05-04
钱世豪 李 军 马佶辰
(南京理工大学自动化学院 南京 210094)
当输电线路悬挂有风筝、气球、塑料垃圾袋等异物时,高压电的极限放电距离缩短,严重时可造成片区大面积停电。近年来,该类电力事故时有发生[1~2]。因此,及时发现异物并采取相应措施,具有十分重要的意义。图像分割是图像分析中非常重要的预处理步骤,将输电线路和悬挂异物从航拍图像中分割出来对后续异物的识别与定位工作至关重要[3]。
我国电力系统结构复杂,随着高电压、长距离输电线路的发展,输电网络穿越的地理环境日趋复杂,依靠人工巡线排查异物变得越来越艰难,容易漏检而造成安全隐患[4]。因此,无人机巡线技术的发展需求日益迫切。无人机巡线技术是借助无人机上的光学成像设备对输电线走廊进行拍摄,并应用计算机智能处理巡检带回的大量图像数据来判断线路上是否存在异物并进行异物定位。我国电力巡线无人机技术尚不成熟,国内外资料针对输电线路上的异物识别与定位都少有涉及,文献[5~7]对前景与背景的区域分割技术进行了一定的研究,这些都为输电线路悬挂异物航拍图像的图像分割工作提供了思路[5~7]。
本文以在四川山区拍摄所得的输电线路航拍图像为例,针对复杂背景下输电线路悬挂异物航拍图像前景与背景的分割问题,提出一种可适应大量此类图像的图像分割方法。该方法由图像预处理、图像分割和图像分析三个步骤构成。图像预处理步骤主要完成航拍图片放大裁剪、滤波等工作;图像分割步骤提出并选用一种基于粒子群优化算法改进的OTSU 双阈值分割算法对图像进行前景与背景的初分割,并选用SVM 算法对图像进行再分割,据此大致完成将电力线和异物与背景分离的工作;图像分析步骤提出一种基于区域特征的二值图像处理方法,并据此完成将电力线和异物与背景分离的最终工作。最后,通过样本图片分析了算法的准确率和运算时间。结果表明,该算法能快速准确地对输电线路悬挂异物航拍图像进行前景与背景的分割。如图1 所示,落在山林上方电力线上的白色气球状物体即是目标异物。
图1 悬挂异物的输电线路图像
考虑到无人机在进行输电线路航拍图像采集过程中的安全性问题,无人机在飞行拍摄时一般离输电线路较远,又由于输电线路狭长的物理特征,这些因素导致航拍图像中输电线路和异物体积微小,这对后续工作造成了不利的影响。因此,在图像分割之前需要对航拍图像进行放大和裁剪的操作。通过大量样本图像的实验测试,本文对每张图像都进行先放大至原图的140%,然后裁剪成四张子图像的预处理操作,每张子图像的大小为400×250。图2 为含有异物的子图像,由此可知,放大裁剪步骤使得输电线路和悬挂异物的特征更为凸显,方便后续工作的展开。
图2 预处理后的子图像
部分航拍图像存在着信噪比低的问题,这给后续图像处理与识别工作带来困难。由于输电线图像中的背景较为复杂,输电线目标本身相对于复杂背景较为细弱,导致输电线目标更易受到各类噪声的干扰。一般椒盐噪声会在输电线图像的数字传输过程中产生,为了尽可能抑制巡检作业时产生的椒盐噪声,需要对航拍图像进行去噪处理[8]。本文针对输电线图像中噪声的特点,使用中值滤波对椒盐噪声进行了滤波操作。
中值滤波的基本原理是将目标像素点邻域所有像素灰度值的统计排序中值取代目标像素灰度值。中值滤波能够有效消除孤立的噪声点,并可以让中值滤波后的图像边缘更加理想。设g( x,y )表示原始像素点的灰度值,f( x,y )为像素点中值滤波后的灰度值。当窗口模板用A 表示时,则其定义如式(1)所示:
其主要流程如下:
1)选择一个大小适宜的目标像素窗口;
2)使用窗口遍历图像中的所有像素,对窗口覆盖的图像区域中所具有的像素灰度值进行统计并对其进行排序操作;
3)找出窗口中的中值,然后将中值替代窗口中心位置的像素。
通过中值滤波处理后,航拍图像中的椒盐噪声能够有效地被去除。窗口的大小决定了会对多少像素进行排序统计,若窗口的大小选择不合适,就会影响排序统计的速度。经过多次实验测试,本文采用3*3 大小窗口的中值滤波处理椒盐噪声效果最好。
在图像分割步骤中,本文提出并选用一种基于粒子群优化算法改进的OTSU 双阈值分割算法对图像进行前景与背景的初分割。
3.1.1 OTSU双阈值分割算法
一维最大类间方差法是由日本学者大津展之于1979 年提出的,是一种自适应的阈值确定算法,又叫大津法,简称OTSU[9]。它是按图像的灰度特性,将图像分成背景和目标两部分。背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。OTSU自适应阈值分割算法是单阈值分割中最简单高效的方法之一。
由于噪声等干扰因素的存在,灰度直方图不一定存在明显的波峰和波谷。因此,仅仅利用一维直方图来确定阈值往往会造成错误分割。针对这种情况,国内外学者提出了二维最大类间方差法。它不仅考虑了图像的灰度信息,还考虑了邻域空间的相关信息。因此二维最大类间方差算法与基于一维直方图的分割算法相比具有更高的分割精度和鲁棒性。
通过OTSU 双阈值分割算法对航拍图像进行图像初分割,将航拍图像初步分割为输电线路和异物与背景两部分,二值图像和彩色图像的结果如图3和图4所示。
图3 图像初分割后的二值子图像
图4 图像初分割后的彩色子图像
3.1.2 基于粒子群算法改进的OTSU 双阈值分割算法
虽然二维OTSU 算法与一维OTSU 算法相比具有更高的分割精度和鲁棒性,但是二维OTSU 算法的信息量也大大增加[10~12]。多阈值分割问题可转化为一系列单阈值分割问题来解决,但这需要在全灰度范围内搜索一个最佳门限组合,这就导致算法计算复杂、耗时较多,难于实际应用。为简化计算,可利用粒子群优化算法来搜索最佳阈值。
PSO 算法系统初始化为一组随机解,通过迭代搜寻最优值。它没有遗传算法使用的交叉以及变异,而是粒子在解空间追随最优的粒子进行搜索[13]。同遗传算法比较,PSO 的优势在于简单容易实现并且没有许多参数需要调整,目前已广泛应用于函数优化问题中。粒子群优化算法采用了“速度-位移”搜索模型,将群体中的个体看作搜索空间中没有质量和体积的粒子,粒子在空间中以一定的速度飞行,并根据个体和群体的最优位置动态调整自身的速度和位置,每个粒子代表解空间的一个候选解,解的优劣程度由适应度函数决定,适应度函数则根据优化目标定义。
经过多次实验测试,本文将粒子群算法中粒子个数N 设置为20,迭代次数k 设置为3000 次,惯性权重ω 设置为0.9,加速因子c1,c2均设置为2.0。将OTSU 双阈值分割算法中式(3)的方差计算函数作为粒子群优化算法中的适应值函数,粒子的位置通过阈值t1,t2可表示为xi=( )ti1,ti2,飞行速度可表示为vi=( )vi1,vi2,最终求得最佳阈值t1*和t2*。
对图2分别采用传统OTSU 双阈值分割算法和基于粒子群优化算法改进的OTSU 双阈值分割算法来计算最佳阈值和,结果表明,本文提出的算法大大减少了算法的计算耗时,同时也保证了计算结果的精确性。表1 展示了两种算法的性能比较,其中算法1代表传统的OTSU 双阈值分割算法,算法2 代表本文提出的基于粒子群优化算法改进的OTSU双阈值分割算法。
表1 两种算法的性能比较
在图像分割步骤中,本文在图像初分割的基础上选用SVM 算法对图像进行前景与背景的再分割。
支持向量机(SVM)是90 年代中期兴起的一类基于统计学理论的机器学习方法,该算法通过最小化结构风险来提升学习机的泛化能力,在统计样本较少时,也可得到良好的统计规律[14~15]。SVM 算法源于二分类的监督学习算法,用户需用一些标签数据(知道具体分类的样本)来训练学习。
其中,K(xi,xj)是核函数,因RBF 核函数只有一个参数,比其它核函数模型简单,因此本文选用RBF核函数为SVM的核函数,RBF核函数表达式为
用SVM 分割图像的过程,即是将属于目标的像素点分为一类,属于背景的像素点归为另一类。在这个过程中,需要提取两类像素点的特征进行SVM分类器的训练。之前在提取特征的时候,多数情况下只提取图像的颜色特征,因为颜色特征最为直观,而且很容易被人类视觉所察觉。但是对于图像来说,除了颜色信息以外,它还有其他特征。在将颜色作为特征进行图像分割时,颜色所提供的信息量是不够的,所以不能仅仅用颜色特征完全代表图像。除了颜色特征之外,图像还有纹理、形状等特征。纹理特征是指图像的均匀、细致、粗糙等现象,是图像表面所呈现出来的特点,反映了在空间中的图像像素灰度值的分布。综上所述,本文提取图像的颜色特征和纹理特征进行SVM 分类器的训练。
颜色特征是彩色图像分割中应用最为广泛的视觉特征[16]。另外,颜色特征不完全由图像的视角、尺寸、方向等决定,所以比其他视觉特征鲁棒性更高。在提取颜色特征时,本文选择最常用的RGB 颜色空间,分别提取每个像素点在R、G 、B三个通道的特征值,表示为
纹理特征用来描述彩色图像的信息和深度,它反映了图像颜色和灰度的变化,是人眼视觉的重要组成部分。纹理特征是用数学或信息论的方法抽取的纹理度量。LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子,它具有旋转不变性和灰度不变性等显著的优点,具有对光照不敏感的特性。
原始LBP 算法的基本思想是在3*3 的窗口内,以窗口中心像素为阈值,将相邻的8 个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。LBP 的操作可以被定义为
其中,( xc,yc)是中心像素,亮度是ic,而ip则是相邻像素的亮度,s 在这里是一个函数符号,可表示为
这样,3*3 邻域内的8 个点经过比较可产生8位二进制数,如图5 中00010011(通常转换为十进制数即LBP 码,共256 种),即得到该窗口中心像素点的LBP 值,并用这个值来反映该区域的纹理信息。
图5 LBP值计算
将LBP 特征值表示为Ti,j,则训练样本的特征向量可以表示为本文从40 张样本航拍图像中进行样本挑选,每幅图像通过人工选择前景样本点10 个和背景样本点15 个。将这400 个正样本点和600 个负样本点组成的训练样本集利用OpenCV 集成的train 函数进行离线训练,将训练好的分类器模型保存为XML 文件形式。在对图4进行图像再分割时,遍历图像中的彩色像素点,通过加载训练好的分类器XML 文件,然后调用predict 函数进行预测,若该函数返回值为1 表明该像素点属于前景部分应当进行保留,若结果为0 则表明该像素点属于背景部分应当进行删除。图4 经过图像再分割步骤后的结果如图6所示。
(1)坝面坡度局部调整段坡度调整范围应在坝体原设计内外坡坡度范围以内,这样可以确保坡面坡度有前期稳定计算实验、研究支持[4]。
图6 图像再分割后的子图像
从图6 中可以发现分割后的二值图像中仍然存在一些对前景目标识别不利的干扰区域,但这些区域通常是孤点或小的独立区域。因此如果通过分析并对区域的某些特征参数进行限制,就可以将绝大部分的干扰区域删除,突出需要分析的前景部分。OpenCV 提供了一个简单的函数findContours,可以提取出图像中连通区域的轮廓,然后可对识别出的连通区域进行独立的分析,而每个连通的区域又可以通过算法确定一些特征参数。经过多次实验,本文采用区域面积参数和区域边界长宽参数来表征各连通域的特征。
区域面积参数最直观的描述是像素面积,即区域所包含的像素数目,如果设A 表示区域的像素面积,那么依次遍历连通域中的每一个像素,并通过计数器计数就可以得到该连通域的区域面积参数[17~19]。
区域边界长宽参数用来描述连通域最小外接矩形的长和宽,通常将长宽比作为一个连通域的区域特征[20~21]。区域外接矩形模型如图7所示。如果设外接矩形的长和宽分别为a 和b,则区域长宽比L 可以表示为
本文设置一个区域面积参数的阈值Athres和一个区域长宽比参数的阈值Lthres:
算法流程设计如图8所示。
该算法中主要判定依据是,区域面积微小时可直接判定为干扰区,其次判定面积较小的区域,对于这部分区域可能为噪声密集区形成的噪声连通域,也应当去除。最后考虑到架空电力线形成的是类直线区域,因此区域长宽比参数的阈值Lthres1应设置为一个较大的值。经过多次实验,本文将区域面积参数的阈值Athres1设置为45,区域长宽比参数的阈值Lthres1设置为3。
经过该算法处理后得到的目标前景图像如图9,对比图6 可以明显发现,干扰区域基本全部被滤除,同时架空电力线以及悬挂异物得到了很好的保留,这对后续悬挂异物的准确定位至关重要。
图9 基于区域特征处理后的二值图像
输入本文算法的样本图像可分为两种类型:一种为输电线路不含异物图像,一种为输电线路含异物图像。为了评估本文算法的有效性与运算效率,同时方便相关领域内其他人员研究使用,我们在Visual Studio 2017 集成开发环境中使用OpenCV 计算机视觉库对本文的算法进行了程序实现。
本文选取40 张样本图像,其中20 张含有悬挂异物,20 张不含有悬挂异物。算法程序运行在Win7 操作系统的PC 电脑上,电脑CPU 型号为i5-2450M,运行内存为6G,对40 张样本图像乱序进行处理。针对算法的准确率与平均运算时间,本文进行了多次实验,结果如表2所示。
表2 算法的准确率和运算时间
结果显示,本文算法在大多数情况下能将前景与背景准确分割,因此该算法在准确性上基本符合要求。由于在现实情况中需要对大量的输电线路航拍图像进行处理,这就要求算法拥有较快的运算时间。结果显示,本文算法处理一张航拍图像的平均时间较短,能满足实际运行情况,因此该算法在运算快速性上基本符合要求。
图像分割是输电线路悬挂异物识别与定位的预处理工作,对此本文提出了一种基于输电线路悬挂异物航拍图像的图像分割算法,并通过样本图像实验对该算法的准确性和运算快速性进行了分析评估。结果表明,该算法能快速准确地将前景与背景分割。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!