时间:2024-05-22
王爱芳 王妮
摘要 以三江源地区地形地貌特征、草场分布较为典型的班玛县为例,以HJ环境星多光谱影像为主要数据,基于支持向量机SVM超平面理论,结合灰度共生矩阵寻找最适宜的分类核函数,选取了三江源地区草地信息提取的最适宜SVM分类模型,并与传统的监督分类方法最大似然法和SVM分类方法进行比较,进行三江源草地分类方法的优化。结果表明,与传统监督分类方法相比,除Sigmoid核函数外,其余结合方法的分类精度均有所提高,其中结合纹理和高斯核函数的SVM分类模型有着较理想的识别效果,精度达到91%,Kappa系数为0.856 0,能为三江源地区草地可持续利用以及生态系统恢复提供基础数据。
关键词 三江源;草地信息提取;遥感;支持向量机;灰度纹理
中图分类号 S127 文献标识码 A 文章编号 0517-6611(2017)13-0210-04
Information Extraction of Sanjiang Source Grassland Based on Gray Level Texture and Support Vector Machine Classification
WANG Ai-fang1,WANG Ni1,2*
(1.School of Geographic Information and Tourism,Chuzhou University,Chuzhou,Anhui 239000;2.Anhui Center for Collaborative Innovation in Geographical Information Integration and Application, Chuzhou, Anhui 239000)
Abstract Taking Banma County with typical landform characteristics and distribution of grassland in Sanjiang Source as an example,HJ environmental satellite multispectral images were used as main data. Based on the SVM super plane theory, combined with gray level co-occurrence matrix,the most suitable classification kernel function was discussed. The optimum SVM classification model of grassland information extraction in the source region of Sanjiang was selected and compared with the traditional supervised classification methods(maximum likelihood method and SVM classification method). The classification method of grassland in Sanjiang source was optimized. The results showed that the classification accuracy of other methods was improved compared with the traditional supervised classification method, in addition to Sigmoid kernel function. SVM classification model combined with texture and Gauss kernel function had ideal recognition effects, the accuracy was 91%, Kappa coefficient was 0.856 0. The research results can provide basic data for the sustainable utilization of grassland and the restoration of ecosystem in the source region of Sanjiang.
Key words Sanjiang Source;Extraction of grassland information;Remote sensing;Support vector machine;Gray level texture
三江源位于青海省南部,是长江、黄河、澜沧江的发源地,生态区位显著。由于独特的地理位置和气候条件,这里的生态异常敏感和脆弱,受到世界各界的关注。尤其是近十年草原生态的破坏,致使草地生产力明显下降,生态功能弱化,严重制约了当地居民的经济发展。草原生态系统是三江源地区的主体生态系统类型,草地畜牧业是三江源地区的主导产业。因此,研究三江源地区草地的现状和动态对于不断更新三江源地区草地的基本科学数据和地区草地可持续利用以及生态系统的恢复具有重要作用。
目前,现代空间信息技术特别是遥感和地理信息系统技术的发展为土地利用空间结构研究提供了新的技术手段和方法。遥感对地观测是人类获取地面信息的重要手段。随着遥感技术的发展,其不受自然和社会条件限制的优势越来越突出。基于遥感数据可定量、定性、定时、定位的对草原植被进行分析。近些年结合遥感影像对于土地覆盖分类中草地信息研究的技术不计其数,其中结合支持向量机(Support vector machine, SVM)的地物分类方法更成为研究热点。王明伟等[1]利用最大似然分类以及SVM实现对土地利用和地表覆盖问题中地物类型的提取和识别,结果发现SVM分类精度更高;颜梅春等[2]通过IKONOS影像完成基于植被指数和灰度共生矩阵提取的纹理量两种分类方法对城市草地进行了提取,发现结合纹理量的分类法精度相对理想;刘冰等[3]针对湿地空间信息的复杂性和SVM的分类性能,设计了一种基于混合核函数的特征加权SVM分类模型,该分类模型在总体精度和Kappa系数上都有所提高。以上研究表明,SVM分类模型对于遥感影像信息研究具有重要意义。但是,针对SVM分类模型的不同核函数选择以及相应的改进研究欠缺,对三江源地区丰富的草场资源而言,有效利用SVM改进算法实现草地信息提取的研究罕见报道。考虑到三江源区海拔极高、采样困难、样点缺乏不均匀、实地监测条件不足等问题,笔者以方便、快速地进行遥感图像分类为指导思想,有效利用了基于小样本的SVM不同核的参与算法分类模型,結合纹理特征,实现多种分类方法分类精度的比较,以MATLAB为平台,结合实用的程序接口,实现了对中分辨率影像分类“同物异谱,异物同谱”,地类识别度低等问题的改进,对三江源地区草地信息进行提取。
1 研究区概况与数据来源
1.1 研究区概况
班玛县(图1)位于青海省东南部,隶属果洛藏族自治州,位于99°45′~101°14′ E,32°27′~33°18′ N。全县以草牧业为主,实行半农半牧的二元种植制度,生态区位显著,是三江源的核心区。全县总面积为6 138 km2,约占全州总面积的8.03%。草场面积396.72 hm2,可利用面积335.30 hm2。境内山脉纵横,山峰重叠,海拔为4 000~5 000 m,地势起伏大,属于高原大陆性气候,随海拔高度增加而气温递减。草场主要分为高山草甸类和山地草甸类2类,5个亚类,7个组,30余个类型。放牧草场广泛分布在海拔3 700~4 700 m的沟谷河谷滩地,山地阳坡、半阳坡、阴坡、半阴坡及高山山顶的高寒地区。
1.2 数据来源
1.2.1 试验数据。该试验所使用数据包括遥感影像资料、班玛县基础地理信息图件及辅助数据。遥感影像资料使用的是我国在2008年9月6日发射的环境与灾害监测小卫星星座A星的CCD数据。空间分辨率30 m。为实现良好的遥
感影像读取,以2015年8月的环境星影像为主,并辅助以同期MODIS数据。MODIS数据主要有美国航空航天局NASA提供的土地利用/覆盖产品(MCD12Q1)以及归一化植被指数数据(MOD13Q1)[4],其他基础地理信息图件及辅助数据包括班玛县行政区划图、边界矢量文件等。
1.2.2 数据预处理。首先,基于HJ-1A/B Tools对遥感数据进行辐射定标。通过FLAASH大气校正还原地物真实反射率。其次,对环境星影像进行图像增强,突出地物显示并通过PCA主成分分析,得到最佳组合波段为321,图像色彩饱满,内容丰富。除去第四波段,避免了大量的噪声影响。
最后,对于增强后的影像做关于研究区的裁剪,利用三江源矢量文件,对影像进行裁剪得到班玛县影像,由于笔者仅对研究方法进行讨论,所以在班玛县影像上另外选择一个矩形区域进行局部范围裁剪[5]。从裁剪后的影像上选取一处清晰地物点,以该点为起点,划定长度为400像元,宽度为400像元的矩形区域(图2)。将该矩形区域作为方法研究区,并裁剪下来。结合相同地区的Google Earth数据进行辅助的目视解译,避免大量噪声影响。最终所选取的研究区内,包括的地物类型主要有耕地、草地、水域和其他。
2 研究方法
2.1 纹理特征提取
在目前图像纹理特征提取算法中,应用最广泛的是1973年Haralick从纯数学角度提出的灰度共生矩阵的纹理描述方法,其实质是通过计算灰度图像得到其条件概率P(i,j,d,θ),然后透过部分特征值,来分别代表图像的某些纹理特征。灰度共生矩阵能反映图像灰度关于方向、相邻间隔、变化幅度的综合信息,在利用影像的纹理特征改善影像的地学目标分类效果上具有明显优势[6]。
Haralick提出的用于分析灰度共生矩阵的共14个特征中,笔者选择4个识别能力强、不相关的纹理测度(表1)作为主要指标[7]。针对第一主成分影像,实现灰度特征提取。
2.2 SVM分类模型
SVM是基于结构风险最小原理的统计学习方法,由线性可分情况下的最优分类超平面发展而来。对于非线性情况,SVM将核函数引入非线性映射,将输入向量映射到高维空间,并求解最优分类面。
在这里引入的2个参数C和δ,其中C是惩罚系数,它的作用是控制对错分样本的惩罚程度;δ是松驰变量,如果是将要错分的样本点可以允许它不是精确的大于等于1。其对偶问题为:min(12aTQa-eTa),限制條件为:yTa=0(0≤a≤C,i=1,2,3…N)),e是一个向量。k(xi,xj)就是通常说的核函数,Mercer定理保证了内积核函数的存在[8]。
常见核函数有以下几种:
通过MATLAB编程实现对样本灰度特征的提取,再结合不同核参与的SVM算法,对其进行学习和训练,形成不同的预测模型。研究表明,是否结合选用不同的核函数和核参数将会直接影响分类精度。
首先基于ENVI环境从研究区上均匀选取耕地、草地、水域及其他3类地物各一定数量的样本。样本选取时注意保证单个样本单元内光谱值均一化。并且由于研究区内大部分是草地,所以根据训练样本数量选择和总体分类精度关系的研究[9]选取各地类大小为40×40像素的矩形样本中草地样本40个,耕地样本30个,水域及其他样本30个。
对于纹理,首先基于计算得到样本的4维纹理特征值。经前人研究分析和试验比较得知草的对比度CON纹理量值最稳定,且与滑动窗口关系不大[5],所以着重对草地的对比度纹理量进行分析。在MATLAB中输入样本的4维特征向量并进行归一化处理,再对其进行训练,分别使用线性、高斯、多项式、Sigmoid核函数来构造4种结合纹理的分类模型。再分别对测试集进行分类预测。分类准确率计算公式如下:
分类准确率=测试集中标签预测正确的样本数量总测试集的样本数量(5)
3 结果与分析
采用面向对象图像分割方法,由于近红外影像植被区影像亮度大,植被在该波段目视效果达到最佳,所以采用近红外波段影像进行分割操作。结合ENVI和ArcGIS软件实现人机交互式提取图像边界。在试验过程中选取合适的分割值以及合并阈值,得到草地初始分类数据。
基于选取的样本,先使用传统SVM分类和最大似然分类进行试验,将得到的结果与基于纹理的SVM不同核的分类结果进行比较。分类结果和分类精度比较结果如表2所示。
SVM不同核中,线性核函数分类能力有限,于线性可分情况下,分类效果和速度达到最优;多项式核函数主要受参数d限制;Sigmoid核函数分类能力强,但是同样受2个参数的限制,适应性不高;高斯核函数是一种比较常用的分类核函数,它具有较好的自适应性,只有一个核参数,分类能力相对较高,线性核函数是它的特殊情况。
试验结果表明,在相同的试验环境下,采用相同的样本集,使用MATLAB中LIBSVM提供的交叉验证和网格搜索方法选择核参数为0.25,惩罚系数为32的高斯核函数结合纹理的分类模型识别速度以及识别率都高于其他核参数结合纹理参与下的分类模型,实现了最佳的分类结果,总精度达91.01%,Kappa系数为0.856 0。从图3和图4可以看出,
传统分类方法中,SVM分类模型的分类效果比最大似然分类方法更好。从图4可以看出,最大似然法对于草地和耕地的错分、漏分误差严重,对于水域分类效果较好[10]。结合纹理的高斯核函数SVM分类法对草地和水域的识别度高,但同时也有耕地错分的现象(表3);
不同核函数的选择对于分类精度有一定的影响。由于地类边界的复杂性和不明确性,线性核函数的分类精度只有90.19%,但是结合纹理其分类精度要比传统SVM分类提高0.31%。多项式核函数较大程度上与参数d相关,数值计算时间较长,该试验的精度为9088%,是与高斯核函数相比较好的一种核函数模型。Sigmoid核函数结合纹理分类模型在此次试验中分类效果最差,不到90%。这是由于Sigmoid核函数需要有满足特定条件的核参数,但是当参数r很小并且参数T趋于0的时候,Sigmoid核函数和高斯核函数具有相似的分类能力,只是在该研究中未提及。经比较,结合纹理的高斯核函数分类模型分类效果最好。
纹理特征对于遥感影像的分类有很大作用,该研究中的灰度共生矩阵是通过研究灰度的空间相关特性来描述纹理。選用对比度纹理特征向量来分析草地的纹理特征,结果发现结合纹理进行分类的图像视觉效果更加清晰。
为了定性和定量的分析结合纹理的不同SVM尤其是高斯核函数参与下的SVM分类模型对于土地覆盖草地信息提取的影响,这里辅助以同一时期同一区域的土地覆盖/利用数据(MOD09Q1)进行分类结果比较,总体分类精度良好。
4 研究区草地信息提取
基于上述方法得到的草地类别数据精度较高,证明研究方法对于该地区可实施程度较好,因此将该种方法应用于研究区影像并提取草地范围,计算草地植被盖度。基于高清竹对藏北地区草地退化等级的划分,将三江源草地植被覆盖等级分为5级[11]。引入草地植被盖度指数计算公式:
式中,GVCI 为草地植被覆盖指数;Di 为草地,植被覆盖等级i 的评分;Ai为草地植被覆盖等级i的分布面积(km2);A 为研究区草地总面积(km2)。最后,将结果绘制成草地分布图。从图5可以看出,研究区植被状况良好,整体植被盖度指数较高。该研究结果与刘晓东等[12]研究的三江源草地覆盖结果一致性高,并符合统计年鉴中草地的基础数据。水域及其他用地草地覆盖度低,耕地部分草地覆盖度良好。山体阳坡的草地覆盖度要低于阴坡,除了温带干旱区草地的生长条件外,这很有可能和人类活动有着密切的联系。据研究,近10年三江源地区的草地生态系统受到破坏,过度的人为因素使得三江源的草原生态备受关注。
5 结论
通过不同核函数并结合纹理建立SVM分类模型进行分类对于草地分析有一定的效果,草地纹理细而无规则,所以基于共生矩阵的影像草地信息提取效果理想,尤其指出高斯核函数参与下的分类模型适用性较广且有良好的类推能力,局部优势明显,在此次试验中获得较理想的结果。SVM对高维特征有较强的包容性和自适应力,该方法对于传统的分类方法有着更高的自适应学习性和推广能力。
基于三江源特殊地区,不断改进研究方法有重要意义。由于环境星影像分辨率限制,草地信息提取存在一定的影响,但它反映了一种在采样困难情况下相较于传统监督分类法更为精准的影像地物提取方法,结合简便的MATLAB语言,实现速度快,精度高。
该研究只选取了4种常见的纹理测度为分析的依据,适应性不广、概括性不高,还有其他的测度指标尚未研究;
不同核函数参与下的SVM分类算法还有待进一步改进,纹理特征只是考虑相对于草地而言比较突出的,以便达到更高分类精度。
参考文献
[1] 王明伟,王志平,赵春霞,等.基于最大似然和支持向量机方法的遥感影像地物分类精度评估与比较研究[J].山东科技大学学报(自然科学版),2016,35(3):25-32.
[2] 颜梅春,张友静,鲍艳松.基于IKONOS高分辨率影像的城市草地信息提取研究[J].草业学报,2004,13(6):34-37.
[3] 刘冰,吴超,林怡.混合核特征加权SVM遥感湿地空间分类[J].测绘工程,2016,25(7):13-17.
[4] 李亚刚,李文龙,刘尚儒,等.基于遥感技术的甘南牧区草地植被状况多年动态[J].草业科学,2015,32(5):675-685.
[5] 陈冠宇,李向,王岭玲.基于大数据的遥感图像植被识别方法[J].地质科技情报,2016,35(3):204-209.
[6] 黄祥,杨武年.结合灰度和基于动态窗口的纹理特征的遥感影像分类[J].测绘科学技术学报,2015,32(3):279-281.
[7] 焦蓬蓬,郭依正,刘丽娟,等.灰度共生矩阵纹理特征提取的 Matlab实现[J].计算机技术与发展,2012,22(11):169-171.
[8] 郭克友,郭晓丽,王艺伟.SVM参数优化方法分析与决策[J].计算机测量与控制,2016,21(6):255-258.
[9] 王春来,张森原,崔璐,等.训练样本数量选择和总体分类精度的关系研究[J].河南城建学院学报,2015,24(3):52-55.
[10] 杨长坤,王崇倡,张鼎凯,等.基于SVM的高分一号卫星影像分类[J].测绘与空间地理信息,2015,38(9):142-145.
[11] 高清竹,李玉娥,林而达,等.藏北地区草地退化的时空分布特征[J].地理学报,2005,60(6):965-973.
[12] 刘晓东,刘荣堂,刘爱军,等.三江源区草地覆盖遥感信息提取方法及动态研究[J].草地学报,2010,18(2):155-157.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!