时间:2024-08-31
孙智虎,张锦水,洪友堂,杨珺雯,朱爽
1.遥感科学国家重点实验室 北京师范大学,北京 100875;2.中国地质大学(北京) 土地科学技术学院,北京 100083;3.北京市陆表遥感数据产品工程技术研究中心,北京 100875;4.北京师范大学 地理科学学部遥感科学与工程研究院,北京 100875;5.北京工业职业技术学院,北京 100042
2019 年11 月7 日中国成功发射的GF-7 是继ZY-3 卫星后又一多角度立体测绘卫星,空间分辨率达到亚米级,具有1∶10000 比例尺立体测绘能力,能观测到更为丰富的地物立体特征并可用于高精度的地形数字产品生产和土地覆盖制图,在农业监测、林业管理、城市规划等方面具有广阔的应用前景。
基于高分辨率遥感影像光谱和高清特性进行高精度农作物制图一直是遥感应用领域的重点研究方向。一般而言,作物分类都是需要利用遥感图像的光谱、空间等特征进行作物的精准识别。如,宋德娟等(2020)基于GF-2影像构建WWRSE深度学习模型,准确提取出冬小麦的种植分布;吴锦玉等(2019)利用GF-2 的光谱特征、植被指数与多种纹理特征能够对塑料大棚进行识别;Zhang等(2020)利用GF-1等米级影像构建MPSPNet网络模型进行大尺度耕地分布提取。这些研究均表明米级/亚米级影像空间特征是能够准确表达作物的独有特征,为作物的精准识别提供基础。
高分辨率立体测绘卫星多角度对地观测能够反演地形数据作为辅助信息支撑地物识别,或构建多角度遥感特征参与分类。如,Tian等(2013)利用Cartosat-1影像生成的DSM(Digital Surface Model)进行工业区、林区的变化检测提取。Li 等(2016)利用ZY-3 卫星影像生成地形数据,进行矿区和农业制图。Huang等(2014)利用ZY-3提取的DSM及形态学等特征进行城市的变化检测识别。Matasci等(2015)利用WorldView-2多角度序列影像,分析影像拍摄角度对城市地区分类影响。这些研究是通过DSM 表达出地表要素的高度差异作为独立特征变量支撑信息的提取。另外,Huang等(2018)利用ZY-3 影像,构建多级角差特征支撑城市场景分类,用于提高城市地区的分类精度。通过这些研究证实,通过立体像对提取DSM 或利用多角度观测结果生成的空间结构特征能够提高地物的可辨识能力,是光谱、纹理等特征的有力补充。
Khatami 等(2016)总结了在光谱分类的基础上纹理特征能将总体分类精度提高12.1%,多角度特征平均提高8%,表明多角度特征对地物识别的贡献。因此,本文针对GF-7 卫星,研究多角度遥感特征对农作物精确识别的贡献,为促进GF-7 影像多角度特征应用到作物遥感制图中积累研究基础。
本研究利用GF-7 影像多光谱、前后视影像进行冬小麦、大蒜的识别,重点探讨3 个方面的内容:(1)分析GF-7 卫星影像光谱、纹理和角差特征对地物的表达能力和可分性,重点分析角差特征与其他特征的区别。(2)利用支撑向量机SVM(Support Vector Machine)分类器进行作物识别,分析不同遥感特征对作物识别的贡献,尤其是角差特征对作物识别精度的作用。(3)分析作物分类结果的不确定性,评估不同特征作物空间误差的表达,探讨作物专题分类结果不确定性与分类误差的内在关系,探讨角差特征与分类结果不确定性之间的关系。
研究区位于华北平原中部,山东与河南的交界处,如图1所示。该地区属于温带大陆性季风气候,夏热冬冷,降水集中在夏季,越冬作物主要是冬小麦和大蒜,夏季作物以玉米为主。对于冬小麦和大蒜,属同期作物,单用光谱等特征进行识别存在相混,这种现象在中国华北地区常见,本文探讨利用GF-7多角度特征解决这一难题。
图1 研究区概况Fig.1 Overview of the study area
GF-7 卫星搭载1 台双线阵相机和1 台激光测高仪,其中双线阵相机具有优于0.8 m 空间分辨率的前视、后视全色和优于3.2 m 空间分辨率的后视多光谱成像能力,激光测高仪配置有2 波束的1064 nm 激光用于获取地面30 m 光斑范围内的高程。GF-7 单景遥感影像幅宽20 km,重访周期为60 d。
卫星拍摄时太阳、前视影像、后视影像的方位角和天顶角关系如图2所示。
图2 太阳及卫星拍摄位置图Fig.2 Sketch map of the position of the sun and satellites
本研究影像(图1)获取时间为2019 年11 月13 日。以Google Earth 影像为地理参考影像,目视选取控制点,将后视全色影像进行几何配准,随后将后视多光谱影像和前视全色影像均配准到后视全色影像上,配准误差小于0.5 个像素。李霖等(2014)、刘会芬等(2014)指出Gram-Schmidt 融合方法(Clayton,1971)能够有效地继承多光谱影像的光谱信息和全色影像的空间信息,有利于地物的分类,因此本文选用Gram-Schmidt方法进行后视全色与后视多光谱影像数据的融合。本文后面作物分类所采用的光谱和纹理特征均来自于融合影像。
为掌握研究区的作物种植情况,2019 年11 月30日—12月1日进行了野外调查,采用艾尔思公司开发的“AW 拍”手机APP(iOS、安卓版本可从应用市场下载)采集了682 个样本点和对应的现场照片,其中冬小麦296个,大蒜226个,其他作物34个,林地26个,草地20个,裸地58个,其他22个。基于采样点位置信息及照片信息,共数字化出36个野外调查样方(图3),其中351 个冬小麦、216 个大蒜、842 个其他地块(包括建筑、裸地、其他作物、林地、草地和水域),地块分布见图1。以矢量地块范围和属性为基础,构建作物分类的检验样本,样本数量和类型见表1。
表1 训练样本与检验样本Table 1 Training and test dataset
图3 地块矢量构建示意图Fig.3 Schematic diagram of parcel vector construction
通过野外调查了解到,该研究区内的冬小麦播种时间跨度时间较长,绝大部分冬小麦处于分蘖期(图3(Ⅱ)、图3(Ⅲ)),仍有少部分冬小麦处于出苗期。大蒜是种植面积仅次于冬小麦的农作物,在调查期内其表面覆有白色地膜,如图3(Ⅰ)所示。从调查图片可以看出,大蒜在这一时期的高度与冬小麦相差不多,不同之处在于大蒜垄间间隔较冬小麦宽,背景裸土信息暴露更多,且有地膜附着地面。
本文技术流程如图4所示,主要包括:影像预处理、特征和训练集测试集构建、不同特征组合的SVM 分类、精度评价以及分类结果不确定性的定量评价。
图4 实验流程图Fig.4 Experiment flow chart
该研究区主要地物类型有冬小麦、大蒜、蔬菜(大葱、花椰菜、甘蓝等)、建筑(居住地、道路、蔬菜大棚、厂房等)、裸地(裸露的地表和休耕地)、水域(河流和池塘等)和草地,各类型在影像上呈现的特征如图5所示。
图5 研究区地物类型影像特征Fig.5 Image characteristics of land cover types in the study area
已有研究表明,遥感制图精度高低与分类器和训练样本相关(Khatami 等,2016;朱爽 等,2014)。为保证样本的代表性,在外业实测样本的支持下,我们以10 像素×10 像素框在影像上均匀地选择出解译单元进行地物类型的识别,构建训练样本,其像元数量见表1。分类体系定义为冬小麦、大蒜和其他(包含其他作物、林地、草地、裸地、水域和建筑)。
本研究综合考虑光谱、纹理和多角度特征进行作物分类,分析不同特征对作物分类精度的影响。
3.3.1 角差特征
各种土地覆盖在太阳光照射下会呈现出一定程度的光谱反射各向异性(Su 等,2007)。GF-7卫星从前、后视角度观测地表,依据双向反射分布函数BRDF(Bidirectional Reflectance Distribution Function)(Roujean 等,1992;Schaepman-Strub 等,2006)的原理可知,多角度影像能够反映出地物的双向反射差异特征差异,以及地物的结构信息(Chopping 等,2008),这一特征信息称为角差特征。角差特征是基于同种地物具有稳定的BRDF,而不同空间结构的地物BRDF有所不同,与光谱特征一样,是地物区分其他地物特有的特性(Huang等,2018)。因此,本文将GF-7 卫星影像提取的角差作为一个衡量地物的空间维度特征,见式(1):
式中,FWDpan为前视全色影像,BWDpan为后视全色影像。
3.3.2 纹理特征
灰度共生矩阵是由观测窗口、像元移动步长和方向、分布概率的灰度等级定义的一种统计分析方法(Lan 和Liu,2018),是纹理特征的量化指标(Haralick,1979)。
本文为消除特征维度冗余带来的数据维度灾难(杨闫君 等,2018),对融合影像进行主成分分析,第一主成分波段分量占影像信息的78.05%,因此这一分量信息能够代表整个图像,进一步提取第一主成分波段的8种独立纹理特征,包括均值(Mean)、方差(Variance)、均一性(Homogeneity)、对比度(Contrast)、相异性(Dissimilarity)、信息熵(Entropy)、二阶矩(Second Moment)和相关度(Correlation)(张锦水 等,2007)。
朱秀芳等(2019)指出纹理窗口对地物纹理特征表达影响较大。本文设置了3×3、5×5、7×7、9×9、11×11、13×13、15×15 的不同窗口提取纹理特征,进行SVM 构建和作物识别,并使用检验样本评估冬小麦和大蒜的精度(Congalton,1991)。采用两种作物制图精度与用户精度之和的均值作为评价指标来确定最优窗口。经测试,3×3 窗口的纹理特征是用于作物分类最优的(图6)。
3.3.3 特征组合
光谱、角差和纹理是从不同维度表达作物特征,表2列出了本文所采用的所有特征。采用不同的特征组合进行作物分类以验证不同特征对作物分类结果的影响是常用的策略(于婉婉 等,2021)。本文以光谱为基础特征,分别分析纹理特征和角差特征对分类精度的影响,特征组合包括:A、A+B、A+C和A+B+C。
表2 作物分类遥感特征Table 2 List of feature variables of crop mapping classification
SVM常应用于图像识别领域,通过线性(linear)、多项式(polynomial)、sigmoid、rbf(Gaussian)等核函数(Chang 和Lin,2011)将数据映射到高维空间,对数据集进行线性非线性划分,构建几何间隔最大的超平面,找到各类别之间的最优分界线以期最大程度划分数据集,在农作物遥感分类中得到广泛的应用(Khatami等,2016)。
本文基于Python scikit-learn 库进行模型训练和预测推断,采用网格搜索和10 折交叉验证方法来寻找RBF核函数的最优参数cost和gamma(Li等,2016;Duro等,2012),结果见表3。
表3 不同特征组合SVM优选参数Table 3 Optimal parameters of SVM classification with different feature combinations
以数字化的野外调查样方结果作为检验样本(表1),与分类结果进行对比,构建混淆矩阵(Congalton,1991),评估不同特征组合的SVM 分类结果的总体精度、Kappa系数,冬小麦和大蒜的制图精度、用户精度。
McNemar 检验是基于自由度为一的卡方检验(Waldner 等,2015),比Z-test 具有更高的精度和敏感性,适用于相同数据(Alshehhi 等,2017)检验来检验实验结果准确性差异是否具有统计学意义(Waldner 等,2015),也就是要回答“方法A识别精度比方法B精度高,是否通过显著性检验”,而不是简单利用精度指标的高低评价方法之间的优劣。
McNemar 检验是基于不同特征组合分类器的分类结果对各像素的一致性假设,即判断各分类器是否将同一单个像素划分为同一类别,计算公式如下:
针对对应的每个像元,式中,n12代表组合1分类器正确分类但组合2 分类器错误分类的像元个数,n21正好相反。
本文将McNemar 检验用于在95%置信度下检验不同特征组合的农作物识别结果是否有显著性差异,从而证实方法间分类精度差异的可行度。
上面的精度评价方法能够表达出专题图的整体分类精度(Foody,2002),但无法体现出空间误差的分布。信息熵可以综合不同来源误差,用一个数字表达不确定性的分布和程度(Dehghan 和Ghassemian,2006),信息熵被用来量化表达遥感分类结果的不确定性(Foody 和Atkinson,2002;Dehghan 和 Ghassemian,2006)。本文针对不同分类特征组合的不确定性结果,从空间异质性上分析各种特征对分类结果精度的影响,从中分析作物精度影响的内在机理。
分类器对于最终类别的归属概率可以描述分类的不确定,但这忽略了其他类别的归属概率(Waldner 等,2015)。Dehghan 和Ghassemian(2006)提出利用熵来综合反映分类结果的不确定性。按照式(3)计算每一个分类像元x的熵:
式中,n代表分类的类别数,pi(x)代表像元为第i种地物类型的概率。
本文进一步采用Waldner 等(2015)提出的归一化不确定性NUC(Normalized Uncertainty Criteria)计算方法来表达像元的不确定性,如式(4)所示:
式中,M代表分类规则所划分类别的总数。NUC(x)值越高,分类结果越不确定。
4.1.1 角度差异分析
依据各地物类型角差值的概率分布图(图7),分析角差特征对冬小麦、大蒜、其他作物、林地、草地、裸地、建筑和水域等地物的表达能力。大蒜和水体角差值几乎全部大于0,这是卫星前视观测接收到太阳光的反射要高于后视观测,大蒜和水体表面有一定的镜面反射特性。刘小珊(2015)指出,对于土壤,当探测器方向与光源方向相同,探测器接收的能量是光源直接照射部分,土壤颗粒之间的阴影很少,后向反射能量高于前向反射能量,因此其角差值为负,这对于冬小麦、其他作物、林地、草地的角差值大部分为负是同理的。这样的多角度反射差异与太阳入射方向、卫星接收高度角以及地物类型所特有的表面结构特性有关。
图7 地物类型角差值概率分布Fig.7 Probability distribution of angular difference value of land cover types
大蒜的角差值远高于冬小麦、其他作物、林地、草地和裸地,大蒜与这些地物类型的角差值分布几乎没有重叠,这是由于大蒜种植区域覆有白色地膜具有较强的镜面反射特性,从而使得大蒜种植区域与其他地物具有显著的角差反射差异,可见通过角差特征可有效地区分大蒜与这几种地物。大部分情况下,冬小麦的角差值大于裸地、其他作物和草地,小于大蒜和水域,在分布上没有或仅有少部分重叠,这是通过角差特征将冬小麦与其他几种地物有效区分的基础。
大蒜角差值分布与水域和建筑有较多的重叠,冬小麦角差值与林地、建筑有较多的重叠部分,若仅通过角差特征识别农作物,则这些地物之间会产生一定的混淆。
冬小麦和大蒜角差值分布集中,说明研究区冬小麦和大蒜具有相对稳定的BRDF,类内稳定的角差特征有利于作物识别。林地、建筑和水域角差值分布离散,是由于其类内形态有较大差异,特征信息表达存在波动性。
裸地的角差值最小,与其余地物存在明显的不同。其他作物与草地角差值分布大部分都有重叠,角差特征难以区分这两种地物。建筑区域的角差值集中在0值附近分布,且多为正值,这可能是建筑物三维特征更为明显导致的。
4.1.2 空间特征差异分析
依据min-max 标准化方法计算特征归一化值,统计得到地物类型的特征均值、标准差图(图8),以分析不同地物空间特征的可分性。图8中箱型图横线值为均值,上下端与中间横线的差距表示标准差,图形上下幅度差异越大异质性越强。其他作物、林地、水体和建筑在各特征上标准差较大,是由于它们的类内形态具有较大的差异。
图8 地物类型的特征均值、标准差图Fig.8 Mean and standard deviation chart of land cover type
冬小麦与大蒜在蓝光、绿光和红光波段上有显著的差异,说明冬小麦与大蒜光谱上具有一定的可分性;冬小麦的均值特征大部分小于大蒜和其他作物,卫星接收到冬小麦种植区域的地物反射能量较小;近红外特征可反映农作物的生长旺盛程度,冬小麦的近红外特征小于其他作物;冬小麦与林地在光谱特征上混淆较大,而在均一性、相异性、二阶矩和信息熵特征有显著差异。
图8显示出大蒜在绿光特征与林地、草地仅有少部分重叠,绿光特征可将大蒜与林地、草地区分;大蒜与各类土地覆盖物在8种纹理特征上大都有较多的重叠,这种混淆是和当地作物种植环境及作物生长阶段相关,因此加入纹理特征会造成信息冗余将会影响大蒜的识别精度。
图9是不同特征组合分类结果及其不确定性评估结果,用以整体显示不同特征尤其是角差特征对分类结果和不确定性的影响。图9中不确定性评估结果呈现出明显的边界效应,这可能是由于本文研究的GF-7 影像处于在轨测试时期,其数据存在部分问题。
图9 不同特征组合识别结果及不确定性评估分布图Fig.9 SVM classification result and uncertainty evaluation map of feature combination
表4为4种特征组合(见2.3.3章节)分类的混淆矩阵,并以此计算出分类的总体精度、Kappa系数以及冬小麦和大蒜的制图精度、用户精度,得到图10分类精度对比图。
表4 特征组合分类混淆矩阵Table 4 Confusion matrix of feature combination classification
图10 特征组合分类精度对比图Fig.10 Comparison chart of classification accuracy of feature combination
对冬小麦识别结果,A+C 特征比A 特征具有更高的识别精度,制图精度提升了4.47%,用户精度提升了3.37%。从混淆矩阵看,精度提升主要是冬小麦与其他类别之间错入错出的减少,这说明纹理特征能显著增强冬小麦与其他地物类型之间的差异。在所有组合中,A+B+C 特征集能够取得最高的作物分类制图精度和用户精度,这说明角差特征是冬小麦识别的一个重要判别因素,角差特征与纹理特征的结合更加有利于改进冬小麦识别精度。分析发现冬小麦的制图精度略低,是由于研究区种植的冬小麦大部分刚播种,部分冬小麦光谱特征与裸地的光谱特征较为相近。
对大蒜识别结果,A+B 特征比A+C 特征取得了更高的识别精度,制图、用户精度分别提升了4.58%、7.36%,是由于大蒜的双向反射差异与其余地物显著不同(图7),角差特征对于大蒜这种覆有地膜情形能够有效地进行表达。在A+B 特征集基础上增加纹理特征会导致大蒜的用户精度降低2.25%,冗余的纹理特征加入不利于大蒜的识别。
为进一步分析不同组合分类精度的显著性,针对A、A+B、A+C、A+B+C 特征集构建的SVM 分类器,以验证样本的SVM 分类结果为统计对象,分别两两之间进行McNemar检验。
对不同特征组合的分类器分类结果进行对比得到检验结果(表5),其中f12代表精度评价样本中分类器1 错误分类而分类器2 正确分类的像元数量,f21 则相反。各组合特征的McNemar 检验结果X2值均大于10.83(p<0.001),均通过显著性检验,说明不同特征组合的分类结果彼此间具有显著性差异,新特征的加入对作物分类精度的提升是稳定且可信的。
表5 不同特征组合分类McNemar检验结果Table 5 McNemar test results for the classification of feature combination
Waldner 等(2015)指出了正确分类的像素倾向于显示相对较低的不确定性值,表达出空间误差的分布情况。在研究区东北和西南地区随机选取1 个子区(子区位置见图1),分析不同特征组合分类结果及其不确定性,见图11。
图11 分类结果及不确定性分析图Fig.11 Classification results and uncertainty sample level analysis
在Ⅰ、Ⅱ子区内,特征集A、A+B 分类结果存在把冬小麦地块内的部分区域错分为其他类别的情况,这些区域不确定性值基本大于0.5,而A+C和A+B+C 特征组合改善这种错分情况,降低了这些区域的不确定性。
在冬小麦地块区域,基于特征集A+C识别的不确定性略低于特征集A+B,发现特征集A+C能够取得更好的分类结果。特征集A+B+C的分类不确定性值绝大部分小于0.5,其对冬小麦地块的划分更加完整,角差特征与纹理特征结合可以有效提高冬小麦的识别精度,这也与定量化评价相吻合。
对大蒜的分类结果分析,特征集A+B 和A+B+C 在大蒜区域的不确定性值基本小于0.6,相对于特征集A 和A+C 具有更低的分类不确定性,大蒜识别结果也更加准确;A+B 和A+B+C 特征组合在大蒜地块的少部分区域产生错分现象,将大蒜错分为其他地物,是由于这部分大蒜种植较晚导致其光谱信息与裸地相似,这些错分区域不确定性值大于0.6。
在子区Ⅰ、Ⅱ,特征集A 分类结果显示林地地块区域分类结果表现出较高的不确定性,同时林地过多的被分为冬小麦,在特征集A+C、A+B+C分类结果中,林地的不确定性显著降低,林地区域仅有极少部分划分为了冬小麦。说明纹理特征所提取出的地物水平结构的差异是区分林地与冬小麦的关键,而角差特征刻画出的地物垂直结构差异可作为纹理特征的补充,为作物准确识别提供可靠的信息。
本文通过组合GF-7 卫星影像的光谱特征、纹理特征和角差特征对冬小麦、大蒜识别的影响,证明了GF-7 多角度特征对于农作物识别的作用。主要结论如下:
(1)GF-7 卫星影像的角差特征能显著增加地物之间的可区分度。较仅用光谱特征,光谱与角差特征组合使用大蒜和冬小麦的制图精度分别提高了4.07%和3.15%,用户精度分别提高了6.73%和2.12%;较光谱+纹理特征组合,光谱+纹理+角差特征组合使用大蒜和冬小麦的制图精度分别提高了3.14%和1.01%,用户精度分别提高了5.11%和0.67%,证明了融入角差特征在一定程度上能提高作物的识别精度。
(2)通过McNemar 检验不同特征组合的分类结果,证实各特征组合的分类结果差异具有统计学意义,角差特征和纹理特征的加入对农作物识别结果的影响在95%置信度内是可靠的,为利用多角度遥感影像选择不同特征组合进行作物识别提供了依据。
(3)基于分类器熵值的不确定性结果能直观反映出冬小麦和大蒜识别结果的空间误差分布情况,光谱特征+纹理特征+角差特征组合的分类结果整体不确定性值最低,分类结果可靠。
本文研究结果为推进利用GF-7 卫星多角度特征提高作物识别能力打下了基础。今后研究将围绕以下方面开展工作:当农作物生长中期阶段,探讨GF-7 多角度影像提取作物高度对作物识别的影响;纹理特征为大蒜的分类带来了混淆,究其原因以及解决办法仍需要深入地探讨;进一步从多时相、不同作物生长农业环境的角度出发,分析多角度影像在整个物候期表现出的空间结构特征变化,这将进一步丰富应用多角度特征进行作物识别的理论基础。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!