当前位置:首页 期刊杂志

基于多源无人机影像特征融合的冬小麦LAI估算

时间:2024-05-24

张东彦,韩宣宣,林芬芳,杜世州,4,张 淦,洪 琪

(1.安徽大学农业生态大数据分析与应用技术国家地方联合工程研究中心,合肥 230601;2.南京信息工程大学遥感与 测绘工程学院,南京 210044;3.河南大学黄河中下游数字地理技术教育部重点实验室,开封475004; 4.安徽省农业科学院作物研究所,合肥 230001)

0 引 言

叶面积指数(Leaf Area Index, LAI)是反映农作物长势的关键参数,与作物产量密切相关,因此快速、准确监测作物LAI对于粮食生产意义重大。传统的LAI测量主要是人工实地观测,费时费力,还会造成作物损伤。目前,无人机遥感常用于作物生理生化参数反演,是作物LAI监测的有效方法。相比于卫星遥感,无人机遥感具有体积小、操作灵活等特点,在当前农业研究中被广泛应用。

无人机搭载的传感器通常有数码相机、多光谱相机和高光谱相机等。国内外研究者多利用可见光、多/高光谱及其计算的植被指数估测作物LAI。文献[11-12]利用可见光植被指数分别构建玉米和甘蔗LAI估测模型,模型精度良好。然而,部分学者发现仅用可见光或多光谱植被指数估测LAI时会出现饱和现象,存在局限性。一些学者将可见光或多光谱植被指数与纹理特征结合估测作物LAI、地上生物量、氮含量和叶绿素,效果好于单独使用可见光或多光谱植被指数,主要是纹理特征含有作物空间信息,可对作物群体光谱信息进行补充,延长了植被指数模型估测LAI饱和点的位置。进一步地,使用高光谱影像数据构建模型估测LAI的研究中,文献[20-21]使用高光谱植被指数构建冬小麦和玉米LAI估测模型,估测效果良好;基于高光谱全波段及优选波段构建小麦LAI估测模型,支持向量回归模型决定系数达到0.80。然而,上述高光谱数据在应用中面临着仅使用光谱波段或植被指数反演作物LAI时精度难以提升的问题。

近年来无人机多源遥感在作物参数研究中逐渐兴起,已有研究表明基于多源影像特征融合监测作物理化参数比单一影像特征更有优势。文献[27-28]基于相关性分析筛选可见光、多/高光谱影像特征构建多源作物LAI估测模型,效果优于单传感器影像特征模型,文献[29]基于随机森林算法计算影像特征重要性筛选影像特征监测玉米LAI,结果表明可见光影像特征融合多光谱影像特征构建的随机森林回归模型效果最佳,决定系数达到0.81。由此得出,多源影像特征融合结合了不同传感器优势,构建的LAI估测模型效果更好。但是,上述LAI估测研究中,要么只关注影像特征与LAI相关性,要么仅强调影像特征的重要性,未同时考虑影像特征与LAI相关性及影像特征重要性,继而选出最优影像特征构建多源遥感的LAI估测模型。此外,有学者指出,试验小区进行20%~80%面积采样时,构建的大豆产量反演模型效果最好。因此,有必要探讨多源无人机影像特征融合和不同影像采样面积下的小麦LAI估算方法。

综上,本研究以安徽省舒城县和庐江县为研究区,以无人机可见光影像及高光谱影像数据为基础,以多元线性回归、支持向量回归和随机森林回归算法为研究方法,进行小麦LAI估测研究,重点解决:1)影像特征融合与单源影像特征构建小麦LAI估测模型对比分析;2)以单源影像特征为例,探讨不同影像采样面积对冬小麦LAI估测模型的影响。以期研究结果为无人农场的田间管理提供参考,也为其他作物的LAI反演提供借鉴。

1 材料与方法

1.1 试验设计

研究区(图1)位于安徽省合肥市庐江县白湖农场(北纬31°13′25.7″,东经117°27′48.8″)和六安市舒城县农业科 学 研 究 所 试 验 基 地(北 纬 31°32′27.06″,东 经116°59′38.16″)。两地均设30个试验小区,每个小区12 m。供试小麦品种为江淮地区常规种植的“扬麦13号”“宁麦13号”“扬麦9号”“宁麦9号”“扬麦15号”“扬麦19号”“扬麦22号”“皖西麦0638”“生选6号”和“扬麦24号”,共10个品种。栽种采用随机区组设计,每个品种随机3次重复。所有小区采用相同种植密度(3×10株/hm)及施肥处理(纯氮180 kg/hm,KO为120 kg/hm,PO为120 kg/hm),氮肥基追比为7:3,于返青期追施。

图1 研究区 Fig.1 Research area

1.2 数据获取

于2019年4月24日(扬花期)和2019年5月1日(灌浆期)选择中午阳光最强,微风少云的时间段采集无人机影像。采集平台为大疆精灵4 Pro(自带高清数码相机,该相机像素为2 000万,飞行时视场角为84°,含有红、绿、蓝3个波段)和大疆经纬M600 Pro(搭载Cubert UHD185机载高光谱成像仪,该光谱仪像素为100万,光谱范围为450~950 nm,含有125个波段,采样间隔为4 nm,飞行时视场角为30°),飞行任务由DJI GS Pro软件规划,设置图像航向重叠度为70%,旁向重叠度为80%,飞行高度为40 m,获取的可见光影像和高光谱影像地面分辨率分别为2.00和2.58 cm。获取的无人机数据需要进行预处理。可见光影像的预处理步骤包括影像拼接、几何校正、影像裁剪和感兴趣区选取;高光谱影像需要在影像拼接前进行辐射校正,其余步骤与可见光影像处理流程相同。

本研究中LAI-2200C被用于采集冬小麦的LAI值,观测时间为北京时间10:00左右。在每个小区4个角和中心处选取5处长势均匀的采样点,使用LAI-2200C测量并记录LAI值。每个采样点测量3次后取均值作为该样点的LAI,5个采样点LAI的平均值记为该田块的LAI。测量LAI时将仪器置于采样点两垄小麦冠层上方,先测量一个天空光值,接着将仪器置于采样点距地面5 cm处,陆续测量两垄小麦对角线冠层下方4个光值,分别在垄上、离垄1/4处、两垄中间和离垄3/4处测取,测量冠层下方光值时仪器高度要一致,测量结束时仪器将自动计算采样点的LAI值。

1.3 遥感特征选取

植被指数能够有效反映植被的生长情况,被广泛应用于作物生理生化参数监测,如叶绿素含量、LAI等。本研究以各试验小区选定的感兴趣内所有像元的均值作为与地面实测LAI对应的影像数据。可见光影像有红()、绿()、蓝()3个通道,分别提取通道的平均像元值,归一化后定义为、、,通过三者之间组合可以计算可见光植被指数。前人研究发现UHD185高光谱仪在450及854~950 nm处测量的光谱信息不稳定,因此本研究选用458~850 nm范围,通过波段组合计算高光谱植被指数。根据前人研究成果选取与LAI相关性较好的可见光植被指数和高光谱植被指数分别为18个和17个(表1和表2)。

表1 可见光植被指数 Table 1 Visible vegetation indices

表2 高光谱植被指数 Table 2 Hyperspectral vegetation indices

可见光纹理特征利用灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)计算获得。选取的纹理特征有8个,分别为均值(Mean,mea)、方差(Variance, var)、协同性(Homogeneity,hom)、对比度(Contrast, Con)、相异性(Dissimilarity,dis)、熵(Entropy,ent)、二阶矩(Second Moment,sec)和相关性(Correlation,cor)。利用ENVI软件分别提取可见光影像每个通道的纹理特征,提取时选取最小的3×3窗口,角度为默认值。

1.4 特征筛选原则

本研究首先使用随机森林算法计算每个特征权重,随机森林中每棵决策树均通过基尼指数对影像特征计算其不纯度,综合所有的不纯度,在每一特征维度上取不纯度的均值并标准化,即可得到每个影像特征的权重,表明该特征对构建模型的贡献。然后,使用皮尔逊相关性分析计算每个特征与LAI的相关系数。综合考虑影像特征权重以及影像特征与LAI相关性选择特征。其中,以影像特征权重大于等于0.05为高权重,在此基础上再选出与LAI极显著相关的影像特征(不考虑相关系数大小)用于冬小麦LAI估测研究。

1.5 模型构建与精度验证

研究方法包括多元线性回归(Multiple Linear Regression,MLR)、支持向量机回归(Support Vector Machine Regression,SVR)和随机森林回归(Random Forest Regression,RFR)算法。

MLR基本原理与一元线性回归大致相同,但自变量个数至少两个,利用偏最小二乘法求解线性方程系数,简单易用,广泛应用于农林监测。

支持向量机(Support Vector Machine, SVM)是由Cortes和Vapnik提出的一种机器学习分类方法,SVR是在SVM算法的基础上引入敏感度损失函数将分类任务转为回归任务,在作物参数反演研究中表现较好,适用于小样本学习,常用的核函数有线性和高斯径向基核函数,本研究使用网格搜索确定核函数和gamma参数。

随机森林是Breiman提出的一种基于多决策树及Bagging技术的集成学习算法,模型中的决策树并行建立,各决策树的训练子集不同,进而每棵决策树也不相同,能有效减小模型方差降低预测误差,使得RFR模型拟合能力较强,在作物参数研究中应用较多,模型中重要参数如树的数量、深度等通过网格搜索进行参数寻优确定。

在两个研究区分别采集冬小麦扬花期及灌浆期各60个样本,按照3:1随机划分,45个样本作为训练集用于模型训练,15个样本作为验证集用于模型精度验证。模型检验选用决定系数(Coefficient of determination,)、均方根误差(Root Mean Square Error,RMSE)和相对预测偏差(Relative Prediction Deviation,RPD)。

1.6 影像采样面积划分

田间生产中,常因施肥不均导致土壤肥力在水平空间及垂直空间产生空间异质性,从而导致作物长势出现差异性。因此,同一块田内不同位置作物冠层的影像光谱也会相应地产生差异。此外,田块边际效应导致边缘的作物长势不如中心区的长势。鉴于空间异质性和边际效应,本研究拟探讨不同影像采样面积对LAI估算精度的影响。以一个田间试验小区为例,100%为全影像采样面积,缩小矩形长和宽按照一定的间隔在25%~90%范围内改变影像采样面积,以此类推,分析多个影像采样面积对冬小麦LAI估测的影响。

2 结果与分析

2.1 遥感特征与LAI的相关性分析及其重要性

将可见光影像特征与对应生育期冬小麦LAI进行皮尔逊相关性分析以及使用随机森林算法计算影像特征重要性。根据权重大于等于0.05且相关性达到极显著水平的特征筛选原则,在扬花期和灌浆期优选高权重且与LAI极显著相关的可见光植被指数各5个和9个(见表3)、纹理特征各4个和6个(见表4)。两个生育期选出的可见光影像特征明显不同,灌浆期的最优特征数量多于扬花期。除了与扬花期相同的绿蓝植被指数GBRI和归一化蓝绿差异指数NGBDI两个特征外,在灌浆期选出的可见光植被指数还有过绿指数ExG、修正过绿指数MEXG、过绿过红差分指数ExGR等,这些指数与绿光波段关系密切。

表3 高权重且与LAI极显著相关的可见光植被指数 Table 3 Visible vegetation indices with high weight and extremely significant correlated with LAI

表4 高权重且与LAI极显著相关的可见光纹理特征 Table 4 Visible textures with high weight and extremely significant correlated with LAI

相对于数码相机,高光谱遥感具有高的光谱分辨率,能反映地物的细微特征,探测到地物的诊断性光谱吸收特征。采用同样特征筛选方法分析高光谱遥感影像特征与冬小麦LAI的关系。在扬花期和灌浆期优化后的高光谱植被指数和特征波段见表5和表6。两个生育期高权重且与LAI极显著相关的高光谱植被指数分别有8个和7个。灌浆期选出的高光谱植被指数与冬小麦LAI的相关性较高,相关系数基本在0.8以上。

表5 高权重且与LAI极显著相关的高光谱植被指数 Table 5 Hyperspectral vegetation indices with high weight and extremely significant correlated with LAI

表6 高权重且与LAI显著(极显著)相关的高光谱波段 Table 6 Hyperspectral bands with high weight and significant or extremely significant correlated with LAI

在扬花期和灌浆期,本研究筛选出高权重且与LAI显著和极显著相关的波段各有8个。从表6可见,扬花期选出的特征波段与灌浆期明显不同,扬花期选出的特征波段主要在790~850 nm之间,位于近红外区域,而灌浆期的特征波段分布在蓝光、绿光和红光范围,尤其是红光区域。这些结果与文献[38-39]研究一致。

2.2 单传感器下不同输入特征的LAI估测模型构建

在扬花期和灌浆期,依次使用优选的植被指数(本小节中均指可见光植被指数)、优选的的纹理特征、优选的前4个植被指数结合前4个纹理特征作为输入变量估测冬小麦LAI,探究植被指数和纹理特征单独使用以及结合使用时监测LAI的差异。各种估测模型在验证集的结果如表7所示。

表7 基于可见光影像特征构建的LAI估测模型结果 Table 7 LAI estimation model results based on visible image features

在扬花期和灌浆期,基于优选的植被指数构建的3种LAI估测模型精度均优于优选的纹理特征模型,其中RFR模型表现最佳;基于优选的4个植被指数结合4个纹理特征构建的SVR和RFR模型在扬花期和灌浆期估测LAI效果最好。其中,RFR模型在两个生育期均表现最佳,扬花期为0.620,RMSE为0.231,RPD为1.679,灌浆期为0.830,RMSE为0.183,RPD为2.514,优于单独使用植被指数或纹理特征的估测模型。

从表7可知,基于植被指数结合纹理特征构建的RFR模型在两个生育期最优。在此基础上,探究空间异质性对估测LAI影响,在25%~90%采样面积下分别提取扬花期和灌浆期优选的4个植被指数和4个纹理特征并作为RFR模型输入变量,与全采样下结果进行对比分析。25%~90%采样面积下RFR模型在验证集结果如表8所示。

表8 可见光影像不同采样面积比例下RFR模型结果 Table 8 RFR model results of visible image for different sampling area ratio

从表8可以看出,当采样面积从25%逐渐增加时,RFR模型精度呈先升后降趋势,原因是从长势最好的中心区域逐渐增加采样面积,包含的小麦有效信息也随之增加,因此模型性能提升。当影像采样面积增加到一定范围时,因长势空间异质性加上小区边缘长势不佳,提取的特征受环境影响较为严重,对建立模型有干扰作用,因此模型性能又变差。可见光影像采样面积分别为30%和50%时,RFR模型在扬花期及灌浆期估测LAI效果最佳,比全采样下构建的RFR模型分别提高了0.043和0.036,且RMSE下降。

依次使用优选的8个高光谱敏感波段、优选的高光谱植被指数和优选的4个波段结合4个植被指数构建扬花期和灌浆期LAI估测模型,探究高光谱植被指数和波段单独使用以及结合使用时监测LAI的性能差异,三种估测模型在验证集结果如表9所示。

表9 基于高光谱影像特征构建的LAI估测模型结果 Table 9 LAI estimation model results based on hyperspectral image features

在扬花期和灌浆期,基于优选的高光谱植被指数构建的三种LAI估测模型精度优于8个敏感波段的估测模型,其中,RFR模型表现较好;以优选的4个波段结合4个植被指数构建LAI估测模型时,RFR模型表现最佳,扬花期为0.663,RMSE为0.217,RPD为1.782,灌浆期为0.875,RMSE为0.157,RPD为2.925,体现了影像特征结合的优越性。

从扬花期和灌浆期LAI估测结果看,在所有的LAI估测模型中RFR精度最佳,机器学习方法在小麦LAI估算展现较好的性能,此外灌浆期三种模型精度整体优于扬花期,表明灌浆期更适合开展作物LAI遥感估测。针对影像采样面积对高光谱影像估测LAI的影响,在25%~90%采样面积下分别提取扬花期和灌浆期优选的4个敏感波段和4个高光谱植被指数并作为RFR模型输入变量,与全采样下结果进行对比分析。25%~90%采样面积下RFR模型在验证集结果如表10所示。从表中看出,高光谱影像采样面积为65%时,RFR模型在扬花期和灌浆期的估测效果最好,比全采样下的RFR模型分别提升了0.070和0.030,并且估测误差RMSE下降且RPD大于2,模型估测结果可靠。

表10 高光谱影像不同采样面积比例下RFR模型结果 Table 10 RFR model results of hyperspectral image for different sampling area ratio

2.3 多源影像特征融合的LAI模型构建

目前,使用多源影像特征融合监测农作物已取得许多成果,本节探究基于两种影像特征融合的LAI估测模型性能,使用的特征是4个可见光植被指数、4个纹理特征、4个敏感波段和4个高光谱植被指数,模型建立方法是随机森林回归,验证集结果如图2所示。

图2 LAI实测值与估测值关系图 Fig.2 Relationship between the measured value and estimated value of LAI

由图2可知,基于两种影像特征融合构建的RFR模型精度优于基于2.2节中单源遥感特征的RFR模型。其中,扬花期为0.733,RMSE为0.193,RPD为2.003;灌浆期为0.929,RMSE为0.118,RPD为3.880。结果表明,灌浆期RFR-LAI模型精度优于扬花期。原因可能是:无人机采集的影像包含小麦、阴影和土壤等,提取影像特征时包含多个对象的综合特征。当小麦处于灌浆期时,小麦群体长势较扬花期旺盛、植株间间距小,小区裸土面积较扬花期少,因而灌浆期提取的影像特征受环境影响较小;另一方面,随着冬小麦生长,灌浆期光谱反射率等与LAI敏感性更强,影像特征与小麦LAI相关性较扬花期要高,因此LAI估测模型在灌浆期效果更好。

进一步地,结果表明基于多源传感器影像特征融合构建小麦LAI估测模型效果更好。这是由于构建模型时输入特征既包含了可见光影像高空间分辨率的特点,又结合了高光谱多个光谱的有效信息。因此,多传感器影像特征融合为提高作物理化参数估测精度指明了方向。

3 结 论

本研究基于无人机可见光影像和高光谱影像数据,使用可见光植被指数和纹理特征、高光谱波段和植被指数构建冬小麦叶面积指数估测模型。试验结果表明:

1)多元线性回归、支持向量回归和随机森林回归模型在扬花期估测精度低于灌浆期。

2)基于优选两种影像特征融合构建的随机森林回归模型精度在扬花期和灌浆期最佳,优于单源影像特征模型。在扬花期决定系数为0.733,均方根误差为0.193,相对预测偏差为2.003,在灌浆期决定系数为0.929,均方根误差为0.118,相对预测偏差为3.880。

3)光谱空间异质性会影响LAI估测模型精度,可见光影像采样面积分别为30%和50%,高光谱影像采样面积为65%时,单源影像特征构建的随机森林回归模型精度在扬花期和灌浆期达到最佳,合适的影像采样面积可以提升小麦LAI的监测效果。

此外,由于本研究的试验小区只有一种水分梯度和施肥梯度,后续会增加水分梯度和施肥梯度,综合更多的栽培管理措施去研究小麦LAI无损监测,以期为其他作物的LAI研究提供参考。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!