当前位置:首页 期刊杂志

森林蓄积量和生物量多元混合模型研建

时间:2024-07-28

曾伟生

(国家林业和草原局调查规划设计院,北京 100714)

森林蓄积量是生态文明建设目标考核评价的约束性指标,也是森林资源调查的重要指标。森林生物量是森林碳储量计算和碳汇能力评估的基础指标及森林生态功能评价的重要参数。全国和各省的森林蓄积量和生物量数据来自于森林资源连续清查(一类调查)[1],而省级以下市、县级森林资源数据来自于森林资源规划设计调查(二类调查)[2]。一类调查和二类调查“两张皮”“两套数”的问题由来已久[3-4],统筹开展国家和地方森林资源调查,确保森林资源一套数、森林分布一张图,成为亟待解决的重要问题[5-6]。近10年来,全国森林资源一张图建设已经取得实质性成效[7],但两套数的问题依然还没有得到解决。

2020年,国家林业和草原局研究制定了《国家森林资源年度监测评价方案》,提出要将国家森林资源连续清查与全国森林资源管理“一张图”有机结合,采用抽样调查与图斑调查相结合的方法,开展森林资源年度监测评价;并用全省森林蓄积量和生物量数据作为总控,通过模型技术将省级数据分解落实到市、县级,逐步实现与地方森林资源调查监测体系的衔接。因此,利用现代模型技术,建立森林蓄积量和生物量估测模型,是实现将总量数据分解落实到市、县及每一个图斑的重要基础工作。本文利用北京市10种主要森林类型的1 400个森林资源连续清查样地数据,基于混合模型方法[8-9],建立森林蓄积量和生物量与优势树种、龄组、平均胸径、株数、郁闭度等因子之间的多元回归模型,以期为建立北京市森林资源一体化调查监测评价体系提供计量依据,也为规范森林储量多元估测模型建模方法提供参考。

1 数据与方法

1.1 数据资料

本研究所用数据为北京市2016年森林资源连续清查样地数据,涉及油松(Pinustabuliformis)林、侧柏(Platycladusorientalis)林、栎树(Quercusspp.)林、桦木(Betulaspp.)林、榆树(Ulmusspp.)林、刺槐(Robiniapseudoacacia)林、杨树(Populusspp.)林、其他硬阔林、其他软阔林和乔木经济林等10种主要森林类型,共计1 400个样地。样地为667m2的方形样地,基于每株样木胸径,由一元材积表和生物量表计算蓄积量和生物量,从而得到样地的每公顷蓄积量和生物量,以此来作为建模的目标变量。表1为10种主要森林类型参与建模样地的每公顷蓄积量的特征值。

表1 建模样地每公顷蓄积量的特征值Tab.1 Statistics of stand volume for modeling plots

1.2 建模方法

利用表1中10种森林类型1400个样地的每公顷蓄积量和生物量与其他林分因子数据,先建立基于定量因子的多元回归模型,再在分析定性因子差异显著性的基础上,建立定量因子与定性因子相结合的多元混合模型。

1.2.1基于定量因子的多元回归模型

林分水平的单位面积蓄积量和生物量主要与断面积和平均高有关[10-14]。除了这2项最直接相关的因子外,林分单位面积蓄积量和生物量还与优势树种、起源、龄组、平均胸径、每公顷株数、郁闭度等林分因子有关[15]。森林资源管理一张图数据库尽管缺少林分断面积和平均高信息,但除了优势树种、起源、龄组等基本信息外,还能提供平均胸径、每公顷株数、郁闭度等林分因子信息。因此,这里首先建立不考虑定性因子、只考虑3个林分定量因子(平均胸径、每公顷株数、郁闭度)的多元估测模型,其基本表达式如下:

Y=a0Da1Na2Pa3+εM

(1)

式中:Y为单位面积蓄积量M(m3/hm2)或生物量B(t/hm2),D为林分平均胸径(cm),N为每公顷株数,P为郁闭度;ai为模型参数,其相应的t值一般应大于2或p值小于0.05,否则视为无统计学意义,应从模型中剔除;εM为误差项,假定其服从均值为0的正态分布。采用非线性回归估计方法求解模型参数。因蓄积量和生物量数据具有异方差性,应采用对数回归或加权回归估计方法[16]。

1.2.2定量因子与定性因子相结合的多元混合模型

模型(1)未考虑林分起源、优势树种、龄组等基本信息,相当于总体平均模型。为了进一步提高模型估测的精度,一般还应按不同优势树种、起源甚至龄组来分别建模。从建模的基本要求考虑,每一个建模单元必须满足一定的样本数量;如果数量不足,则应该与其他近似的单元合并建模。因为森林资源连续清查的样地数按优势树种、起源、龄组的分布非常不均衡,很难满足分别类型独立建模的要求。为此,本研究以满足森林蓄积量和生物量总体精度要求为目标,将优势树种、起源、龄组等定性或分类因子都作为模型的解释变量,建立定量因子与定性因子相结合的多元回归模型。从建模方法考虑,定性因子既可以作为哑变量对待,采用哑变量建模方法[8,17];也可以作为随机变量对待,采用混合模型方法[8-9,17]。根据本人经验,混合模型方法便于判定分类因子(或定性因子)的统计显著性,而哑变量模型方法只能判定各分类因子每一类的参数显著性;当分类因子的类型数量较多时(如10个以上),哑变量模型的参数求解很难收敛,而混合模型则不存在这一问题。因此,本研究采用混合模型方法来建立蓄积量和生物量多元回归模型。由于北京市不同森林类型基本都是单一起源,其中油松林、侧柏林、刺槐林、杨树林和乔木经济林以人工起源占绝对优势,栎树林、桦树林、榆树林、其他硬阔林和其他软阔林以天然起源占绝对优势,故分类因子不考虑起源,只考虑优势树种和龄组。多元混合估测模型如下:

Y=(a0+∑b0ix1i+∑c0jx2j)×Da1Na2Pa3+εM

(2)

式中:x1i表示优势树种i;b0i为优势树种i的随机参数,∑b0i=0,其中i=1,2,…,10;x2j表示龄组j;c0j为龄组j的随机参数,∑c0j=0,其中j=1,2,…,5;其他符号的含义同(1)式。采用非线性混合模型估计方法求解模型参数[18]。同样,为消除异方差的影响,应采用求解(1)式时的权函数对(2)式进行转换后再估计模型参数。

1.2.3模型评价

采用确定系数(R2)、估计值的标准差(SEE)、总体相对误差(TRE)、平均系统误差(ASE)、平均预估误差(MPE)和平均百分标准误差(MPSE)[19]等6项指标对模型进行评价。其中,MPE和MPSE的计算公式如下:

(3)

(4)

2 结果与分析

利用10种森林类型全部1 400个样地的蓄积量和生物量及相关林分因子数据,分别拟合模型(1)和(2),其拟合结果和评价指标如表2所示。拟合蓄积量模型时采用的权函数w=1/(D2N0.9P0.1),拟合生物量模型时采用的权函数w=1/(D1.8N0.9P0.1)。

从表2的结果看,在总体平均模型(1)的基础上,通过引入代表不同森林类型和龄组的随机变量,混合模型(2)的拟合效果得到了改进。蓄积量模型的确定系数R2从0.789提高到0.829,估计值的标准差SEE从19.30降低至17.40,平均预估误差MPE从2.54%降至2.29%,平均百分标准误差MPSE从25.31%降至22.31%;生物量模型的R2从0.813提高到0.821,SEE从22.08降低至21.66,MPE从2.26%降至2.22%,MPSE从24.31%降至21.90%。

表2 模型(1)和(2)的参数估计值和评价指标Tab.2 Parameter estimates and evaluation indices of models(1)and(2)

随机参数2统计检验为显著(**),置信度0.014,5个参数值分别对应于幼、中、近、成、过5个龄组。

上述评价指标是针对全省森林蓄积量和生物量而言的,在实际应用中还应考虑不同森林类型的预估精度。表3列出了不同模型对10种森林类型蓄积量和生物量的评价指标。

从表3可知,对10种森林类型的蓄积量估计而言,混合模型(2)比总体平均模型(1)都有不同程度的改进,其中相差最大的是侧柏林和栎树林,相差最小的是油松林和刺槐林;对生物量估计而言,模型(2)比模型(1)大多数森林类型都有不同程度的改进,但桦木林的2个模型几乎无差异,而其他硬阔林和乔木经济林反而是模型(1)略好。基于混合模型(2)对10种森林类型的蓄积量进行估计,确定系数R2在0.6以上,最高的达到了0.879;平均预估误差MPE都在15%以内,相当于针对总体的预估精度达到了85%以上;平均百分标准误差MPSE都在30%以内,相当于针对林分的预估精度达到了70%以上。对于生物量的估计,除了其他硬阔林的确定系数R2有点偏低外,其他误差指标与蓄积量模型类似,2项核心误差指标MPE和MPSE甚至要略好于蓄积量模型。

3 结论与讨论

1)本文所建北京市森林蓄积量和生物量多元混合模型,确定系数R2都在0.8以上,平均预估误差MPE均在3%以下,平均百分标准误差MPSE均在25%以下;对10种森林类型的蓄积量和生物量估计,MPE均在15%以下,MPSE均在30%以下。

2)基于混合模型方法建立森林蓄积量和生物量与林分定量因子、定性因子之间的多元回归模型,在实践中是完全可行的。各省可利用第九次清查的乔木林样地数据,参照本文的技术方法,建立森林蓄积量和生物量多元混合模型,为实现将总量数据分解落实到市、县及每一个图斑提供重要依据。

但是,在我国森林资源连续清查体系中,蓄积量的估算一直都是基于一元立木材积表,第九次清查的生物量计算也是基于一元立木生物量表。关于一元材积表的使用,除了对总体蓄积量估计可能产生偏差以外,还存在对样地材积估计误差过大的问题[20-21]。因此,将蓄积量和生物量估计方法逐渐从一元表向二元表过渡,是林业实现高质量发展的必然要求。在条件允许的前提下,构建森林蓄积量和生物量模型的基础数据,应该尽可能采用二元表计算的数据。解释变量的选择,应该首选林分断面积和平均高[13];只有条件不具备时,才退而求其次,选择本文用到的平均胸径、每公顷株数、郁闭度等因子。另外,本文的蓄积量和生物量多元混合模型是分别单独建立的,而采用联立方程组构建蓄积量、生物量和碳储量模型系统已经逐渐成为发展趋势[13-14]。目前,采用联立方程组方法建模,每一个方程中的参数只能是固定参数,不能含随时参数。将混合模型纳入联立方程组后如何求解模型参数,这是今后在数学方法上需要攻克的一道难关。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!