当前位置:首页 期刊杂志

SWAT模型参数自动校准方法对比及适用性研究——以泾河中上游地区为例

时间:2024-05-24

张 丽,柳 烨,蔡朵朵,樊 琨,马孝义(西北农林科技大学水利与建筑工程学院,陕西 杨凌 712100)

分布式水文模型在气候变化和人类活动影响下流域水循环变化方面具有广泛应用,缘于其可以很好地模拟和反映不同水文要素及下垫面因素的时空分布不均匀性。SWAT (Soil and Water Assessment Tool)模型是由美国农业部(USDA)农业研究中心(ARS)开发的具有很强物理机制的分布式水文模型,它可以模拟径流、蒸发等水文过程,在国内外应用十分广泛[1];然而,国外的分布式水文模型,是根据当地数据条件,或是在当地水文试验基础上建立的。因此,将上述模型直接应用于国内流域将导致不理想的模拟效果[2],且模型参数较多,同时需要考虑其空间变异性,因而参数校准成为模型构建的关键因素。

模型参数校准工作主要有手动校准和自动校准两种方法,前者要求研究人员对模型原理和结构具有一定的了解,因此模型受人为干扰因素大,不利于模型的推广;自动校准则以自动优化算法为基础,且随着近代计算机优化算法的发展逐渐得以广泛应用。对于自动优化算法,主要有Parasol算法、SUFI-2算法、GLUE算法、PSO算法以及MCMC算法等。王建平等[3]将MCMC算法应用到水质模型的参数不确定性分析中,表明MCMC算法对参数后验分布的搜索在搜索性能和效率的分布上均表现出独特的优越性,并指出此算法适用于复杂环境模型的参数识别和不确定性分析。熊立华等[4]利用MCMC方法和GLUE方法进行对比分析SMAR模型的不确定性及参数的后验分布,结果表明, MCMC方法能更好地推求模型参数的后验分布。但由于该算法的搜索容易陷入局部最优解,因而较少应用在分布式水文模型的参数优化中。Parasol[5]算法的核心是SCE-UA算法[6],由于其可高效处理多目标问题,因而广泛应用于流域的参数校准中[7]。刘睿翀[8]借助SUFI-2算法分析了SWAT模型径流模拟的不确定性,表明模型可以较好的模拟陕西黑河流域的径流过程;陈德胜等[9]将GLUE算法应用到沣河流域产流产沙过程的不确定性分析,虽然模拟效果较好,但是模拟置信区间不能完全覆盖实测径流过程;薛晨[10]将SUFI-2算法与GLUE算法进行对比,结果表明两种方法有各自的特点与适应性,SUFI-2算法更适应与复杂、运算要求高的流域。陈强等[11]将PSO算法应用到SWAT模型参数校准当中,结果表明粒子群算法校准精度较高,收敛速度比SWAT2005自带的SCE-UA算法更快,自动校准效率提高了约7倍,比较适用于大型流域或长时间系列的模拟。

由此可见,目前已有大量研究将这些算法单独应用到水文模型的参数优化中,然而将不同优化算法进行对比来寻求适应流域的优参数校准方法以及不同优化算法参数校准在流域的适用性的研究则鲜有报道。基于此,本文选择了黄土高原泾河中上游流域作为研究区域,将SWAT模型作为实验模型,以SWAT-CUP程序中SUFI-2、GLUE、Parasol以及PSO等4种算法作为优化算法,分别对模型参数进行优化,进一步将模拟效果、计算效率和寻优时间进行对比,而后对各算法的优缺点进行评价,从而寻求适合本流域的参数自动优化算法,并基于此分析各算法的适用性。该研究可为黄土高原地区模型的参数自动校准工作提供参考。

1 参数自动优化算法

1.1 SUFI-2算法

SUFI-2算法是由Abbaspour等[12]于2007年开发的一种综合优化和梯度搜索方法,是目前水文模型不确定性分析的常用方法之一。该算法开始先假设一个较大的参数范围,参数校准后,使得大部分实测数据落在95%的置信区间内(95PPU),模拟结果通过拉丁超立方随机采样(LH-OAT)方法中输出变量累计分布的2.5%和97.5%得到。参数不确定性程度通过P-factor衡量(95PPU),理论范围为0~100%;95PPU带的平均厚度除以监测数据标准差得到另一个不确定新分析因子R-factor,其值的范围为0~∞。SUFI-2算法的核心即用最小的不确定性范围涵盖大部分的实测数据。理论上P-factor接近1与R-factor接近0时认为校准效果最好,然而P-factor通常随着R-factor的增大而增大,因此需要找到两个值平衡点对校准效果进行评价。本研究选取目前应用最广泛的纳什系数(NS)作为目标函数[式(1)],且NS越接近1,表明模拟值越接近观测值,模拟效果越好。

(1)

1.2 GLUE算法

Beven和Binley[13]于1992年提出了以贝叶斯理论为基础的广义似然不确定性估计算法(GLUE,Generalized Likelihood Uncertainty Estimation),目的是为了防止模型参数校准时发生“异参同效”现象。该方法假定在大量参数构成的模型当中存在不唯一的一组参数可以优化,利用Monte-Carlo随机采样方法获得多组参数,分别计算各组模拟结果与观测值之间的似然函数及权重,在所有似然值中设定一个临界值,并认为低于临界值表示该组参数不能很好地体现模型特征,而高于时则表明该组参数足以体现模型特征;然后将所有低于临界值的参数组的似然值取为零,所有高于临界值的参数组似然值做归一化处理,并根据似然值的大小求出某置信度下的模型预报不确定性范围。其数学表达式如式(2):

(2)

式中:L(Y|θi)为后验似然值;L(θi|Y)为观测变量;L0(θ0)为先验似然值;C为归一化加权因子。

1.3 ParaSol算法

ParaSol算法以全局优化算法(SCE-UA)[4]为核心,并在SCE-UA算法的基础上改进得到的一种新的优化算法。该方法将目标函数结合进全局优化准则,利用复形重组,使目标函数或全局优化准则最小。SCE算法将单纯形算法的直接搜索方法、Nelder和Mead[14]的可控随机搜索概念、全局改良方向系统演化、竞争演化[15]和复形重组的概念结合到一起。该算法首先选取p个优化参数,根据参数范围随机抽样选择初始“种群”,将这些点分成几个复合型种群,每个复合型包括2p+1个点;然后每个复合型种群根据单纯形法独立进化,种群之间定期交叉形成新的种群以便共享信息;最后根据目标函数检查是否满足收敛要求,如果不满足重新划分种群进行计算。Parasol算法中的目标函数即为残差平方和[式(3)],其与纳什系数(NS)的关系式如式(4)所示。

(4)

1.4 PSO算法

粒子群优化算法(PSO)是美国学者Kennedy等[16]于1995年提出的一种随机全局优化算法。该方法将系统初始化为一组随机的粒子,每个粒子根据自身的搜索路径和当前群体所获得的最佳位置来调整自己下一步的搜索方向,通过迭代搜索最优值。SWAT模型中将需要校准的参数作为PSO算法中的粒子的位置坐标,每个粒子均包含一组参数,每次迭代将参数带入模型运算并根据目标函数评价其适应性,PSO算法通常选择纳什效率系数NS作为目标函数。每次迭代粒子更新的速度和位置的迭代公式如式(5)、式(6):

vk(t+1)=ωvk(t)+c1rand(Pk-Xk)+c2rand(Pg-Xk)

(5)

Xk(t+1)=Xk(t)+Vk(t+1)

(6)

式中:c1,c2为学习因子,一般取c1=c2=2;ω为惯性权重;rand是介于0~1之间的随机数;Xk为粒子的位置;vk(t)为粒子的速度;Pk为个体极值;Pg为全局极值;t为粒子运行时间步长。

2 研究区应用

2.1 研究区概况

泾河中上游流域位于东经106°10′~107°30′,北纬35°5′~35°46′之间(图1),由发源地六盘山流经崆峒峡水库、甘肃平凉最终到达泾川县,包括汭河、潘杨涧河、大路河、小路河、颉河共五条泾河一级支流,总流域面积为4 216.93 km2。区域内泾河干流长度约120 km。流域年平均气温介于5~15 ℃,≥10 ℃的积温介于2 200~4 000 ℃,年日照时数逾2 000 h,属于温带半干旱半湿润气候。该流域冬春季干旱少雨,夏秋季雨水充沛,且降水强度大,一年内降雨分配极端,汛期降水量占年降水总量的70%左右,容易造成严重的水土流失甚至是发生洪涝灾害,因此,为了合理开发利用西北地区水资源,以及对该地区进行水土保持与防洪工作,需要在该区进行水资源系统研究与分析。研究区主要位于甘肃省平凉市,该市主要发展畜牧业,农林产业是甘肃省重要的供给地区之一,且该市具有煤炭、石油、石灰岩等丰富的矿产资源,因此,研究流域的水资源状况对西北地区的经济发展也有一定的指导意义。

图1 泾河中上游流域及子流域分布图Fig.1 Divisions of basin and sub-basin in the middle and upper reaches of Jinghe River watershed

2.2 模型建立

研究区所用空间数据来源于中科院计算机网络信息中心的数字高程模型(DEM,30 m×30 m)、寒区旱区科学数据中心的1:10万的土地利用数据以及1:100万的土壤数据。气象数据取自该流域附近的长武、平凉、西峰镇等3个气象站1965-2001年的统计资料;日降雨数据取自黄河流域水文年鉴中三关口、党原、袁家庵等25个雨量站1980-1990年的统计资料;日径流数据取自该流域出口泾川水文站1980-1990年的统计资料。DEM、土地利用和土壤等空间数据经过GIS预处理后(图2),结合气象数据、降雨数据,进行SWAT建模模拟流域的月径流过程。研究区流域内包括崆峒峡水库和西峡水库,但由于资料有限,并没有获得相关水库蓄水排水资料,为此笔者将崆峒峡水库及其上游流域部分简化为一入水口,虽然没有对该部分流域进行模拟,但崆峒峡水库(坝下)水文测站对上游段来水有日观测记录,所以对模型总体模拟的影响很小。模型共划分31个子流域,744个水文单元,泾川水文站位于第19个子流域。模型参数优化方法采用SWAT-CUP程序中SUFI-2算法、GLUE算法、Parasol算法以及PSO算法等4种最常用的算法进行参数校准。

图2 泾河中上游流域空间数据图Fig.2 Spatial data figures in the middle and upper reaches of Jinghe River watershed

2.3 参数敏感性分析

SWAT模型参数众多,为了减小工作量,同时提高模型的运行效率,通过敏感性分析,去除那些对模拟结果影响较小的参数。通过SWAT-CUP程序中的LH-OAT方法对流域内与径流相关的参数进行onE-aT-time敏感性分析,筛选出敏感性强的参数,然而模型参数在模拟过程中的敏感性是相互影响的,单独进行参数敏感性分析并不能真正地体现出参数的敏感性,因此还需结合全局敏感性分析选出最敏感的参数。基于此,本文结合全局敏感性分析和onE-aT-time敏感性分析最终选取10个最为敏感的参数作为要校准的参数,具体参数如表1所示。

3 结果与分析

本研究将流域出口处的泾川水文站1980-1990年数据分为两部分,其中1980年为缓冲年,1981-1986年为模型校准期,1987-1990年为模型验证期。将纳什系数(NS)与决定系数(R2)作为模型评价指标。

3.1 SUFI-2算法模拟结果

应用SUFI-2算法对泾川中上游流域进行径流模拟,模拟代数为500,每代模拟时间约为1 min。其模拟结果如图3所示,由此可知整个时期内模型的模拟效果较好,月径流模拟值与实测径流趋势比较吻合,校准期和验证期NS分别为0.81和0.67,R2分别为0.86和0.70。说明SWAT模型在泾河中上游流域的径流模拟具有较好的适应性。在平水期和枯水期阶段模型的模拟效果较好,但是丰水期的模拟值会比观测值低,模拟效果较差。图4为模型校准期与验证期的模拟值与观测值的相关性分析,校准期模型的相关性比验证期高,这可能与校准期的年径流量普遍大于验证期有关[17]。

表1 研究区参数敏感性排名Tab.1 Rank of parameters sensitivity in the research watershed

图3 SUFI-2及GULE算法的泾河中上游流域校准期、验证期模拟值与观测值对比分析Fig.3 Comparison simulated value with observed value in the watershed with SUFI-2 and GULE algorithms

图4 SUFI-2算法模拟值与观测值相关性分析Fig.4 Correlation analysis of simulated value and observed value with SUFI-2 algorithm

3.2 GLUE算法模拟结果

GLUE优化算法的随机采样数设定为5 000,似然函数的阈值为0.5,并设定高于阈值的所有参数组为有效参数组,经过计算得到模拟流量值,并设定置信水平为95%的模型计算不确定性区间。GLUE算法在泾河中上游流域参数优化结果如图4所示,由此可知,校准期和验证期的模拟结果与SUFI-2算法相似,校准期和验证期NS分别为0.84和0.85,R2分别为0.76和0.78,说明此算法能较好的模拟流域的径流情况,且验证期模型模拟精度比SUFI-2算法高,原因是此算法包含的参数不确定性范围相对较大,包含了大部分参数的相关性[10]。但由于算法采用随机取样,要取得相对精确的结果需要较多次数的取样,因此GLUE算法的缺点就是模拟代数约为SUFI-2算法的10倍,从而导致模拟历时大幅增加。就模型相关性而言(图5),校准期两算法的模拟效果相差很小,但是验证期GLUE算法模拟值与实测值的相关性比SUFI-2算法高,说明GLUE算法更适合本流域的参数优化工作。

图5 GLUE算法模拟值与观测值相关性分析Fig.5 Correlation analysis of simulated value and observed value with GLUE algorithm

3.3 Parasol算法模拟结果

Parasol算法在流域的模拟结果见图6,模型在校准期和验证期NS分别为0.80和0.60,R2分别为0.84和0.67,可见校准期模拟效果较验证期好。模型共模拟500代,每代重复3次,每次模拟时间为1 min,模拟一次大概需要25 h,并且在整个模拟时段平水期和枯水期的模拟值偏低,且对于流域内出现干旱缺水年份(如1982年),模型不能较好的体现径流的变化情况。对于单峰径流,模型的模拟值比较接近观测值,但如果流域内出现双峰径流,模型模拟效果较差。因此,对于流域内出现春汛或者干旱的情况,此算法不适合流域参数优化。

图6 Parasol及PSO算法的泾河中上游流域校准期、验证期模拟值与观测值对比分析Fig.6 Comparison simulated value with observed value in the watershed with Parasol and PSO algorithms

3.4 PSO算法模拟结果

PSO算法每次模拟耗时约20 h,其模拟结果如图7所示,NS在校准期和验证期分别为0.77和0.64,R2为0.90和0.74,整个时段模拟结果比Parasol算法好,但是较GLUE和SUFI-2算法差。模型在整个模拟时段丰水期的模拟值相对Parasol算法更接近观测值,而平水期和枯水期二者的模拟效果相似。对于干旱缺水年份,模型同样未体现径流的变化情况,但对于双峰径流的出现,PSO算法的模拟效果较Parasol算法好,表明PSO算法不适合模拟干旱缺水地区流域的径流变化情况,而对于有春汛出现的地区,其模拟效果较好。

4 结 语

本文以泾河中上游流域为例,采用SWAT模型对该流域的月经流量进行模拟,通过SWAT建模,并采用SUFI-2、GULE、Parasol及PSO等4种优化算法对模型参数进行校准,可知模型在校准期和验证期的NS和R2都在0.6以上,说明SWAT模型可以用于该流域的月径流模拟。通过对4种优化算法模拟精度对比,GLUE算法和SUFI-2算法适用于该流域的水文模型参数优化;但两种算法各有优缺点,即GLUE算法对于春汛及干旱缺水年份模拟效果好,适合比较复杂流域的参数优化,但模拟耗时长;SUFI-2算法模拟历时短,但对于丰水期尤其有双峰径流出现的情况,其模拟效果较差,因此适合复杂情况略低的流域。Parasol和PSO算法模拟耗时长,精度低,不适合本流域水文模型的参数校准,但PSO算法对于双峰径流模拟效果较好,较适用于有春汛出现的地区。

[1] Arnold J G, Srinivasan R, Muttiah R S, et al. Large area hydrologic modeling and assessment, part I - model development [J]. J.am.water Resour.assoc, 1998,34(1):73-79.

[2] Neitsch S L, Arnold J G, Kiniry J R. Soil and Water Assessment Tool Theoretical Documentation Version 2005[M]. Taxas: Texas Water Resources Institute, 2005.

[3] 王建平,程声通,贾海峰. 基于MCMC法的水质模型参数不确定性研究[J]. 环境科学,2006,(1):24-30.

[4] 熊立华,卫晓婧,万 民. 水文模型两种不确定性研究方法的比较[J]. 武汉大学学报(工学版), 2009,(2):137-142.

[5] Van Griensven A, Meixner T. Methods to quantify and identify the sources of uncertainty for river basin water quality models [J]. Water Sci Technol, 2006,53(1):51-59.

[6] Duan Q Y, Soroosh S, Gupta V K. Optimal use of the SCE-UA global optimization method for calibrating watershed models [J]. J. Hydrol., 1994,158:265-284.

[7] Van Griensven A, Meixner T. A global and efficient multI-objective auto-calibration and uncertainty estimation method for water quality catchment models [J]. J. Hydroinform, 2007,9(4):277-291.

[8] 刘睿翀,霍艾迪,Chen X H, 等. 基于SUFI-2算法的SWAT模型在陕西黑河流域径流模拟中的应用[J]. 干旱地区农业研究,2014,(5):213-217,222.

[9] 陈德胜,丁爱中,潘成忠,等. 基于SWAT模型的沣河流域径流模拟不确定性分析[EB/OL]. 中国科技论文在线. (2011-03-14).http:∥www.paper.edu.cn/index.php/default/releasepaper/content/201103-581.

[10] 薛 晨. 基于SWAT模型的产流产沙模拟与模型参数不确定性分析[D]. 北京:华北电力大学(北京),2011.

[11] 陈 强,苟 思,秦大庸,等. 一种高效的SWAT模型参数自动校准方法[J]. 水利学报,2010,(1):113-119.

[12] Abbaspour K C, Yang J, Maximov I, et al. Modelling hydrology and water quality in the prealpine thur watershed using SWAT [J]. Journal of Hydrology, 2007,333,(2-4):413-430.

[13] Beven K, Binley A. The future of distributed models: model calibration and uncertainty prediction [J]. Hydrological Process, 1992,6(3):279-298.

[14] Nelder J A, Mead R. A simplex algorithm for function minimization [J]. Computer Journal, 1965:308-313.

[15] Holland J H. Adaptation in natural and artificial systems[M]. MIT Press, 1992.

[16] Kennedy J. Particle swam optimization [J]. Proceedings of IEEE International Conference on Neural Networks, 1995,(4):129-132.

[17] 王 学,张祖陆,宁吉才. 基于SWAT模型的白马河流域土地利用变化的径流响应[J]. 生态学杂志, 2013,32(1):186-194.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!