时间:2024-05-23
刘慧 刘德安
摘要:利用四川省宜宾市的1953—2010年的春季降水量数据资料,分别应用正态分布、Gamma分布、对数正态分布和P-Ⅲ型分布对该地区的降水分布特征进行研究。在此基础上,利用离差平方和最小准则进行4种分布函数的拟合优度检验。结果表明,4种分布函数均能拟合宜宾市春季降水分布;通过拟合优度检验表明,对数正态分布对宜宾市春季降水量的拟合效果最好,Gamma分布次之,P-Ⅲ型分布和正态分布的拟合效果相对较差。
关键词:降水量拟合;拟合检验;对比分析
中图分类号:P468 文献标识码:A
文章编号:0439-8114(2019)07-0047-05
Abstract: By utilizing spring precipitation data of Yibin city in Sichuan province from 1953 to 2010, normal distribution, Gamma distribution, logarithmic normal distribution, P-Ⅲ distribution were applied to study the region's precipitation distribution characteristics. Based on this, the minimum of sum square variation method was used for goodness of fit test of the four distribution functions. The result shows that the four distribution functions can all fit with precipitation distribution of spring in Yibin city. The goodness of fit tests show that logarithmic normal distribution is best fit with the precipitation distribution of spring in Yibin city, Gamma distribution is the second best. The fitting effect of P-III distribution and normal distribution is relatively poor.
Key words: precipitation totals fitness; fitness test; comparative analysis
降水是地面观测中最基本的气象要素之一,也是决定某地气候特征的关键因子。降水不仅直接影响土壤水分平衡,也间接影响太阳辐射、气温、湿度等天气变量,同时降雨量也是农业生产和农业生态系统的重要影响因子。而某地春季的降水量更是对农作物的春耕有着不可小视的作用,关乎到作物的初生长。
研究降水量及其分布规律不仅有重要的气候学意义,而且对农业生产、水资源管理与应用以及防灾、减灾有重要的现实意义。因此,对春季降水量概率分布的研究是很有必要的,这就需要一个能够较好拟合本地春季降水量的概率分布函数,以此对本地的春季降水有所把握和合理利用。同时,在气候统计诊断和预报中,经常在正态假定的前提下进行研究工作,但如果气候变量不符合正态假定的前提,则将会给预报带来一定的误差。从这个方面来讲,对各种气象要素所服从的各种非正态分布的研究有着重要意义。
关于降水量概率分布的研究,目前国内外已经取得了很多研究成果。在国内,科学工作者对各气象要素所服从分布情况开展了大量的研究工作。在正态分布模型的研究中,胡文东等[1]指出宁夏大多数气象站的年降水量服从正态分布,而季度降水量及逐月降水量服从正态分布的气象站相对较少;周雁翎等[2]在对粤西降水量分布的研究中指出,除了各站夏季降水量均服从正态分布外,粤西各站月、春、秋、冬和年降水量大都不服从正态分布。对于多雨地区,情况则不同,吴慧[3]在对海南省降水量正态分布特征的研究中指出,在0.01的信度检验下,海南省各站春、夏、秋季降水量基本符合正态分布,冬季仅北部和东部地区符合正态分布,月降水量的正态性也随季节而变化且具有局地性。由于大多的天气气候极值往往出现于非正态时间序列中,仅用正态分布去模拟降水序列可能产生较大误差。从这个意义上也反映出,认识各种气象要素多服从的各种非正态分布很有意义。
各国科学工作者都致力于非正态性分布的研究。如Entekhabi等[4]提出了用Gamma分布描述土壤水分和径流。自2002年以来,有学者先后利用 Gamma分布,WEIBULL分布和负指数分布拟合了降水量、降水日数、径流和蒸发等各种地表参量的地理空间分布函数,取得了较好的效果[5-7]。段莉珠等[8]根据潞西气象站实测降水量资料,验证了该站降水量为P-Ⅲ型分布;吴樟荣[9]得出P-Ⅲ型分布能很好地拟合广东省登陆台风的年最大风速资料;周建康等[10]通过对南京站降水量的统计分析,验证了南京站降水量雨型为P-Ⅲ型分布。丁裕国[11]曾用Γ分布模式研究过北京市等5个站的月降水量的统计特征;在国外,Mooley[12]曾用Γ概率分布模式对亚洲夏季月降水量进行模拟。李伟光等[13]对海南省海口市不同时间尺度降水量进行了分布拟合,指出Gamma分布函數对海口市不同时间尺度降水量均有较好拟合效果;石强等[14]用Gamma分布拟合青岛市各月和年降水量,并建立了适用于青岛市降水量拟合的二参数Gamma分布。由此看出,非正态分布所涉猎的研究范围十分广泛,因此非正态分布的研究对做好气候的统计诊断和预报具有十分重要的意义。
根据前人的研究成果,丁裕国等[15]指出,正态分布常用于拟合各地月平均气温、年平均气温、部分地区的日(时)平均气温、多雨地区的年降水量;各种偏态分布常用于拟合地区逐日(时)平均或最高(低)气温、日(月)降水量、无雨期长度、相对湿度、能见度、短历时降水强度、径流、土壤水分等。由此可以看出,正态分布和各种非正态分布都能够对一定的气象现象进行拟合,且均具有十分重要的意义。本研究分别利用正态分布以及P-Ⅲ型分布、Gamma分布、对数正态分布3种偏态分布对四川省宜宾市春季(3—5月)的降水量资料进行了拟合,并做出了对比分析,旨在寻求对四川省宜宾市春季降水量拟合更好的分布函数,以期进一步提高本地气候统计诊断和预报的准确度。
1 资料与方法
1.1 资料来源与研究区概况
数据资料取自四川省宜宾市的春季降水量资料,为1953—2010年的春季(3—5月)累积降水量数据。宜宾市位于四川省南部,处于川、滇、黔三省结合部的金沙江、岷江、长江汇流地带。地跨北纬27°50′—29°16′、东经103°36′—105°20′。宜宾市属中亚热带湿润季风气候,低丘、河谷兼有南亚热带的气候属性;具有气候温和、热量丰足、雨量充沛、光照适宜、无霜期长、冬暖春早、四季分明的特点;年平均气温18 ℃左右;年平均降水量1 050~1 618 mm,5—10月为雨季,降水量占全年的81.7%,主汛期为7—9月,降雨量更集中,占全年总降雨量的51%;年平均日照时间为1 000~1 130 h,无霜期为334~360 d;年平均风速仅为1.23 m/s,多为西北风和东北风,静风频率较大,高达34%~53%,风速小。
1.2 研究方法
1.2.1 降水概率分布模型及其参数估计 首先假设降水量概率分布分别服从正态分布、Gamma分布、对数正态分布和P-Ⅲ型分布。在进行降水量的概率分布拟合时,对正态分布的参数估计方法采用矩法估计(根据样本矩直接估计两个参数),对于非正态分布的Gamma分布、对数正态分布和P-Ⅲ型分布选用极大似然估计的方法确定函数的参数。极大似然估计方法是参数估计中最重要、也是应用最广泛的方法之一,也就是选取使得似然函数达到最大的数值作为参数的估计值。
1)正态分布及其参数估计。正态分布作为最常见且应用最广泛的随机变量的分布,在随机变量的分布中居于中心地位。其在概率论与数理统计中无论在理论研究还是实际应用上都占有极其重要的地位,并且数理统计中许多重要问题的解决都是以正态分布为基础的。在气候统计诊断和预测中,大多数诊断方法和预测模型都是建立在假设气候变量是正态分布的前提下进行的。因此,对于气候变量是否为正态分布的检验不仅很有必要而且很重要。以往对气象诸要素的统计特性研究表明,月平均气温、多雨地区的年降水量一般近似服从正态分布。本研究亦采用正态分布进行宜宾市春季降水量的分布拟合,其概率密度函数为:
1.2.2 拟合假设检验方法 在降水量概率分布拟合之后,还要进行拟合优度的检验。本研究采用K-S检验法来完成。K-S检验全称是Kolmogorov-Smirnov检验,亦称拟合优度检验法。它是用来检验给定的一组样本数据的分布是否符合某一特定分布的方法,是检验小样本拟合效果的常用方法。它的检验方法是以样本数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布族。
以Gamma函数为例,K-S检验进行拟合效果的检验方法为设x1,x2,x3,…,xn为来自一个总体具有分布函数Γ(x)的随机样本,且设该样本是按从小到大的顺序排列的有序样本,于是可以应用有序样本求得Γ(x)的置信界限值,有序样本的分布函数[15]:
1.2.3 对比分析方法 对以上4种降水量概率分布函数的拟合效果进行对比分析,比较哪种函数对宜宾市的春季降水量有更好的拟合效果。拟合优度评价是选择概率分布函数的重要指标,比较常用的拟合优度评价方法有直观的图形分析法、Genest-Rivest方法、AIC信息准则、离差平方和最小准则(OLS)。本研究采用离差平方和最小准则法来对函数进行定量的拟合优度检验,以确定最优的分布函数。OLS的计算公式为:
2 应用
以四川省宜宾市为例,采用宜宾市的春季降水量数据资料,进行春季降水量的拟合、拟合检验和对比分析,以期得到最优的拟合宜宾市春季降水量的分布函数。
2.1 各概率分布函数参数、概率值的确定
根据前面的讨论,首先假设降雨量是服从正态分布、Gamma分布、对数正态分布和P-Ⅲ型分布的。其中,正态分布的参数可以按照公式(2)计算,Gamma分布、对数正态分布和P-Ⅲ型分布的参数采用极大似然估计法求得,可分别按照公式(4)、(6)、(8)进行估计。各概率分布函数参数的计算结果如表1所示。
将表1中相应的参数分别代入公式(1)、(3)、(5)、(7),即可求得各自的概率密度。从所得的计算结果可以直观地看到各降水量区间出现的可能性,为减灾防灾工程提供相应的科学依据。当降水量值大于100 mm时,通过各分布函数计算的概率值得到其出现的最大概率仅为5%左右,说明宜宾市春季降水量超过100 mm的概率不是很大;而其春季降水量低于30 mm出现的概率也较低,从各分布计算的概率值来看,最高也只是5%左右。
2.2 拟合检验
根据宜宾市春季降水量数据,利用K-S检验方法计算的结果如表2所示。查表可知,在n=58, α=0.05时的K-S检验的检验统计量值Dnα为 0.175 19。由表2可见,对于4种概率分布函数,均存在Dnα>Dn,说明文中拟合的降水量理论分布与实际频率分布差异较小,可以通过假设,即宜宾市春季降水量服从正态分布、Gamma分布、对数正态分布和P-Ⅲ型分布。为检验各自概率分布函数的拟合效果,分别画出正态分布、Gamma分布、对数正态分布和P-Ⅲ分布对宜宾市春季降水量的拟合曲线,如图1、图2、图3和图4所示。从图1可以看出,正态分布在40~60 mm降水量区段的拟合效果较好,而在其他降水量区段的拟合效果相对较差;从图2、图3可以看出,Gamma分布和对数正态分布在30~90 mm降水量区段的拟合效果較好,在90 mm降水量以上区段的拟合效果相对较差;从图4可以看出,P-Ⅲ型分布在40~90 mm降水量区段的拟合效果较好,而在90~120 mm降水量区段的拟合效果较差。总体而言,对数正态分布和Gamma分布的整体拟合效果较好,P-Ⅲ型分布和正态分布的拟合效果相对较差,此为最优拟合分布的判断提供了一定的参考价值。
2.3 对比分析
为了准确判定最优的拟合分布函数,通过离差平方和最小准则法进行宜宾市春季降水量拟合最佳的分布函数分析。当OLS值最小,则其对应的分布就为拟合效果最佳的分布。由表3可知,对数正态分布的OLS值最小,说明对数正态分布对春季降水量的拟合效果最好,与实际宜宾市的春季降雨情况最接近。
为更加直观地体现这一点,作出各个降水量概率分布函数拟合效果的对比分析图。从图5可以看出,正态分布概率理论曲线和经验分布曲线拟合的效果最差;对数正态分布、P-Ⅲ型分布及Gamma分布的频率理论曲线和经验分布曲线都拟合的较好,和OLS结果值相吻合。因此可知,对数正态分布模拟的降雨和实际的基本一致,可以用来模拟实际的降雨情况,这个分布函数模型是合理的。
3 结论
本研究根据四川省宜宾市的春季降水量资料,利用矩法估计、极大似然估计的参数估计方法,分别采用正态分布以及Gamma分布、对数正态分布和P-Ⅲ型分布对春季降水量分布进行拟合。并且利用K-S检验法对各分布函数进行检验,同时利用离差平方和最小准则(OLS)对正态分布和3种非正态分布(对数正态分布、Gamma分布和P-Ⅲ型分布)的拟合效果做了对比分析,由计算结果可以得到以下主要结论。
1)正态分布、Gamma分布、对数正态分布和P-Ⅲ型分布均可以对宜宾市的春季降水量分布进行拟合。
2)计算结果显示,对数正态分布的OLS值最小,即对数正态分布对宜宾市春季降水量的拟合效果最好;Gamma分布次之,P-Ⅲ型分布再次,正态分布最差。
3)通过本次研究,可以为宜宾市的气候统计诊断和预报工作提供一定的参考,为本地春季农耕提供理论上的支撑,具有理论意义和业务实用价值。
参考文献:
[1] 胡文东,陈晓光,李艳春,等.宁夏月、季、年降水量正态性分析[J].中国沙漠,2006,26(6):963-968.
[2] 周雁翎,张琼雄,张 练,等.粤西降水量的分布特征及正态分布检验[J].广东气象,2007,29(3):32-34.
[3] 吴 慧.海南省降水量的正态分布特征及正态化变换[J].广东气象,2005(2):12-13.
[4] ENTEKHABI,D,EAGLESON P S. Land surface hydrology parameterization for AGCM including subgrid scale spatial variability[J].J Climate,1989,2:816-830.
[5] 刘晶淼,丁裕国,周秀骥,等.基于降水气候强迫的一种地表径流估计方法[J].气象学报,2004,62(3):285-293.
[6] 王纪军,刘晶淼,丁裕国.用于非均匀地表通量估计的一种积分算子[J].高原气象,2004,23(5):605-611.
[7] 刘晶淼,丁裕国,李 云,等.一种度量区域旱涝灾害严重性的指标[J].自然灾害学报,2004,13(5):16-19.
[8] 段莉珠,番朝成.德宏潞西气象站降水量统计分析[J].云南水力发电,2009,25(1):8-10.
[9] 吴樟荣.基于P-Ⅲ型分布函数的台风风险水平分析[J].浙江师范大学学报,2002,25(2):166-168.
[10] 周建康,唐运忆,徐志侠.南京站降水量的统计分析[J].水文,2003,23(6):35-38.
[11] 丁裕国.降水量概率分布的一种间接模式[J].南京气象学院学报,1987,4(10):407-415.
[12] MOOLEY D A. Gamma probability model for asian summer monsoon monthly rainfall[J].Monthly weather review,1973,101:160-170.
[13] 李伟光,朱乃海,陈汇林,等.海口不同时间尺度降水量统计拟合[J].安徽农学通报,2007,13(12):189-190,227.
[14] 石 强,林滋新.青岛地區降水的Gamma分布模式[J].山东气象,1987(2):15-19.
[15] 丁裕国,申红艳,江志红,等.气候概率分布理论及其应用新进展[J].气象科技,2009,37(3):257-262.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!