当前位置:首页 期刊杂志

基于非参数统计方法分析安徽城乡居民收入与消费差异

时间:2024-06-19

杨 慧

(淮北师范大学数学科学学院概率统计系,安徽 淮北 235000)

0 引言

凯恩斯消费理论中说收入是影响消费的主要因素,收入越低,边际消费倾向越高,收入越高,边际消费倾向越低。[1]而消费又是拉动经济增长的“三驾马车”之一,城乡收入存在差距,消费水平也会存在差距,[2]所以,分析城乡居民收入与消费水平对分析经济增长有一定的促进作用。

在参数统计中,往往假定总体的分布形式或分布族已知,但实际上数据并不是来自假定分布的总体,对总体分布的假定也不能随便作出,由此作出的推断可能是错误的。非参数统计在不知道总体信息且不假定总体服从什么分布的情况下,从数据本身获得所需要的信息,得到可靠的结论,此时,非参数方法优于参数方法。[3]本文拟采用非参数统计方法来分析安徽省城乡居民收入与消费水平差异,以提高农村居民收入来刺激消费,促进经济增长。

本文选取安徽省2001年—2015年的城镇居民人均可支配收入、城镇居民人均消费性支出、农村居民人均纯收入、农村居民人均生活消费支出数据来进行分析,数据来源于2000年—2016年安徽统计年鉴。通过R软件使用非参数统计中的方法来具体分析城乡居民收入水平及消费水平存在的差异、收入与消费水平的变化趋势以及两者之间的相关性,以缩小城乡收入消费差距,促进经济增长。

表1 安徽城乡居民人均收入与消费支出数据

1 实证分析

1.1 城乡居民收入与消费的Wilcoxon秩和检验

在非参数统计中,比较两个总体是否存在差异,往往通过比较两个总体的位置参数来进行分析。位置参数选择具有稳健性的中位数。Wilcoxon秩和检验的基本思路如下:如果两总体不存在差异,选取的两样本数据的中位数相同,将这两个样本数据混合排序,两样本数据将均匀分布在中位数的左右两边,由此每个样本数据在混合排列中的秩和将会相差不多。反之,若两样本数据的中位数不相同,将两组数据混合排序后,两个样本在混合排列中对应的秩和将会相差较大。因此,两样本在混合数据排序中分别对应的秩和就是Wilcoxon秩和统计量。[4]

对安徽省2001年—2015年的城乡居民收入进行中位数差异分析,比较城镇居民与农村居民平均收入是否存在差异。首先,作出两样本的箱线图,通过图检验比较两样本中位数是否存在差异。如图1所示,图中1、2、3分别表示城镇居民收入、农村居民收入及将两者数据混合后的箱线图,从中可以看出两样本的中位数不相同,城镇居民收入的中位数高于农村居民收入的中位数。然后就此对该问题做出如下假设检验问题:

H0:MX=MY,城乡居民收入不存在显著差异,

H1:MX>MY,城镇居民收入高于农村居民收入。

图1 城乡居民收入的箱线图

表2是城镇居民收入(X)数据和它们在混合样本中的秩,求其秩和WX为324。而表3为农村居民收入(Y)数据和它们在混合样本中的秩,求其秩和WY为141。从中可以看出两样本的秩和存在明显差异,我们可以怀疑城镇居民收入与农村居民收入不存在显著差异这个原假设。在R软件中我们进行Wilcoxon秩和检验,用语句wilcox.test(x,y,a=”g”)得到检验统计量的p值为0.000 02,因此,在0.01的显著性水平下,我们有理由拒绝原假设,认为城镇居民收入显著高于农村居民收入。

使用同样的方法对城镇居民消费与农村居民消费水平进行中位数的Wilcoxon秩和检验,对城镇居民消费数据在混合数据中所对应的秩求和为323,农村居民消费数据在混合数据所对应的秩求和为142,可以看出两样本数据秩和存在显著性差异,有理由怀疑城镇居民消费与农村居民消费不存在显著差异这个原假设,选择城镇居民消费高于农村居民消费支出这个备择假设。然后在R软件中我们进行Wilcoxon秩和检验,用语句wilcox.test(x,y,a=”g”)得到检验统计量的p值为0.000 028,因此在0.01的显著性水平下,我们有理由拒绝原假设,认为城镇居民消费显著高于农村居民消费支出。

表2 城镇居民收入数据及在混合样本中的秩

表3 农村居民收入数据及在混合样本中的秩

1.2 城乡居民收入与消费的趋势检验

在非参数统计中,运用Cox-Stuart趋势存在性检验来检验一组数据的变化趋势,该种检验方法不像参数统计中的方法需要某些假定条件,是一种不依赖于趋势结构的快速判断趋势是否存在的方法。

Cox-Stuart趋势存在性检验的理论基础是符号检验。从前后两个不同时期各选出一个数生成数对,计算每一数对前后两值之差,通过这些数对差值正负号的个数可以反映前后数据的变化。若排在后面的数比排在前面的数大的数对个数较多,则存在上升趋势;若排在后面的数比排在前面的数大的数对个数较少,则存在下降趋势;若排在后面的数比排在前面的数大的数对个数与排在后面的数比排在前面的数小的数对个数相差不多,则不存在趋势。为保证数对同分布且不受局部干扰,Cox-Stuart提出最好的拆分点是数列中位于中间位置的数,在无趋势的原假设下,检验统计量服从参数为数对个数和发生概率为0.5的二项分布。[4]

该假设检验问题如下:

H0:数据序列无趋势,

H1:数据序列有增长趋势。

由表4中数据可知,城乡居民人均收入与消费的前后不同时期的差值都为负,都存在上升趋势。同样,通过计算,知道上述4个检验的统计量都是K=min(S+,S-)=S-=0,其中S+表示正的Di的数目,S-表示负的Di的数目。在R软件中输入语句pbinom(0,7,0.5),得到检验的p值为0.007 8,在0.01的显著性水平下,拒绝原假设,认为数列存在上升趋势。这也符合经济理论和经济发展规律。

表4 安徽城乡居民人均收入与消费的Cox-Stuart检验

1.3 城乡居民收入与消费的相关性分析

在参数推断中,常通过相关系数来度量两个变量之间的相关性,但这种相关性仅度量两个变量之间是否存在线性相关关系,不能说明其他非线性相关关系。在非参数统计中,对不服从正态分布、总体分布未知等情况下来描述变量之间的相关性,常选用Spearman秩相关性检验。

Spearman秩相关性检验的假设检验问题为:

H0:X与Y不相关,

H1:X与Y是(或正或负)相关的。

图2 城镇居民人均收入与消费的散点图

下面采用Spearman秩相关检验具体分析城镇居民人均收入与消费的关系,在R软件中,输入城镇居民人均收入(X)与消费(Z)的数据,首先,通过语句plot(x,z)画出两变量的散点图,如图2所示,可以看出两者之间存在正相关关系。然后,在R软件中通过输入语句cor(x,z,meth="spearman")来计算Spearman秩相关系数,得到Spearman秩相关系数为0.996 4,再进行单边备择假设为正相关的Spearman秩相关性检验,通过输入语句cor.test(x,z,meth="spearman",alt="g")得到检验的p值=0。因此,在0.01显著性水平下,拒绝原假设,认为城镇居民人均收入与消费之间存在正相关关系,也就是说,随着城镇居民人均收入水平的提高,居民人均消费水平也会提高。

采用同样方法对农村居民人均收入与消费的关系进行分析,得出Spearman秩相关系数为1,说明两者之间存在正相关关系。再进行单边备择假设为正相关的Spearman秩相关性检验,得到检验的p值=0,因此,在0.01显著性水平下,拒绝原假设,认为农村居民人均收入与消费之间存在正相关关系,也就是说,随着农村居民人均收入水平的提高,居民人均消费水平也会提高。

2 结语

通过运用非参数统计方法对安徽省2001年—2015年的城乡居民人均收入与消费水平差异分析,得出如下结论:1)城镇居民人均收入与农村居民人均收入存在较大的差距,又因收入是影响消费的重要因素,这一点从实际数据也得到证实,城乡消费水平也存在一定的差距。2)城乡居民收入和消费水平均随着我国经济水平的上升而呈现上升的趋势。3)凯恩斯消费理论中提出收入影响消费,安徽城镇居民和农村居民的收入与消费均呈现正相关关系,即随着收入水平的提高,消费水平也会随之提高。

消费是拉动经济的三驾马车之一,为进一步提高安徽省的经济发展水平,消费是不可忽视的因素之一,刺激居民消费,提高居民消费水平,很大程度上依赖于居民收入水平的高低,这也跟国家的稳定就业提高居民收入相一致,因此提高居民收入是首要前提。另外,要做好公共服务工作,最大程度上解决居民上学难看病难等教育医疗问题,让居民能够改变传统观念上的存钱上学看病,增加消费的比重。

[1] 臧旭恒.收入分配对中国城镇居民消费需求影响的实证分析[J].经济理论与经济管理,2005(6):5-10.

[2] 牛似虎.收入差距对于我国城乡居民消费影响的实证分析[J].中央财经大学学报,2012(3):11-16.

[3] 刘瀑.河南城乡居民收入与消费差异的非参数检验[J].统计预测与决策,2017(16):115-117.

[4] 吴喜之,赵博娟.非参数统计[M].北京:中国统计出版社,2013:21-56.

[5] 戴钰.城乡居民收入差距对消费需求影响的实证分析[J].统计预测与决策,2014(4):105-109.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!