当前位置:首页 期刊杂志

基于 ESDA的北京市乡镇农业经济空间特性分析

时间:2024-07-06

连 健 ,李小娟 ,宫辉力 ,孙永华

(首都师范大学资源环境与旅游学院,三维信息获取与应用教育部重点实验室,资源环境与地理信息系统北京市重点实验室,北京 100048)

区域差异一直是国内外学者广泛关注的热点之一[1]。传统的区域经济差异度量方法大都是通过统计模型对指标进行加权评判来进行[2-4],但研究证明,区域经济发展空间差异具有普遍性[5],空间的影响,尤其是空间自相关和空间异质性必须在研究不同尺度的区域差异问题时加以考虑[6]。因此近年来,越来越多的学者试图将空间思维融合到传统经济分析与决策的理论框架之内[7],从空间的思维和角度出发来研究各种尺度下的经济活动和经济现象[8-12]。

探索性空间数据分析(exploratory spatial data analysis,ESDA)是一系列空间数据分析方法和技术的集合,以空间关联测度为核心,通过对事物或现象空间分布格局的描述与可视化,发现空间集聚和空间异常,揭示研究对象之间的空间相互作用机制[13]。ESDA通过对空间自相关的分析来揭示空间依赖性和异质性,从而依据于对空间依赖性和空间异质性的研究,来帮助我们更加深入地理解区域经济问题[13]。以北京市农村区域为例,以北京市乡镇为空间研究尺度,通过 ESDA方法的相关性分析,来揭示并描述北京市农村区域中其农业经济在空间上的分布状况以及所呈现出的分布特征。

1 研究区域、数据来源与研究方法

1.1 研究区域与数据来源

北京位于北纬 39°56′,东经 116°20′;西北毗邻山西 、内蒙古高原,南与华北大平原相接,东近渤海;北京市包括 18个区县,其中,由于东城、西城、崇文、宣武以及石景山 5个区没有农业人口,也就没有了农业经济的概念,因此,研究区域为朝阳、海淀、丰台、门头沟、房山、通州、顺义、昌平、平谷、怀柔、大兴 11个区以及延庆、密云2个县共 13个区县涵盖的所有乡镇(去除部分不包括农业人口的街道数据)。数据资料取自 2005年的《北京农村统计资料》,数据包括乡镇所含的村数、乡镇常住人口、从业人员数、第一产业人数、第二产业人数、第三产业人数以及农业总产值等①北京市统计局、国家统计局北京调查总队,北京农村统计资料(2005 年暨“十五”时期)。。空间分析尺度为北京市上述 13个区县所辖的 186个乡镇,分析变量为乡镇年人均农业总产值(=乡镇农业总产值/乡镇第一产业人口,单位:万元/人)以及第一产业人数所占比重(=乡镇第一产业从业人员数/乡镇从业人口总数)。

1.2 研究方法

采用 ESDA,从空间相互作用角度,通过对空间自相关分析来揭示乡镇农业经济之间的空间依赖性和空间异质性[14],以此来探讨北京市农村区域经济差异的时空特征。ESDA以空间关联测度为核心,本质上是一种“数据驱动”的分析方法[8]。其中的空间自相关是检验某一要素的属性值是否显著地与其相邻空间点上的属性值相关联的重要指标[15]。通过计算空间自相关指数来进行全局统计和局域统计[16]。首先对各研究变量进行正态变换,满足空间自相关研究的前提条件,然后通过Anselin设计的 GeoDa软件获取空间权重矩阵,并采用Moran's I指数和 Local Moran's I(LISA)来衡量全局和局域空间自相关。

1.2.1 空间权重矩阵。空间分析领域引入了空间权重矩阵,是利用 ESDA技术进行空间探索分析的前提和基础。空间权重矩阵(spatial weightmatrix,记为 W)表达了不同空间对象之间的空间布局,相应地构成了统计检验或模型建立的出发点(Cliff and Ord,1981;Ansilin,1988;Cressie,1993)。空间权重矩阵的建立有多种规则,其中常用的有基于邻接规则和基于距离规则。其中,W的具体形式为

式中:n表示空间单元个数。如果第 i个(i∈ n,0<i≤n)空间单元和第 j个(j∈ n,0<j≤n)空间单元属于邻居关系,则Wij=1;否则,Wij=0。通常约定,一个空间单元与其自身不属于邻居关系,即 Wij=0。

由于所研究的对象是北京市农村区域,而这些研究区域是不包括北京市那些街道数据的,因此,存在“岛”或者“空洞”的现象,故在此我们不能采取判断是否邻接的办法来构造空间权重矩阵。为了解决这个问题,我们选择以基于距离规则来建立空间权重矩阵,以避免由于“岛”或“空洞”的存在而产生的误差。

1.2.2 全局空间自相关指数。当不同观察对象的同一属性变量在空间上表现出一定的规律性,而不是随机分布时,则认为它们之间存在空间自相关。其中,Moran's I统计量是一种应用非常广泛的全局空间自相关统计量,它的具体表达形式如下(Cliff and Ord,1981)

式中:N代表总共的面状区域数;wij代表空间权重值;xi代表区域 i的属性值;-x代表所有属性值的平均值。Moran's I取值范围介于 -1与 1之间,在给定显著性水平下,当 Moran's I显著为正时,表示观测值之间存在显著的正相关;当 Moran's I显著为负时,表示观测值之间存在显著的负相关。

1.2.3 局部空间自相关。①Moran散点图。Moran散点图(Moran scatter plots)的横轴表示一个变量在不同位置上的观测值向量(z),而纵轴表示该向量的空间滞后(Wz)。该图设一个位置上的观测值和其空间滞后之间的拟合程度,就是Wz对 z的二元回归系数,该系数在数值上等价于全局 Moran's I。Moran散点图可以用来探索不同研究对象之间的全局空间关联结构特征,更可以用来识别局部的空间关联模式,以及空间异常值或局部不平稳性等[17]。②局部空间自相关及空间关联指标(LISA)。局部空间自相关可以用来识别不同空间位置上可能存在的不同空间集聚模式,从而可以观察空间局部不平衡性,发现数据之间的空间异质性,为分类或区划提供决策依据。在空间位置 i上,其局部 Moran's I统计量用来计算区域 i和它临近的、和区域 i的值相关的区域的值。表达形式为

式中:sx为对应于 xi和 xj的标准差;Zi=(xi--x)/s2i为标准化变量。在一定显著性水平下,若Ii显著为正且zi大于 0,则表明位置 i和周围邻居的观测值都相对较高,属高高集聚;若 Ii显著为正且 zi小于 0,则表明位置 i和周围邻居的观测值都相对较低,属低低集聚;若Ii显著为负且zi大于0,则表明周围邻居的观测值远低于位置 i上的值,属高低集聚;若Ii显著为负且zi小于0,则表明周围邻居的观测值远高于位置 i上的值,属低高集聚[17]。

2 乡镇农业经济的探索性空间数据

2.1 全局空间自相关

由于全局空间自相关检验要求变量满足正态分布,因此,首先采用 log变换,使 2个变量的频率值呈正态分布,再利用公式(1)计算北京市 2005年乡镇人均农业总产值、第一产业人口占从业人口的比重的空间相关系数Moran's I、以及相对应的标准化统计量 Z值(表 1)。

表 1 基于正态分布的各变量的统计量Tab.1 Statistics based on norm al distribution

由表 1我们可以看出:①人均农业总产值变量,具有空间正的相关性。该变量的全局自相关系数 Moran's I为 0.3997,属于正相关的范围,且相关性显著,采用正态分布 99%置信区间双侧检验阈值 2.58为界限,其正态统计量 Z远大于该值。这说明人均农业总产值变量具有空间集聚特征,即高值区域与高值区域相邻接,低值区域与低值区域相邻接。②第一产业人口所占从业人员总人口的比重变量,亦具有空间正的相关性。该变量的相关系数 Moran's I值为 0.3958,正相关性显著,并通过正态统计量的 Z值检验,同样具有空间集聚特征。

2.2 局部空间自相关

2.2.1 Moran散点图。利用 GeoDA软件计算得到北京市 2005年乡镇人均农业总产值与第一产业人口所占从业人员总人口比重 2个变量的 Moran散点图(图 1)。从图 1可得知,图中的 4个象限表达了某一区域(某一乡镇)和其周围区域(周围乡镇)4种类型的局部空间关系:第 1象限为“高高”分布,说明该区域(乡镇)的人均农业总产值比较高(或第一产业人口所占比重高),而且其周边乡镇的值也比较高,差异较小;第 2象限为“低高”分布,表明该地区(乡镇)的人均农业总产值低,但是其周边乡镇的值高,差异较大;第 3象限为“低低”分布,表明该地区(乡镇)与其周边地区的人均农业总产值都比较低,差异较小;第 4象限为“高低”分布,表明该地区(乡镇)的人均农业总产值高,而周边乡镇的值低,差异比较大。为了更清楚地判断每个象限所包括的乡镇所在位置及其所在的区县,进一步分析得到如下表 2,从而能够更好地从空间角度上具体地看出乡镇人均农业总产值以及第一产业人口占从业总人口比重的差异的分布特征。

图1 2005年人均农业总产量和第一产业人口所占比重Moran散点图Fig.1 M oran scatter p lot of the agricu ltural total output va lue per capita and the p rimary industry population specific gravity in 2005

表 2 M oran散点图对应的 186个乡镇Tab.2 Townships according to Moran scatter p lot(186 totals)

2.2.2 局部空间自相关及空间关联指标(LISA)。LISA是用来衡量观测单元属性和其周边单元的相近(正相关)或差异(负相关)程度的指标。利用 GeoDA软件,计算北京市各乡镇人均农业总产值的 LISA图和第一产业人口占从业总人口比重的 LISA分布图,并且在 z检验的基础上(p≤0.05)绘制 LISA分布图(图 2、图 3)。

通过全局空间自相关的统计量来测度数据之间的空间关联程度,可以得到整体上的一种空间关联结构。但是正由于它从整体上掩盖了一些局部上的特征或局部空间的一些变异程度,因此,需要通过选择变量从局部尺度上对北京市乡镇农业经济进行分析。如选择人均农业总产值和第一产业人口所占比重 2个变量来从不同的侧面进行分析。结合图 1的 Moran散点图、表 2的对应乡镇图和图 2、图 3的 LISA集聚图,分析得到:①对于人均农业总产值变量来说,在局部范围内呈现空间集聚性,比如在北京的环核心区附近以及北京西部区域呈“低低”集聚状态,这些区域覆盖的乡镇其人均农业总产值均偏低,且与周边的乡镇互相集聚。而在北京的东部顺义、平谷、密云、大兴和怀柔交界区域以及南部的一小块区域,则呈“高高”集聚状态。由表 1得到的数据可知,呈现“高高”集聚状态的乡镇比例为 22.6%,呈现“低低”集聚状态的乡镇比例为 23.7%,也就是说北京市的农业总产值分配状况,有将近 50%的乡镇呈现集聚状态。此外,通过散点图和 LISA集聚图,还可以发现局部的空间异质性,比如“低高”和“高低”分布状态,尽管这些乡镇的数量占全部乡镇数量的比例不大,仅为 8%左右,但是它们在人均农业总值这一因素上突显出的“热点”或“冷点”现象都是值得关注并对之进行研究的。②对于第一产业人口占从业人员比重这个变量来说,从某种意义上可以作为城市化进程的一个反映,通常来说,城市化高的区域,其农业经济就相对衰退,从事农业的人口也随之减少。从 LISA集聚图上,可以看到该变量在局部范围内同样呈现空间集聚性。同样在北京的环核心区周围,由于城市核心区的辐射功能,经济发展迅速,农业人口比例下降,并且呈现“低低”集聚状态,如朝阳、海淀、丰台。此外,与这 3个近郊区接壤的通州、顺义、大兴和昌平部分乡镇亦随之呈现“低低”集聚状态。与之相反的是,在延庆、密云和平谷大部分乡镇从事第一产业的人口比例仍然很大,并呈“高高”集聚状态,从某种侧面也反映出该集聚区域内的城市化程度较低。③比较图 2和图 3两幅集聚图,可以发现,在环北京市城市核心区周围,即近郊区,不管是人均农业总产值还是第一产业人口所占比重都呈现“低低”集聚的状况。这与北京市的经济发展状况以及城市核心区的经济功能辐射作用是相吻合的,也就是说在该区域内农业经济所占的比重普遍不高,这是北京市环状经济辐射发展的一个反映。而对其他“低低”和“高高”集聚区域,两者并不能很好的重合,即有相一致的区域,也有相差异的分布区域存在。

2.3 Moran’s I值的空间分异图

以各乡镇面域的质心为离散点,采用反距离权重(IDW)法将局域 Moran's I值空间化,栅格大小选用 500 m×500m,得到北京市乡镇人均农业总产值和第一产业人口所占比重的局域 Moran's I的空间分异图(图 4,图5)。通过分异图,可进一步验证空间测度结果:2个变量的高值区域与低值区域的集聚特征十分显著。

3 结论与讨论

通过利用 ESDA分析方法,包括空间权重矩阵、Moan's I指数、Moran散点图和 LISA等工具来认识和分析2005年北京市各乡镇人均农业总产值和第一产业人口占从业人员的比重的空间分布特征,揭示空间依赖性和异质性等空间联系结构,并从空间关联的角度去对北京乡镇农业格局进行分析。

(1)全局空间自相关分析结果表明,北京市乡镇农业经济存在正的相关性,表现出很强的空间集聚特征。

(2)对 Moran散点图和 LISA图像分析,结果反映了北京市乡镇农业经济存在着空间自相关和异质性。而正是由于空间异质性的发现,揭示了由于全局分析中所掩盖的一些信息和现象,更加有助于将局部乡镇的一些特殊情况呈现出来,以便于更好地分析和施加对策。

(3)一系列分析表明,对乡镇农业经济进行研究时运用 ESDA分析方法克服了传统统计方法强调样本“独立性”却忽视样本空间位置及空间关联性的缺点,将空r间维度纳入到研究体系中,得到了更加有意义且定量化的分析结果;同时 ESDA方法的应用为其他区域空间经济结构的研究提供了技术支撑。

(4)限于数据收集的因素,只对 2005年的人均乡镇农业总产值和第一产业人口所占比重进行了研究和分析,但经济活动是一个长期的、连续的行为,从时间跨度上去对乡镇农业经济进行分析可能得到更好的结果。因此,要注意将空间维度与时间维度相结合进行分析,这是以后需要注意和改进的地方。

通过探索性空间分析反映出了北京乡镇农业经济的空间分布特征,结合北京经济发展特点,提出以下建议:①对于农业经济空间分布展示“高低分布”特征的地区,鉴于其处于经济发展略为滞后的孤岛位置,且大部分位于经济发达区域附近,可加大核心经济发展区的辐射带动作用,促进其多源经济的发展。②对于第一产业人口聚集而人均农业总产值较低的地区,由于其主要分布于山区,要进行适当的政策倾斜,加大扶持力度。同时,发掘山区拥有的优良旅游资源,开拓就业渠道,增加收入手段。

[1] 李小建,乔家君.20世纪 90年代中国县际经济差异的空间分析[J].地理学报,2001,56(2):136-145.

[2] 郭庆旺,贾俊雪.中国区域经济趋同与差异的因素贡献分析[J].财贸经济,2006(2):11-17.

[3] 胡良民,苗长虹,乔家君.河南省区域经济发展差异及其时空格局研究[J].地理科学进展,2002,21(3):268-274.

[4] 欧向军,陈修颖.改革开放以来江苏省区域经济差异成因分析[J].经济地理,2004,24(3):338-343.

[5] 陈斐.具有空间统计与 GIS的区域经济分析研究[D].武汉:武汉大学,2002.

[6] Goodchild M,Anselin L,App lebaum R,et al.Towards A Spatial Integrated Social Science[J].International Regional Science Review,2000,23:139-159.

[7] 陈斐,郭朝辉,杜道生,等.基于 GIS的区域经济分析与决策初步研究[J].人文地理,2007,17(6):76-80.

[8] 孟斌,王劲峰,张文忠.基于空间分析方法的中国区域经济差异研究[J].地理科学,2005,25(4):393-400.

[9] 何江,张馨之.中国区域人均 GDP增长速度的探索性空间数据分析[J].统计与决策,2006(22):72-74.

[10] 鲁凤,徐建华.中国区域经济差异的空间统计分析[J].华东师范大学学报(自然科学版),2007(2):45-51.

[11] 樊新生,李小建.基于县域尺度的经济增长空间自相关性研究——以河南省为例[J].经济经纬,2005,(3):57-60.

[12] 陈建建,甄峰.20世纪90年代以来安徽省区域经济差异时空特征分析[J].安徽农业科学,2007,35(9):2633-2635.

[13] Goodchild M F,Maguire D J.Geographical In formation Systems,Principles,Technical Issues,Management Issues and Applications[M].Indianapolis:JohnWiley&Sons,Inc,1999:253-266.

[14] Cliff A D,Ord JK.Spatial Autocorrelation[M].London:Pion,1973:312-314.

[15] Cliff A D,Ord JK.Spatial Processes:Models and Applications[M].London:Pion,1981:125-127.

[16] 王远飞,何洪林.空间数据分析方法[M].北京:科学出版社,2007.

[17] 马荣华,蒲英霞,马晓冬.GIS空间关联模式发现[M].北京:科学出版社,2007.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!