当前位置:首页 期刊杂志

基于GIS的人口统计数据的空间化探讨

时间:2024-05-17

张杰云,申 真

(江西理工大学建筑与测绘工程学院,江西 赣州 341000)

人口分布是人口地理学研究的核心问题。人口分布同生产分布以及同各国各地区的社会经济发展息息相关,研究人口分布的地域差异及其发展过程,揭示其中的规律性对制订区域人口政策、人口的合理再分布以及实现人口、资源、环境的协调持续发展起着指导作用。

传统的人口统计数据通常是以行政区域为单元,通过普查、逐级汇总而来,以综合反映某行政区域内的人口总和。传统的人口数据统计方法在实际应用中存在较多问题:一是数据的空间分辨率低(县级);二是数据的时间分辨率低,全国性的人口普查10年一次;三是以行政区域为单元获得的人口统计数据在区域内是均匀分布的,不能体现出人口数据的空间分布特性;四是在研究过程中,研究区域往往与行政区划并不一致,增加数据分析的难度;五是不利于多源数据融合。基于地理格网的空间数据,如遥感数据与基于行政单元的人口数据存在尺度上的差异,难以进行融合分析。

要解决上述问题,就要探索人口分布规律并利用GIS技术将人口数据按照其分布规律展布到一定尺寸的地理格网中,构建人口分布空间数据库。人口数据空间化是指通过构建特定的统计分析数学模型将以行政区为单元的人口统计数据分布到一定尺寸的地理格网中,实现由行政单元向地理单元网格的转换。通过人口分布的空间化可以进一步提高人口信息管理水平为经济与社会的可持续发展提供服务。人口统计数据的空间化研究已成为人口空间分布应用研究领域的一个热点问题。刘纪远、岳天祥等人通过运用净第一性生产力空间分布、数字高程、城市规模等数据集,模拟了中国人口密度的空间分布规律;刘望保、闫小培等人利用 EDSA-GIS空间自相关分析技术,分析改革开放以来广州市人口空间分布及其演化。本文以土地利用数据为主要影响因子,探讨具有实际可操作性的人口数据空间化的方法,并在鄱阳湖区进行试验。

1 研究区概况与数据源

1.1 研究区概况

鄱阳湖位于江西省北部,长江中下游南岸,地理坐标北纬28°22′~29°45′,东经 115°47′~116°45′,是我国最大的淡水湖泊。按湖泊出现的最高水位对应的湖水水面面积为该湖泊的面积,鄱阳湖的面积为4 070 km2。

鄱阳湖区的范围为:南昌、新建、永修、德安、星子、湖口、都昌、鄱阳、余干、进贤和九江市的市区。鄱阳湖区地貌类型齐全,有农田、水域、森林、湖滩草洲、低丘岗地、沙洲裸地等,总面积大约为19 815 km2。

1.2 数据源

(1)土地利用数据。1∶100 000江西省土地用数据(来源于中国科学院地理科学与资源研究所TM解译数据),土地利用类型及代码,见表1。

(2)人口数据。2000年的江西省各县市区人口统计数据。

(3)行政区划数据。1∶100 000江西省行政区划图。

(4)全国1∶250 000地形数据库(包括政区、公路、铁路、水系、居民地等要素图层)。

表1 土地利用类型及代码表

2 人口统计数据展布过程

本文将以土地利用类型作为人口空间化的地理因子,建立人口分布空间化的地理因子库,并通过分析确定人口数据与各土地利用类型的相关系数。选取相关系数较高的土地类型因子建立人口与土地利用类型的回归分析模型。选取回归相关系数最优的组合作为人口数据空间化的最佳模型并结合 ArcGIS软件实现人口统计数据的空间化。

在GIS支持下对数据源通过空间分析运算、统计分析运算、数据过滤与处理、模型工具处理等过程建立地理因子库和人口格网因子库。具体处理过程的内容见图1。

2.1 地理因子库建立

影响人口分布的地理因子多种多样,目前在影响人口分布的主要地理因子方面已经有很多研究,其中最重要的地理因子包括地形、水文、气候、土壤、土地利用、交通、居民点等。由于土地是人类生存的最重要因素之一,故土地利用类型与人口分布有着最为密切的关系。同时,交通、气候、地形等也与人口分布有着较为密切的关系。同时,对于不同的区域,各个地理因子与人口分布的相关性不尽相同,故对于不同区域的人口分布研究要有区别的对待。

土地利用数据处理过程:①建立30 m×30 m的规则格网,并对其赋予地理编码;②从1∶250 000地形数据库提取公路、铁路、水系、居民地等图层,通过30 m×30 m的格网叠加统计,建立上述要素的地理因子库;③以1∶100 000土地利用数据库为数据源,通过与30 m×30 m的格网叠加及统计,建立耕地、林地、草地、水域、居民用地、未利用土地等土地利用因子。

图1 人口统计数据空间化流程图

2.2 人口数据与各地理因子相关系数的确立

利用 SPSS数学统计软件将某省分县的人口与分县各种因子的长度或面积进行单因子相关分析,计算出每种地理因子与人口的相关系数,其结果见表2。可以看出,人口分布与城乡-工矿-居民点用地、耕地和林地的相关性较高。人口与城乡-工矿-居民点用地的相关系数为0.867;说明在所有的土地利用类型中,城乡-工矿-居民点用地、耕地和林地是影响各市县人口分布的主要因素,其他土地利用类型是影响人口分布的次要因素。

表2 人口与土地利用类型面积相关系数

2.3 格网人口的计算

2.3.1 人口模型构建

首先以鄱阳湖区各县的平均人口密度为因变量,选取城乡、工矿、居民用地(L1)、耕地(L2)林地(L3)为自变量,利用SPSS软件进行多元回归分析,发现其线性相关系数为0.92;增加自变量草地(L4)、水域(L5)、未利用土地(L6),相关系数提高,达到0.96,具体结果见表3。

表3 鄱阳湖区县级人口密度与各种土地利用类型指数的相关性

2.3.2 模型验证

为验证模型精度,分别用上述两个模型来模拟鄱阳湖地区的人口分布密度,以计算得到各县的预测人口密度,然后用各县的实际统计人口密度与计算的到的预测人口密度进行相关性分析,见图2,以最终确立可行的最优模型。

从图2中可以看出,两个模型的相关性系数都很高,但是模型1的检验精度更高,检验结果表明,模型1更能客观反映研究区域的人口分布情况。

图2 鄱阳湖地区各县实际人口密度与模拟人口密度的关系

2.3.3 人口分布计算

ArcGIS空间分析模块提供了栅格计算的工具,首先加载Spatial Analyst模块,打开ArcMap并单击Tools菜单下的Extensions,选择Spatial Analyst,在ArcMap菜单区,点击鼠标右键,选择Spatial Analyst工具,Spatial Analyst工具出现在ArcMap视图中,选择Raster Calculator,出现Raster Calculator栅格计算工具,见图3。

点击 Evaluate即可生成鄱阳湖地区30 m×30 m人口空间模拟图,见图4。

图3 栅格计算器界面

图4 鄱阳湖区人口分布空间化图

3 结束语

本文运用 GIS技术对人口统计数据空间化方法进行了探讨。结果表明,2000年鄱阳湖地区人口分布与土地利用类型的相关分析中,与城乡-工矿-居民点用地、耕地、林地等土地利用类型相关性较高。说明,在本地区中人口的分布与城乡、工矿、居民点用地等联系紧密。由于时间仓促和计算条件有限,我们选取的因子不尽全面,此人口栅格数据库并不精确,只是提出一种人口分布空间化的方法和思路。如何拟合出符合具体区域特点的人口分布模型,还值得进一步研究。

1 王雪梅、李新等.基于遥感和GIS 的人口数据空间化研究进展及案例分析[J].遥感技术与应用,2004(10):320~327

2 王英安、岳天祥.基于格网生成方法的山东省人口密度空间分布模拟[J].曲阜师范大学学报,2004(7):91~92

3 刘望保等.基于EDSA-GIS的广州市人口空间分布演化研究[J].经济地理,2010(1):34~39

4 肖荣波等.城市规划中人口分布模拟方法研究[J].中国人口资源环境,2011(6):13~18

5 李健、中村良平.城市空间人口密度模型研究综述[J].国外城市规划,2006(1):40~47

6 赵虎、李霖等.基于扩展空间句法的城区人口密度估算方法[J].测绘科学,2009(7):150~153

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!