当前位置:首页 期刊杂志

多时态不同差异的土地利用现状数据一致化处理方法

时间:2024-08-31

王育红,张合兵,郭增长

(河南理工大学测绘与国土信息工程学院,河南 焦作 454000)

多时态不同差异的土地利用现状数据一致化处理方法

王育红,张合兵,郭增长

(河南理工大学测绘与国土信息工程学院,河南 焦作 454000)

研究目的:减少消除多时态土地利用现状数据之间的差异,派生形成彼此兼容协调一致的多时态土地利用现状数据序列,支持促进基于多时态数据的综合分析与评价预测。研究方法:对不同地区多时态土地利用现状样品数据进行调查分析,结合文献资料对数据差异进行梳理界定,实验对比利用不同软件进行一致化处理的技术特点,在此基础上提出较为高效的处理方法。研究结果:较为系统地总结描述了多时态土地利用现状数据之间的差异类型及其表现形式,提出了基于FME的数据差异一致化处理方法,阐述了该方法的基本步骤及相关原理。研究结论:该方法能够快速高效地消除多时态土地利用现状数据在数据格式、坐标系统、模式结构、数据实例等方面的差异,大大提高数据之间的协调兼容一致性,为多时态土地利用现状数据综合分析与评价提供了前提基础。

土地信息;数据格式差异;坐标系统差异;模式差异;实例差异

1 引言

改革开放以来,中国先后开展了两次全国范围内的土地利用现状调查,即1984—1996年开展的全国第一次土地详查(简称“一调”)与2007—2009年开展的全国第二次土地调查(简称“二调”),在两次调查之间与“二调”之后又开展了相应的变更调查。随着土地利用现状调查及变更调查的开展与实施,目前中国各级土地管理部门已积累拥有了大量不同时期的土地利用现状数据。但是,由于两次调查及变更调查在时代背景、法律依据、分类体系、技术标准、作业规范等方面的不同[1],所获得的多时态土地利用现状数据之间存在多种差异,进而限制了对多时态土地利用现状数据的综合分析、评价、预测及应用。

为了降低、消除多时态土地利用现状数据之间的差异,派生形成彼此兼容、协调一致的多时态土地利用现状数据序列,本文在调研分析湖北省武汉市、海南省琼海市、湖南省长沙市等不同区域多时态土地利用现状样品数据的基础上,首先较为系统地总结描述了多时态土地利用现状数据之间的差异类型及其表现形式,然后提出了基于FME的数据差异一致化处理方法,阐述了该方法的基本步骤及相关原理。

2 多时态土地利用数据差异类型分析

所谓差异是指系统整体内部诸要素、诸层次、诸功能在结构和在时空中的差别[2]。作为一种特定专题类型的地理空间数据,多时态土地利用现状数据之间的差异可以依据地理空间数据差异理论加以分析与描述。目前还没有形成统一的理解和认识,不同学者从不同研究角度出发分别提出了不同详细程度的分类体系[3-4]。为便于理解,本文在调研分析的基础上将多时态土地利用现状数据之间的差异总结概况为4个方面。

2.1 数据格式差异

由于业务变更、平台升级、技术创新等原因,中国许多单位在土地利用现状调查及其变更调查的不同时期往往使用多种不同的软件系统来管理和处理土地利用现状数据,如湖北省武汉市使用了MapGIS、ArcGIS、苍穹等系统,海南省琼海市使用了MapInfo、SuperMap、ArcGIS等系统。这些系统出于各自的底层算法要求及商业利益需要,往往依据不同的地理空间数据模型和数据结构设计了各自的空间数据存储格式,如MapGIS的点(*.wt)、线(*.wl)、区(*.wp)等格式,ArcGIS的Shape格式、Coverage格式、Geodatabase格式,这些数据格式对空间数据的基本组织法则有较大的差异。另外,即使是同一种数据格式有时也存在版本的差异。

2.2 坐标系统差异

在土地利用调查领域,中国先后规定使用的是北京54和西安80两种坐标系,二者是采用不同参考椭球和定位定向参数,具体应用时两种坐标系又可进一步分别划分为三种不同形式的坐标系统:(1)大地(或地理)坐标系,其坐标值由纬度(B)、经度(L)、大地高(H)组成;(2)空间直角坐标系,其坐标值由X、Y、Z组成;(3)高斯投影平面直角坐标系,其坐标值由x、y组成。同一参考椭球下的不同坐标一般可以通过比较精确严密的数学模型加以转换,而不同参考椭球下的不同坐标一般只能通过近似拟合的数学模型加以转换[5-6]。目前,中国土地利用现状数据主要采用北京54高斯投影平面坐标系和西安80高斯投影平面坐标系。对于这两种坐标差异,最常用的一致化转换处理模型是仿射变换模型。

2.3 模式结构差异

模式是对数据基本种类和特征的概括性描述,反映的是各类数据的结构、属性、联系和约束。如果说数据格式是一种有着严格语法定义及约束要求的语言,模式则是设计者利用这种语言对现实世界进行描述的结果。由于规范要求及理解认识上的不同,即使采样相同的数据格式,多时态土地利用现状数据也往往采用不同的模式结构来描述同类的土地利用现状信息。如图1,多时态土地利用现状数据之间的模式结构差异可以划分为如下几种类型:

图1 多时态土地利用现状数据模式差异示例图Fig.1 The example diagram of schema differences among multi-temporal land use status data

(1)描述差异。描述差异是指不同时期土地利用现状数据集之间采用不同数目或含义的属性字段来描述和刻画同类现象不同特征的情况。

(2)命名差异。命名差异是指不同时期同类土地利用现状数据集之间对同义属性字段赋予不同名称标签或者异义属性字段项赋予相同名称标签的情况,即“同姓异名”与“同名异姓”的情况。

(3)派生差异。派生差异是指某一时期土地利用现状数据集中的某一属性字段在其他时期同类数据集中没有含义相同的直接对应属性字段,但隐含着一个能够通过其他属性字段派生出来的间接对应属性字段。如图1右侧的“扣除地类面积”属性字段,在早期的地类图斑数据集中也不存在与之直接对应的属性字段,但根据早期数据集中的“毛面积”、“线状地物面积”、“零星地类面积”、“净面积”属性字段,可以派生出与之间接对应的隐含“扣除地类面积”属性字段,即:扣除地类面积=毛面积-线状地物面积-零星地类面积-净面积。

(4)约束差异。约束差异是指不同时期同类土地利用现状数据集之间对于同义属性字段在数据类型、取值范围、数据长度、小数点位数等方面定义赋予不同的约束限制。约束差异可能进一步造成属性值层次上的实例差异。

2.4 数据实例差异

数据模式是对数据在“型”方面的刻画,而数据实例则是对数据在“值”方面的描述。只有在设计定义好数据模式之后,才能依据该模式通过相关技术采集输入描述具体事物现象的相应数据实例。由于在技术规范、作业方式、分类标准、采集时间等方面的不同,不同时期土地利用现状数据之间同一地类要素的同义数据实例之间也会存在差异,这些差异主要表现在以下几个方面:

(1)几何图形精度差异。由于受原图变形、采集手段、仪器精度、处理误差等因素的影响和制约,不同时期土地利用现状数据中的同一地类要素几何图形精度往往存在差异,直观表现为彼此间在位置、形状上常常存在间距与缝隙,难以完全重合一致。如果在误差容限范围内,此类差异可予以保留。

(2)数据分幅图元差异。由于受原始图纸资料分幅以及矢量化采集与处理方式的影响,早期的土地利用现状数据常常将一个地类要素表达为多个图元记录,而随着数字化无缝空间数据采集技术的成熟普及以及深层次统计分析的需要,近期的土地利用现状数据则采用面向对象思想将一个地类要素表达为一个单独的图元记录,进而在不同时期土地利用现状数据之间产生同一地类要素对应不同图元的实例差异。

(3)地类名称编码差异。在中国土地利用现状调查与研究中,先后制定颁发了多个不同的土地分类编码方案,其中应用最为广泛的主要有三个[7-8]:1984年颁发的《土地利用现状调查技术规程》中制定的分类编码方案;2002年颁发的《全国土地分类(过渡期间适用)》及编码方案;2007年颁发的《土地利用现状分类》国家标准方案。三个分类编码方案在分类层次、地类数量、地类名称、代码组成等方面存在较大差异,表1概括对比了三种分类编码方案的基本情况并给出了部分分类编码差异示例。

表1 主要土地分类编码方案对比及部分差异示例Tab.1 Comparisons among main land classification and coding programs and some difference examples

(4)耕地坡度表达差异。第一次土地利用现状调查中,耕地地块的坡度采用地面倾角(θ)或坡度值(i)(i = tanθ)的形式记录;第二次土地利用调查中,坡度则表示为按地面倾角或坡度值大小范围划分5个等级(1—5)。

(5)数据时态变化差异。由于受气候、灾害、经济建设、社会发展等多种自然与人为因素的影响,现实世界中的土地利用时刻都在发生着新增、消失、扩张、缩小等多种形式的变化。作为这些变化的真实描述与客观反映,不同时期土地利用现状数据中的同一土地利用要素在位置、形状、面积、地类、权属等方面也会存在差异。与上述差异不同,为追溯分析土地利用变化情况,这类差异应该予以保留。

3 基于FME的土地利用数据一致化方法

针对上述差异,目前常用的方法是依据传统GIS软件的数据格式转换(或数据导入导出)、坐标系统转换、模式重构与调整、数据编辑与修改等功能对其进行一致化处理。但这种方法普遍存在数据格式支持少、处理流程不清晰、知识经验难共享、人机交互频繁、效率低、易出错等不足。为克服这些不足,本文设计提出了基于FME(Feature Manipulate Engine)的多时态土地利用现状数据一致化处理方法。

3.1 FME技术原理简介

FME拥有完整的空间数据ETL(Extraction-Transformation-Loading)解决方案。该系统由加拿大公司基于OpenGIS协会提出的“语义转换”理念进行空间数据读写及格式与语义转换。截至目前,FME系统共设计提供了250多种格式读写器,400多个转换器,为数据转换应用提供了高效、可靠的手段[9]。根据实际需要,用户可灵活选择利用相应的转换器对转换处理过程进行个性化定制与设置,以实现数据的无损转换。

FME所做的数据转换,包括结构转换和内容转换两个方面。所谓结构转换就是将源数据格式进行拆分、合并、重构,转化为FME的内部标准数据结构,然后再发送到目标数据格式,而内容转换则是改变一个数据集中相关要素的具体信息内容,包括要素的几何特征或属性值。这两种转换通过建立源数据到目标数据间的对应映射关系(即一系列转换规则)进行控制,这些规则明确声明了数据转换处理的基本原则与具体操作,并按照相应语法记录在“映射文件”中。映射文件是FME的语言,可以通过系统提供的图形化界面进行可视化定义,也可以使用记事本等程序进行编辑。

FME本身目前还不能很好支持国产软件数据格式。对此,国内已有一些专家采用插件技术开发了支持国产GIS数据格式的FME扩展模块,笔者选择了能够有效支持MapGIS、SuperMap等格式的免费扩展模块——MyFME。

3.2 土地利用数据一致化处理流程

为便于理解,本文以武汉市汉南区2003年土地利用现状数据集中的面状图斑数据为例,参照图2的一致化处理流程,介绍利用FME及其扩展模块MyFME对其进行一致化处理的基本步骤及相关原理。

(1)启动FME Workbench模块,新建一个默认的一致化处理项目。

(2)根据现有数据的具体存储格式,选择相应格式的读取器,向项目中添加待处理的土地利用现状数据FME将自动显示所加数据的属性字段信息,如图2中的①所示。

(3)根据需要选择添加相应格式的目标数据集,并设计建立相应的模式结构,以用来存储和管理处理结果。为了提高处理结果的可共享性及其规范化程度,选择开源的、能够被多种GIS软件平台读取的Shape文件格式作为处理结果的存储格式,并依据国土资源部2007年发布的《土地利用数据库标准》[10]设计相应的模式结构。考虑Shape格式最多只能采用10个英文字符或5个汉字命名属性字段的限制,采用标准中规定的字段代码作为属性字段名,具体形式如图2中的②。

(4)添加仿射转换器(Affiner)(如图2中的③),建立该转换器与面状图斑数据集之间级联关系,依据三对以上同一点不同坐标系下的已知坐标值,根据最小二乘原理解算并输入仿射转换器中的6个转换参数,以利用仿射转换器将面状图斑数据所参考的北京54高斯投影平面坐标系转换为西安80高斯投影平面坐标系。仿射变换及其参数求解的数学模型分别如式1和2。

其中,

(5)添加融合转换器(Dissolver)(如图2中的④),建立该转换器与仿射转换器之间的级联关系,并设置该转换器的“Group by”参数为“地类码”及“所属部门”字段、“Attribute to sum”参数为“毛面积”、“线状地物面积”、“零星地物面积”、“净面积”等字段,以将输入数据集中“地类”与“所属部门”相同的相邻图斑融合为一个图斑,并重新计算新图斑的相关属性,来消除数据分幅图元差异。

图2 基于FME的一致化处理基本流程配置图Fig.2 Basic fl ow and conf i guration diagram of consistency handing based on FME

(6)添加属性值映射转换器(Attribute Value Mapper)(如图2中的⑤),建立该转换器与融合转换器之间的级联关系,设置该转换器的“Source Attribute”参数为“地类码”,“New Attribute Name”参数为“07国际地类码”,并在“Value Mapping”列表中输入源数据集所采用的“02地类码”及其对应的“07国标码”(如图3),以“07国标码”作为统一标准来消除地类编码差异。对于地类名称差异,亦可通过类似设置后加以处理消除。

(7)添加属性范围映射转换器(Attribute Range Mapper)(如图2中的⑥),建立该转换器与属性值映射转换器之间的级联关系,设置该转换器的“Input Attribute”参数为“坡度”属性,“Output Attribute”参数为“坡度等级”,并在“Range Lookup Tabel”中输入坡度范围及其所对应的坡度等级(如图4),将源数据集中地面倾角记录的坡度信息转换为坡度等级信息,以消除坡度信息表达差异。

(8)对于扣除地类面积派生差异、变更时间数据类型差异等差异,可以通过添加Expression Evaluator、Date Formatter等转换器进行一致化处理,转换器参数设置过程与上述转换器类似。

(9)针对不同差异,添加所需转换器并正确设置相关参数之后,依据含义相同原则建立最后一个转换器输出属性字段与目标数据集属性字段之间的对应关系,进一步检查核对各转换器参数设置,确认无误后开始执行一致化转换处理,以生成符合新模式结构及实例表达要求的目标数据集。

4 结束语

土地利用是复杂多样的,人们的理解认识也是合而不同、同中存异的,因此描述与反映不同时期土地利用现状的多时态数据理应也是多样、差异的。在当今科技飞速发展、崇尚特色个性的时代,标准规范也只能保证数据在一定区域、一定应用、一定时期内的相对一致,从长远来看,差异及其处理将是土地利用现状数据获取管理与应用面临的一个长期持续问题。

图3 属性值映射转换器参数设置Fig.3 Parameter setting of attributevaluemapper

图4 属性范围映射转换器参数设置Fig.4 Parameter setting of attributerangemapper

由于用于实证与实验分析的样品数据有限,文中所提差异类型及相应一致化处理策略可能还有所遗漏。针对这一情况,下一阶段将进一步收集分析不同区域的多时态土地利用现状数据,建立更加完备的差异分类体系,通过实验验证从FME转换器中筛选提出更加优化完善、切合实际的一致化处理策略。

(References):

[1]张雅琼,杨子生.中国两次土地资源调查的对比分析[J].国土资源科技管理,2013,30(2):100-104.

[2]乌杰.系统辩证论[M].北京:人民出版社,1991.

[3]崔铁军,郭黎.多源地理空间矢量数据集成与融合方法探讨[J].测绘科学技术学报,2007,24(1):1-4.

[4]王育红.空间数据集成及冲突消解方法综述[J].测绘科学,2011,36(2):81-83.

[5]张菊清,杨元喜,曾安敏.多种地图坐标系统的转换方法及比较[J].测绘通报,2008,(8):32-35.

[6]雷浩川.基于MapGIS和ArcGIS的坐标系统转换[J].青海大学学报(自然科学版),2011,29(1):29-31.

[7]陈百明,周小萍.《土地利用现状分类》国家标准的解读[J].自然资源学报,2007,22(6):994-1003.

[8]曲雪光,林爱文,李建武.关于《土地利用现状分类》国家标准的探讨[J].湖南农业科学,2008,(4): 89-90.

[9]杨帆,薄成.基于FME 的DWG数据到ArcGIS转换的应用研究[J].测绘科学,2012,37(2):143-145.

[10]中华人民共和国国土资源部.中华人民共和国土地管理行业标准——土地利用数据库标准(TD/T1016—2007)[S]. 2007.

(本文责编:郎海鸥)

Consistency Handling Approach on Multi-temporal Land Use Status Data with Various Differences

WANG Yu-hong , ZHANG He-bing , GUO Zeng-zhang
(School of Surveying and Land Information Engineering, Henan Polytechnic University, Jiaozuo 454000, China)

The purpose of this paper is to reduce or banish the differences among multi-temporal land use status data to derive and yield compatible and consistent data series, and to support and promote the comprehensive analysis, evaluation and prediction on multi-temporal data. The research methods are sample analysis, document analysis, comparative analysis and experiment verification. The study results mainly include a comprehensive classification of differences among land use data, a FME-based approach to handing the various differences, its basic steps and related principles. It is concluded that the proposed approach can efficiently banish data format difference, coordinate system difference, schema structure difference and data instance difference among land use status data, and greatly increase the harmony and agreement of data. This study provides the presupposition and basis for comprehensive utilization and analysis on land use status data at various times.

land information; data format difference; coordinate system difference; schema structure difference; data instance difference

F301.2

A

1001-8158(2014)12-0079-07

2014-03-28

2014-07-24

国家“十二五”科技支撑项目子课题(2012BAJ23B04-2)。

王育红(1976-),男,河南柘城人,博士,副教授。主要研究方向为空间数据处理与分析。E-mail: wangyh@hpu.edu.cn

张合兵(1975-),男,河南滑县人,硕士,副教授。主要研究方向为土地信息化。E-mail: jzitzhb@hpu.edu.cn

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!