时间:2024-08-31
李 军,刘举庆,游 林,俞 艳,张晓盼,董 恒
(1.中国矿业大学(北京)地球科学与测绘工程学院,北京 100083; 2.宁波时空数语信息科技有限公司,浙江 宁波 315101;3.武汉理工大学资源与环境工程学院,湖北 武汉 430070)
随着城市化进程的快速推进,土地资源日益紧缺,其科学运营与优化配置是当前社会迫切需要解决的问题。虽然中国国土幅员辽阔,但适宜工业化、城镇化开发的面积不到20%,除去必须保护的耕地和已有建设用地,今后可用于建设开发的面积只有约28万km2[1],部分城市已经出现“无地可用”的局面[2]。此外,2000—2018年,中国城市化率水平从不到37%快速增加到59.58%[3],并且在未来10~20年,最大的内需潜力在城镇化,土地资源需求缺口巨大。因此,中共“十九大”报告明确指出,土地作为最基础的资源,需要对其进行综合管理与科学配置,提高土地治理水平,以进一步推动供给侧结构性改革,推进新型城镇化进程[4]。
土地储备是国土资源主管部门为调控土地市场、促进土地资源合理利用,依法取得土地,组织前期开发、储存以备供应的行为[5],对科学运营土地、优化土地资源配置具有重要作用。但由于中国城市土地储备制度长时期处于“边运作、边探索,边总结、边推进”的发展阶段,当前土地储备工作仍存在一定的问题[6],比如顶层设计缺位、信息联动性弱、决策缺少精准科学依据等[7-9]。针对此,国内外学者展开大量研究。在决策方法方面,不同学者分别利用主成分分析、灰色预测GM(1,1)、回归分析、BP神经网络以及灰色马尔柯夫等进行储备规模、供应时机预测及关联要素分析[10-13];也有学者通过建立城市土地储备潜力评价指标体系,利用GIS空间分析定量化评价指标,确定适宜的待储备地块[14-15];利用地理加权回归、灰色-Markov预测模型、最大熵法、神经网络等对未来土地价格进行预测和分析[16-19]。虽然学者们展开一定研究,但大多只是针对土地储备业务中的某一环节,未能形成系统的土地储备决策体系,无法提供系列性决策服务。另外,由于过去缺乏海量时空大数据的支撑,评价指标无法真实刻画现实发展状况,难以满足当下对评估与预测结果的高精度要求。在信息化时代,有学者尝试设计并实现了土地储备交易信息系统,主要提供基本空间分析工具、土地资源数据管理、储备信息管理及查询等功能,并探索性地将土地储备交易流程系统化和信息化[20-23],少数学者尝试融入一些决策分析功能,如通过构建建设用地资源潜力评价指标体系,利用GIS定量分析,对土地资源潜力进行多指标综合评价,进而实现储备对象筛选和项目选址功能[24];通过不同年度征地层叠加(相减)获取年度总存量用地面积,进而利用模糊规划方法,预测最优的土地储备数量[25]。不过现有的系统较为简易,功能相对单一,难以满足当下复杂的业务需求。而由自然资源部垂直向下的土地市场动态监测与监管系统(http: //jcjg.mnr.gov.cn/)只是单向的填报系统,只能简单上传界址点数据,并未实现土地储备管理、决策功能等一站式支持。总体上看,国内外学者对土地储备决策与信息化管理进行了积极的探索与发现,并取得了一定的研究成果,但土地储备决策方法不成体系,更缺乏系统性的分析及决策服务支持,无法有效地为土地管理部门提供一站式决策支撑。
近年来,以时空大数据、人工智能、云计算为基础的新一轮科技革命和产业变革方兴未艾[26],时空大数据的产生为现状精准刻画及个体行为轨迹分析提供了数据基础,人工智能及云计算的发展为时空大数据的挖掘分析提供了技术支撑,使系统化、科学化、智能化的政务决策成为了可能。在土地管理利用方面,刘望保等基于百度位置感知数据,通过随机森林方法模拟识别了广州市土地利用类型[27];HUANG等利用语义分析、热点识别等空间分析方法对工业兴趣点(POI)进行挖掘,分析杭州湾工业用地的时空动态变化[28];PAUDEL等通过分析空间农业区、统计数据、人口密度、土壤类型等,研究了尼泊尔1970—2010年40年间的农业用地时空变化[29];陈珊珊等将时空大数据应用到存量土地更新规划研究,存量空间资源评估,更新时段判断等[30];OMRANI等将K-means聚类算法集成到Spark高性能计算环境下,对大面积、多个时间步长的土地利用变化进行模拟,大大提高计算效率和准确率[31];另外,时空大数据在智能交通、智慧医疗、智能旅游、城市规划等智慧城市建设方面也被大量应用[32]。但以上研究大多集中在土地监测、智慧城市建设等方面,在土地储备领域研究较少,因此需要建立一套面向土地储备的时空大数据挖掘算法,构建智能决策支持体系,以促进土地储备科学智慧决策。
本文针对土地储备的业务逻辑和需求,以时空大数据为驱动,人工智能为核心,遵循科学性、实用性、先进性、开放性的设计原则,提出面向土地储备的智能决策服务体系,研究一套面向土地储备各环节的决策方法集,并设计智能决策支持平台技术架构,重点研究基于Hadoop/Spark的大数据处理技术、多源异构数据融合技术、智能决策模型集构建等,为土地储备业务全环节提供科学与智能决策服务。
土地储备智能决策体系设计是在遵循科学性、实用性、先进性、开放性的原则上,充分分析其传统业务流程及决策需求,建立一个集数据资源管理、现状条件精准刻画、科学智能决策服务于一体的科学化、智能化的决策支持平台,为土地储备决策提供数据支撑、分析依据和决策参考,为土地储备管理、规划提供辅助支持。
(1)科学性。在设计土地储备智能决策体系时,需要重点研究土地储备作业内容,以其基本流程和业务环节为依据,明确其业务所需,切实能够解决土地储备决策所面临的痛点问题;现状条件评估需要建立科学、客观的评价指标体系,并采用合理的空间分析定量化方法,确保其评估结果精确可信;智能决策支持模型构建应采用相对成熟、准确、智能的技术方法,保证模型分析及预测结果具有可靠性和科学性。
(2)实用性。功能设计应紧密结合土地储备实际业务所需,能够满足决策所需,相应技术架构应具备可实施性和再现性。体系结构尽可能简洁、方便和灵活,既具备反应迅速的特点,又便于工作人员进行业务处理和综合管理,便于各政府部门、储备机构同时在线分析,了解发展现状、规划方向及决策信息。
(3)先进性。时空大数据的动态更新是保证体系先进性的重要基础,采用定期更新的基础地理信息、动态产生的业务数据以及传感器采集的位置感知数据,可以实现社会、经济、自然等要素信息的动态更新;在此基础上,智能决策模型构建方法应以人工智能、空间分析等先进算法为基本原理,可以实现自我学习和优化训练,不断提高模型精度,而智能决策体系同步进行滚动更新,以保证智能决策体系的持续可靠;同时需要搭建大数据处理框架为海量数据的弹性存储和挖掘分析提供计算引擎。
(4)开放性。体系中智能决策支持平台技术架构应借鉴面向服务的架构(SOA),将评价指标与模型分开处理,构建独立的评价指标库和模型库,拥有低耦合、易拓展、兼容并包的特点,低耦合的特性为后期的维护和迭代升级提供方便,随着土地储备制度的发展和需求变化来增加新的指标或构建新的评价模型,以满足长期发展及各级地方政府多元化的需求;兼容并包则是可以与现有的国土资源管理系统以及其他系统之间协同作业,提高效率。
遵循以上设计原则,针对土地储备工作的痛点问题及决策需求,设计土地储备智能决策体系(图1),主要包括用户、智能决策平台和后端服务三部分内容。用户是指土地管理部门和各个做地主体,负责土地储备工作的整体开展。智能决策支持平台是提供土地储备智能决策服务的统一“门户”,通过Web界面直观地向用户提供各项功能模块,如数据资源共享、现状条件精准刻画及土地储备智能决策,对未来土地储备总量、结构、布局、时序的统筹安排提供决策依据,科学合理地制定土地储备计划。智能决策支持平台后端主要提供数据和技术支撑,通过集群资源将反映社会经济现状发展的时空大数据聚合,构建数据仓库,进而利用基于时空分析、人工智能的决策模型集对其挖掘分析,将现状刻画数据和决策模型分析结果反馈给智能决策支持平台Web端进行展示。
根据土地储备智能决策体系的整体设计,结合土地储备各环节工作内容,包括计划编制及储备实施,其中计划编制是土地储备工作实施的重要指导依据,其基本内容包括基础资料收集,规划及现状分析,分析决策储备总量、结构、布局、时序,制定三年滚动计划及年度计划,而储备实施主要是在储备计划的指导下进行土地收购、平整、入库、出让[33]。计划编制是土地管理部门开展的重点内容,是土地储备决策的关键环节,基于此,设计土地储备智能决策体系的具体功能(图2)。
(1)数据资源共享。针对耗时耗力的基础资料收集环节,设计资源目录功能模块,将散落在各部门中的时空数据资源进行聚合,构建土地储备数据仓库,主要包括基础图层、资源要素图层、业务图层和辅助决策图层,涵盖基础地理信息、公共专题数据、国土规划业务数据及智能感知大数据。仓库统一提供数据资源服务,包括数据可视化、数据查询、数据更新、数据调用等,旨在打破“数据孤岛”,促进资源流通。用户利用整合的各项规划数据和土地现状数据,能够全面系统地把控未来发展方向,厘清家底。
图1 土地储备智能决策体系Fig.1 Land reserve intelligent decision system
图2 土地储备智能决策体系功能设计Fig.2 Functional design of land reserve intelligent decision system
(2)现状条件精准刻画。客观的现状条件是土地储备科学决策的重要前提,“一切从实际出发”同样对客观现状的重要性做出了强调。因此,深入了解城市发展现状一直是土地储备部门在计划编制之前开展的重要工作。在数据仓库基础上,通过时空分析对各地块的地理区位条件、社会经济状况等量化分析,提供客观精准的现状信息,方便用户对社会经济发展状况进行直观判读。主要包括各地块的人口密度、客流密度、建筑密度、建筑体量、土地产出率、周边配套情况、已出让价格、已收储成本、环境景观品质、交通便利程度、人口画像等定量化结果,基本涵盖自然、社会、经济各个方面。
(3)储备环节智能决策。在弄清现状条件后,面对土地储备三年滚动计划和年度计划各决策环节,提供高效便捷、智能化的决策支持,对土地储备总量、结构、布局、时序等方面做出统筹安排。土地储备智能决策体系包含基于时空分析、人工智能等技术的智能决策模型集,其通过对多源时空数据的挖掘分析,构建土地储备智能决策专题应用模块,包括存量用地监测、收储成本预测、出让价格预测、储备平衡分析、开发时序建议、相似集聚分析及病态地块识别功能,并利用WebGIS技术将所有地块的属性信息和预测结果统一以地图的形式展示给用户,用户可以通过其获取土地收储规模、结构、效益、时序等方面的决策信息。决策专题不仅提供模型解算结果,还包括各项指标依据,参考的标准,使用数据的年限等属性信息,帮助决策者理解和解释各项内容。以存量用地监测为例,平台首先调用资源目录中的城乡规划数据、建筑面数据、常住人口、地块经济数据、位置感知数据、地籍数据、土地利用现状、违法用地图斑、供而未用图斑、农村集体确权结果等,通过GIS空间分析,借助集群资源,定量化开发容量、建筑密度、建造时间、人口密度、土地产出率、客流量等评价指标,进而通过层次分析法确定指标权重,通过加权叠加得到土地利用效率分布图(区分用地性质),筛选出低效的商业、居住、工业类型的存量用地,结合其他类型的存量用地,如城中村、违法用地、供而未用土地等,实现存量用地监测功能。
最后,结合基本分析工具和管理模块,将以上基础数据管理功能、空间分析功能、智能决策功能等核心功能集成开发,建立土地储备智能决策“一张图”支持平台,实现智能决策体系的工程化应用,促进相关部门协同作业,方便管理者统筹安排,并满足各级土地储备机构的决策需求。
针对智能服务体系的设计,土地储备智能决策支持平台整体采用面向服务的大数据挖掘技术架构(图3)。其中基于Hadoop/Spark大数据处理技术为数据处理与模型解算提供存储和计算资源支撑,根据不同的计算需求合理安排计算与存储资源;通过数据融合驱动将多源时空大数据进行聚合与集成,构建土地储备专项数据仓库,为下一步的数据挖掘分析提供数据支撑,进而利用人工智能、时空分析等技术构建智能决策模型集,实现对多源时空大数据挖掘分析,并将模型计算结果写入数据仓库;最后利用WebGIS技术实现对数据资源管理、现状条件评估及决策模型的综合应用,实现时空环境下的多源异构、大规模、动态信息资源“一张图”综合展示与智能决策专题应用,为土地储备工作开展提供智能决策。
图3 土地储备智能决策体系技术架构Fig.3 Technical framework of land reserve intelligent decision-making system
随着大数据分布式处理框架快速发展,高性能、高并发计算能力得到增强,而SVM、神经网络、聚类分析等人工智能算法的兴起,为决策模型智能化提供了可能。因此,云计算、大数据、人工智能、GIS等技术必将成为土地储备智能决策中的关键技术方法。
3.2.1 基于Hadoop/Spark的大数据处理技术
面对海量的时空数据处理,许多大数据分布式计算框架被开发,目前国内外分布式系统大多使用Hadoop系列开源系统[34],但其默认支持的MapReduce是一种基于磁盘的分布式并行计算模型,仅支持Map和Reduce两种操作,且处理效率低、不适合迭代运算等;研究者们进一步开发了基于内存运算的Spark大数据处理引擎,其相比MapReduce运行效率提高10~100倍[35],且兼容Hadoop核心文件系统HDFS,具有高吞吐量的技术优势,随着快速迭代开发,也形成了自己的生态系统,包括支持SQL查询的SparkSQL、流式计算的Streaming等[36]。随着海量流数据的产生,一些流式大数据处理框架也应运而生,如Storm、Samza及Flink,但其主要面向流数据的快速处理,目前在数据吞吐量、数据批处理、社区活跃度等方面略逊色于Spark[37-38]。
本系统定位面向多源、海量的时空大数据和多样化的数据处理方式,因此采用“Double Win”的Hadoop/Spark框架,集成批处理和流处理两种计算模式,以及Hadoop的高吞吐量分布式存储,Spark的高效内存计算,进而建立面向土地储备管理的大数据挖掘资源池,提供多源异构大数据的融合集成能力及智能决策模型的并行计算和管理能力。Hadoop中的分布式文件系统HDFS为系统提供海量数据存储资源,具有的高容错、高可靠性、高可扩展性、高吞吐率等特征,实现海量数据物理上分布、逻辑上统一;对于小体量数据则采用空间型数据库,比如PostgreSQL、MongDB等。Spark为系统提供数据挖掘计算引擎,Spark Coro分布式集群计算框架实现智能决策模型的并行式计算,解决模型应用多源大数据的计算负担问题;流式计算方法对实时数据流进行处理和控制,允许程序处理实时数据,实现房产实时交易数据、位置感知数据等动态接入与实时计算,保证系统的滚动更新与自我学习。
3.2.2 多源时空大数据融合
土地储备时空大数据主要包括基础地理信息、国土规划业务数据、公共专题数据及智能感知大数据(图4),涵盖社会、经济、人口、环境各个方面。其中基础地理信息、国土规划业务数据、公共专题数据属于相对传统的空间分析数据,但其具有高精度,覆盖面广的数据优势,是城市管理、重大项目落地、国土规划等工作的重要分析依据和决策参考;而新兴的智能感知数据可以实时、动态地反映人们的个体行为轨迹,展现实时人口变化,为地块内人口画像、OD分析、职住分析、客流分析、时空聚类等现状条件的精细刻画提供数据基础。
图4 时空大数据Fig.4 Spatiotemporal big data
多源大数据的产生为智能决策分析提供了数据支撑,但其多源性、异构性、多尺度的特点为数据的组织和使用同样带了一定的挑战,如何有效地将多源数据融合,并高效地进行组织利用是数据挖掘与分析的一项基础性工作。数据融合大致分为抽取、转换、清洗、载入及数据空间化。数据抽取是指从原始的数据源中获取数据内容,迁移到数据仓库中,以使数据仓库开始运转,或通过读取记录中包括日期时间标记、相应数据更新日志等;数据转换是对原始数据进行转换处理,如坐标转换,以符合系统应用和进一步数据挖掘分析的需求;数据清洗主要是填充缺失的数值、光滑噪声并识别离群点、纠正数据中的不一致,去除“脏数据”;数据载入是通过基本转载、追加和更新三种数据载入方式,完成数据更新。对于有价值但无空间位置坐标信息的统计数据,需要对其进行数据空间化。数据空间化是利用地名地址匹配的技术方法,将汇聚后的数据进行时空定位寻址,如常住人口统计数据、经济普查数据、土地出让案例等。当数据不直接含有地名地址时,需要针对潜在地址信息或地名基因,利用分词与数据对比技术,结合语义邻近分析,提取地名地址,实现精确匹配。
3.2.3 智能决策模型集构建
通过对土地储备各环节进行深入的分析,充分结合土地储备相关部门面临的问题和需求,建立了一套相对完备的智能决策理论体系,利用人工智能、时空分析、知识建模等技术构建了智能决策模型集(图5),实现地块尺度下的各储备环节的科学决策。首先利用GIS空间分析,采用多指标定量综合评价方法构建存量土地监测模型,抓取低效闲置地块;通过市场比较法,构建收储成本预测模型,对土地收储成本进行快速精准预测;利用支持向量机构建出让价格预测模型,预测土地出让价格,结合收储成本预测结果,解决资金平衡问题。在此基础上,利用灰色预测、多元统计构建储备平衡分析模型,对未来几年的收储规模进行预测;利用密度制图算法、凸包算法和聚类算法等建立相似地块分析模型,识别潜在大区块开发区域,促进规模开发,防止破碎化问题,并构建开发难易度评价指标体系,结合成本和收益预测结果,建立开发时序分析模型,明确经济社会效益最优的开发时序。通过位置查询、冲突检测等方法,检查各做地主体年度计划,并提取时间冲突、与上位规划用地性质冲突等病态地块,最终实现储备计划的科学编制。
图5 土地储备智能决策模型集Fig.5 Land reserve intelligent decision model set
3.2.4 GIS技术
时空大数据的两个重要特点是同时具备空间位置和时间属性[26],而GIS技术具有强大的空间数据管理能力、空间分析能力以及基于地图的可视化能力,能够为时空大数据的管理和分析提供技术手段和展示平台。目前,随着计算机的快速发展,GIS技术正逐渐渗透到各个领域,尤其在国土规划方面已经展开了大量应用。本文利用GIS空间分析能力对多源时空数据进行挖掘分析,如揭示常住人口空间分布及地块周边区位条件状况,并以GeoServer、Arcgis for server等地图服务引擎进行空间数据渲染、地图发布,将空间分析结果展示给用户,提供空间特征专题服务。
为了验证本文决策体系的科学性与可行性,选择宁波市6区作为研究范围,依托宁波市积累的大量土地储备案例、规划数据及基础地理信息,根据其具体业务开展流程,设计了土地储备智能决策体系,并采用SOA架构设计搭建了土地储备智能决策支持平台(图6(a)),系统集成各项管理与决策支持功能。用户通过平台可以实现对数据资源的统一管理,对现状条件的量化分析,获取智能决策模型结果作为决策依据,以科学制定土地储备计划。
在智能决策专题模块,用户可以实现各环节的科学高效决策,包括存量低效地块监测、土地收储成本、出让价格预测、收储规模和时机预测、开发时序与相似性分析及病态地块识别。如图6(b)为居住用地利用效率分布图,在此基础上选出低效闲置的存量建设用地(图6(c))进行优先收储。
图6 应用实例Fig.6 Application example
本文以土地储备具体内容及流程为重要依据,从土地储备科学决策需求出发,以多源时空大数据为基础,遵循科学性、实用性、先进性及开放性原则,设计了土地储备智能决策体系,针对土地储备的每一环节进行功能设计,并集成到土地储备智能决策支持平台,实现多源时空大数据共享,发展现状精准刻画,储备环节智能决策,为土地储备各环节提供科学决策服务。在此基础上,设计了土地储备智能决策体系技术架构,并重点研究了基于Hadoop/Spark的大数据处理技术、多源时空大数据融合技术、智能决策模型集。解决了海量数据存储和计算的高性能要求问题,并实现对集群资源、决策模型、用户任务信息化集中管理;并在此基础上,对多源异构数据进行抽取、转换和清洗等处理,将多源时空数据融合集成,构建了土地储备专题数据仓库,提供数据支撑;进而利用人工智能、时空分析等技术方法,构建了智能决策模型集,设计了土地储备智能决策专题模块,针对各环节提供科学决策信息,辅助土地管理部门和做地主体制定各项储备计划,以进一步指导实践。在以上体系及技术的研究基础上,为验证其科学性及可行性,应用于宁波市进行实例验证。结果表明,本文土地储备智能决策体系的研究为土地储备工作的科学开展提供了决策支持,提高了土地储备的科学性和运作效率,对促进土地资源的科学运营与优化配置,合理利用有限的土地资源具有一定意义。
通过本文研究可以发现,土地储备智能决策体系本身具有一定的复杂性和困难度,因此,未来还有一些工作可以进一步开展,主要有以下几个方面:(1)提高决策模型结果的准确性。模型结果的准确性对土地储备决策与计划的制定至关重要,是下一步研究的重点优化内容,如存量用地监测模型中的低效用地评价,可以考虑进一步进行关联要素分析,完善土地利用效率评价指标体系,其关联度也将指导权重的确定;收储成本与出让价格预测模型应进行精度验证,以已收储的地块作为验证依据,进而不断优化模型预测精度;开发时序分析模型是本文提出的核心模型之一,目前研究较少,其具有一定复杂性,主要体现在因时序的不同,评价指标定量化结果会跟随动态变化,结果也会千差万别;还有一些零星地块的高精度抓取等。(2)智能决策体系应用需要“因地制宜”。虽然自然资源部在2018年颁发了新修版《土地储备管理办法》,但是各地方经济状况、社会背景存在较大差异,其开展模式并不统一。虽然本文提出的决策体系是建立在统一的土地储备框架下,但还是需要进一步结合自身的业务需求来拓展应用,如构建新的评价指标、决策模型等。不过体系具有开放性、易拓展的特点,可以实现体系应用上“因地制宜”。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!