当前位置:首页 期刊杂志

基于北斗网格码技术实现政务大数据的精细化管理

时间:2024-04-25

摘  要:本文探讨基于北斗网格编码实现大数据的再组织,并从源头探讨了实现数据网格化与网格数据化的方法:当前各级政府单位的管理对象“人、地、事、物、情、组织”均与位置有关,但地址录入的不规范及传统经纬度表示位置的方式,影响了大数据基于位置的关联、分析,北斗网格码作为数据集装箱,数据的网格化、网格数据化方面优势明显,可以在具体实施中,通过把在地名地址引擎中引入北斗网格码引擎,并通过地名地址引擎的推广,实现数据网格化。

关键词:大数据; 北斗网格码 ;空间分析 ;块数据 ;数据网格化 ;地名地址

一、实现政务大数据分析的关键

业务层面,从省、市到下面的区县、街镇、社区每一层级的管理单位都存在大量的垂直系统,有些从部委下来的,更多是从省厅下来的,这些垂直系统管理着辖区某方面的业务,形成了某方面的数据(可以形象的称为条数据[1]),条数据的割裂与孤岛化是各地建设大数据平台的初衷,各管辖区域都想获取到自己辖区内完整的、全面的数据,通过对相关数据的关联、融合、分析,实现城市管理与社会治理的精细化,从这个层面,要求我们必须基于空间管理维度实现大数据的再组织。

万事万物都存在于具体的时空中,其产生的数据自然具备了时空属性,为洞察事物发展规律、特征,一方面通过各自的唯一ID进行关联、分析。另一方面,需要从空间维度进行分析,发现事物的空间分布规律及相关性,正如1832年法国爆发霍乱疫情,Charles Picquet 通过绘制热力图发现疫情的暴发点。第一个维度的分析可以通过对数据集进行关系型布尔代数操作实现,技术方面已经非常成熟,效率也很高;第二个维度,由于涉及空间分析,包括缓冲区分析、相交分析等等,一般都涉及大量的浮点运算,技术上虽然也比较成熟,但当数量量呈现几何基数增长时的计算,效率显著降低。

北斗网格码技术通过一维整数实现了对三维立体空间的编码,可以高效的实现数据的空间分析,重点解决空间大数据时代,数据的区位标识、共享交换、高效计算的问题[2],为我们以空间维度对政务大数据的组织管理提供了新的思路。

二、北斗网格码简要介绍

北斗网格码又名“北斗网格位置码”,具有全球统一性、多尺度立体性、超强计算性、良好包容交互性等基本特点。将地球空间范围进行多层次划分, 形成连续的平面或立体单元(称为“北斗网格” ),每个网格均可赋予可计算的唯一编码, 该编码可作为地球空间区域位置标识,地球上所有信息或数据均可落在某一个或多个网格中,因而可以对现实地球空间进行标识、表达、组织与计算。

北斗网格码通过将传统的经纬度浮点属性数据转化为一维整形数组的北斗网格位置编码和北斗剖分时间编码,使用户获取的位置和时间从单纯的属性数据增强为可统一标识、 可直接关联、可快速索引、可方便传递、可大规模高效计算、 可二三维一体化展示的能力数据。利用北斗网格作为空间单元可以方便地对各类数据进行统一索引,基于网格进行数据综合分析应用,解决目前的技术难题。简单说就是把网格作为一个个按照位置排列的集装箱,把各类数据按照位置放进去,按照箱号进行展示、分析和服务。

三、政务大数据治理中存在的问题

在政务大数据的数据治理中,大部分很多记录均有位置相关信息,并且在分析中需要通过位置进行关联分析、缓冲区分析等等,但大多数情况下,位置信息均为文字信息,表述也不准确,存在大量简称、别名、口语化的名称。有些系统在录入位置信息时,使用了当地的标准地址编码库,记录的位置的经纬度,但由于经纬度均为浮点数据,在对空间位置进行关联分析时不方便,虽然可以用一些GIS类空间分析算法,但效率也比较低;有些城市通过使用社区、小区等名称进行关联分析,但由于大量存在临近位置可能跨区县、社区的情况,人为造成割裂,把本该分析出的关联信息丢失掉。

随着各城市数据汇聚的越来越多,数据的容量呈几何增长,各省也在建设大数据平台,数据量都是巨大的。如此巨量的数据给关联、分析、统计都带来的巨大的挑战,特别是基于位置的关联分析,而北斗网格码作为二进制整型编码,在位置的关联分析、缓冲区分析等方面计算性能方面有百倍的增长,可大大节省计算资源,提升计算效率。

四、基于北斗网格码技术,实现数据网格化

现实世界中,管理的单位均为辖区管理,呈现按块或网格管理的特点,北斗网格码技术天然具备以块或网格的方式组织管理数据,因此以北斗网格码技术为基础,实现数据的块管理方式或数据的网格化,是大数据再组织再管理的重要基础。

近几年,随着各个城市大数据平台的建设,从不同委办局的信息化系统中汇聚了越来越多的数据,这些系统、数据都是基于各委办局的事权体系形成的,只能反应委办局事权体系内“人、地、事、物、情、组织”某一个或几个方面的信息,而城市管理与社会治理的精细化要求我们要能全面的、立体的掌握辖区内“人、地、事、物、情、组织”详细信息,并且能预判发展规律、特征,分析相关问题,预测发展方向,这涉及数据的析、关联与融合。各辖区领导也需要知道管理辖区范围内人地事物情,比如流动摊贩分布情况、超市分布情况,从而分析辖区商贸布局的合理性。对行业监管,也需要以某个行业数据为主,通过融合、关联相关行业数据,发现潜在的问题,比如我们通过把某个区域大量使用醫保费用的人员的居住地与其经常出入的医院、药店及经常出入的其他场合进行关联分析,通过把相关位置进行可视化落图,研判是不是在套取医保费用,如果发现此人医保费用支出很高,但经常出入健身场所或劳动场所,但很少到医院,就可以判断有人在套取医保费用。所有这些分析关联,都会用到位置信息,都需要通过空间的关联融合实现潜在问题的感知、预判。

同时这几年,数据的属地化管理趋势明显,各个城市、区县、乡镇也都是在自己辖区内进行管理,从城市到区县、街镇、社区、小区、楼栋、单元,甚至部件都是一个具体的管理单位,都有自己的数据,部件比如消防栓有压力传感数据产生,各单元有用电量、用气量、用水量数据产生及实际居住人口数据产生,楼栋有人员出入数据产生、有房屋形变及沉降数据产生,小区有实时流动人口汇总数据、小区出入信息,每个层级、每个管理单位都有各类事件、活动、项目等数据产生,这些数据无不带有区域属性,而相关区域也具备了“块”与“网格”的特点,在这个块或网格上就聚集了大量的相关数据,这些数据因为距离的相近而产生相关性,因此很有必要把数据根据其物理产生地点进行入格入块,这就是数据网格化的具体思路。数据网格化,有利于数据的属地化管理,便于实现数据的属地监管。

数据的网格化后,可以方便把各个数据按其产生来源归属到不同的管理块中,形成块数据,比如我们可以根据数据产生的位置,通过北斗网格码技术进行打码操作,赋予这个数据以位置网格,相当于把这个数据放到一个合适的集装箱或物理单元网格中,这样同属于一个物理单元网格的数据就可以汇聚在一起,而不同大小的空间网格通过嵌套包含关系,就形成了数据间的彼此关联、包含关系,为数据分析、预判提供了分析基础,这些数据,通过空间的关联,就构成跨区、跨部门、跨层级的信息共享和联动模式,改变传统依赖数据交换共享的汇集模式,形成全市社会治理数据资源统筹利用、共建共享体系。“块数据”被广泛认为是大数据时代真正到来的标志[3],以北斗网格码构建好块数据,是进行大数据分析的基础工作。

通过把从各委办局汇聚的条数据,以北斗网格码技术,形成块数据,实现数据的按块组织与管理,其最大优势是实现城市管理与社会治理工作单元细化。将庞大的数据资源进行融合入块、細化,落到行政区划、街道、社区、基础网格、社区,做到地图、网格、网格内数据与相关人员通过空间块的自动关联,实现网格数据与部门专业业务系统的共享。

五、实现数据网格化的具体步骤

当前各地大数据平台已经汇聚了大量的来自各委办局的条数据;同时还有大量的数据,源源不断的从各委办局汇聚到大数据平台。对存量数据,由于各委办局信息化系统均各自建设,对位置相关字段的录入时,一般采用手工文本录入的方式,导致录入的地名信息五花八门,与标准地址相差较远,对位置信息的空间化、网格化需要人工介入才能实现。从而给数据的网格化带来较大难度,为方便各类口语化、简称、带有指向性特征的位置信息能快速实现空间化与网格化,建议同步采用商用地名地址引擎与政府标准地名地址引擎相结合的方法,互为补充,实现位置信息的空间化。在商用地名地址引擎方面,建议采用大型物流公司的地名地址引擎,通过这类引擎的名称匹配、语义识别等功能实现位置的空间化与网格化。

对增量数据,建议在各委办局业务系统中大力推广地名地址引擎的使用。

首先对目前各地市的地名地址引擎进行适当改造:

1、对每一个地名地址,都自动对应一个北斗网格码;

2、地名地址要到单元、部件,注意一定要到部件(即所有的城市管理对象,都通过地名地址引擎管理起来);

3、建立地名地址引擎的更新机制,当地名地址发生变更,部件的位置信息发生变更后,相关位置信息连同对应的北斗网格编码,都同步到地名地址引擎数据库中。

在每个城市搭建符合上述功能的地名地址引擎,此引擎通过SaaS服务方式为各委办局的业务系统提供地名地址服务,这样在委办局录入位置信息时,自动就带入了位置所对应的北斗网格码。

按上述方式对各委办局的业务系统的位置信息录入模块进行改造后,委办局业务系统汇交到大数据平台的业务数据就自动具有了精准定位的北斗网格码编码,从而无需再进行位置信息的空间化、网格化操作。

六、网格数据化的价值与意义

通过数据网格化,使数据都带有了北斗网格码编码,我们就可以按管理对象的范围,实现管理网格的数据化。基于北斗网格码引擎的高效处理能力,可以随时查看每个网格内汇聚的各类数据,也可以按业务属性分层显示各类数据,比如某一社区内流动人口的分布情况,用电量异常用户情况,用水量异常用户情况,社区内发生各类案件及分布情况,实现辖区管理人员一图知全局。

数据网格化与网格数据化模式,为政务大数据的组织管理提供了新的思路,为大数据的空间分析提供基础。

参考文献:

[1]郑圣培,基层信息化建设的思路与方法,大科技[J]

[2]程承旗,北斗网格码及其应用方法,第八届中国卫星导航学术年会

[3]大数据战略重点实验室.《块数据一大数据时代真正到来的标志》[C].北京:中信出版集团,2015

作者简介:郑圣培,男,1972-06,汉,山东莱芜,本科,中级;研究方向:智慧城市建设

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!