时间:2024-09-03
中国地质大学(北京) 王君豪 张浩然 时广升 梅 钢
遥感影像中提取道路目标对城市发展、乡村建设等具有重要意义。相比于日常地图,遥感影像智能提取技术能更完整准确地识别出农村的道路情况。本文基于深度学习理论,使用二值语义分割网络从遥感影像中提取出路网,并将路网应用于石家庄农村新冠疫情分布中,使用空间自相关分析路网与疫情分布的相关性。结果显示,路网提取结果具有更高的准确率,疫情的分布特征和传播途径与路网均有很强的正相关性。本文使用遥感影像分析的路网,具备一定的实际应用价值,可为采取针对性的疫情防控措施提供理论依据。
近年来,随着人工智能的发展,深度学习已经成为了研究热点。作为人工智能中发展最快的技术,深度学习在遥感影像分析领域取得了令人满意的结果。道路作为遥感影像中的重要地物,其智能提取技术在抗震救灾、交通规划、水利工程等方面都具有重要的应用价值。
新冠肺炎疫情传播性强,严重程度高,已成为世界上许多国家和地区的流行病,其传播具有流行病学特征。自去年武汉疫情以来,石家庄最近又爆发了比较严重的新冠疫情,引起了全国上下的关注。为了分析此次 疫情分布特点,本文将遥感影像智能化提取的路网应用于疫情传播中,分析路网与疫情分布的相关性。
传统路网提取方法大致可分为基于像元方法和面向对象方法两类。前者在确定基本像元后,通过光谱分析识别分割出路网,后者则是对道路整体进行建模,从图像中识别出路网。两种传统方法虽相较人工提取方法有效率高,成本低等优势,但提取结果精准度仍不太理想,且对于城市道路标记较为准确,而对农村道路识别欠缺。
本文基于深度学习技术,从遥感影像分析出的农村道路网具有更完整更准确的特点,这种遥感影像智能提取方法可以高效快速获得所需道路信息,更能反映实际的农村道路分布情况。在本文的工作中,我们制作了遥感影像数据集,使用语义分割神经网络进行道路提取任务的实验,并将实验结果应用于新冠疫情,使用空间自相关分析得到疫情分布与路网的相关性。
实验图像来源于图新地球卫星遥感影像,选取河北石家庄正定国际机场及其周边村庄8.741km×11.438km的矩形区域,实验部分区域如图1所示。图像包括道路、停车场、田地、房屋等多种场景信息。
图1 实验区域部分遥感图像
石家庄正定国际机场附近的村庄新冠肺炎疫情资料来源于河北省卫生健康委员会,选取时间为2021年1月2日至7日。在该地区内新冠肺炎病例短时间内迅速增多,达到了传染病聚集性疫情的标准。
(1)遥感影像道路提取:首先制作遥感影像数据集,采用自主人工标记标签的方式,将数据集中的道路进行标注,形成精确度高的道路数据集标签,用于神经网络训练。接着,采用D-LinkNet语义分割神经网络对数据集训练、测试,得到道路提取结果。使用Python将提取小图拼接,对机场附近道路情况进行可视化展示,得到该区域的路网。
(2)相关性分析:采用空间自相关分析方法。利用全局空间自相关系数(Moran's I)分析疫情在空间上是否具有聚类特征,以Z检验和P值进行显著性评价。局部空间自相关(Local Moran's I)用于分析不同空间单元与邻近区域空间差异程度及其显著水平。对于分析正定机场附近村庄疫情分布特征,该方法具有良好的适用性及研究价值。
2.1.1 数据集制作
获取卫星遥感影像后,使用ArcGIS软件校正图像的地理坐标,使遥感图像及其提取结果都带有精确的地理坐标,方便后续应用。为了便于模型训练,本文对原始图像做了裁剪处理,得到1862张卫星瓦片数据,图像分辨率为256×256。
图2 图像裁剪小图
本文使用的是开源图像标注工具Labelme,它基于Python语言,使用QT开发界面,可以创建定制化标注任务或执行图像标注。本文为二值语义分割问题,只对道路这一个对象进行标注即可。软件界面如图3所示。为了标注简单,选取的标注底图为原始大图,标注完成后裁剪为小图并与遥感图像小图相对应。标记结果为png格式图片,白色道路区域像素值为255,其余区域像素值为0。道路标记结果如图4所示。到此,本文所用的数据集制作完成。
图3 Labelme界面
图4 标记结果
2.1.2 模型训练
本文使用D-LinkNet语义分割神经网络,该网络采用编码器-解码器结构、空洞卷积和预训练编码器进行道路提取任务,在高分辨率遥感影像识别任务中可以得到良好的道路提取结果。
深度学习模型训练需要大量的计算能力才能高效运行,因而道路提取实验对电脑硬件要求较为严格。本文的操作系统为Windows10环境,使用GeForce GTX 1060显卡,Anaconda配置的Python3.8环境,配置Pytorch1.7.1深度学习框架用于模型训练。详细实验参数如表1所示。
表1 实验参数详细信息
本文的数据集分成1000个训练图像,862张测试图像。模型训练中,设置batch size=4,total epoch=300,学习率最初设定为0.0002,并且每运行3个epoch学习率减少5%,使用BCE(二进制交叉熵)+Dice系数作为损失函数,选择Adam作为优化器。
2.1.3 实验结果及分析
模型训练完毕,即得到遥感图像道路提取模型。将待测试图像输入,即可输出道路提取结果。部分提取结果如图5所示。
图5 部分道路提取结果
使用Python编程将小图拼接为大图,得到路网如图6所示。从该图中,可以直观地看出石家庄正定机场及其附近村庄的道路分布情况。该区域交通便利,路网复杂,人员流通频繁,这为疫情快速传播提供了条件。
图6 拼接后的路网
将路网与日常地图(以百度地图为例)对比分析,可发现路网能更完整地识别出农村的道路特征,真实地还原实际的道路情况。百度地图虽然能够精准显示城市的道路,但对于农村间道路的标记却不够完整。从图7可以看出,百度地图基本没有对农村小路的标记,这说明了遥感影像道路提取的优越性,从而可以更精确地应用于后续的疫情与路网相关性分析中。
图7 百度地图与路网对比分析(左为百度地图,右为路网)
2.2.1 疫情分布概况
图8 机场与出现病例村庄的位置关系
石家庄正定机场附近,截至1月7日,有8个村庄出现了新冠肺炎病例。其中小果庄村,刘家佐村和南桥寨村病例较多,分别为41例,35例和19例,其余5个村庄感染病例均为1至2例。各村疫情病例数如表2所示。
表2 各村疫情每日新增病例数
通过对机场附近村庄新冠肺炎感染情况的可视化呈现,可看出该地区感染病例具有很强的聚集性。
2.2.2 全局空间相关分析
采用空间自相关系数定量地描述各村庄疫情病例数在空间上的相关程度与分布特征Moran's I系数取值范围为[-1~1],当取值>0时表示空间呈正相关,越接近于1表示空间聚集性越强;当取值<0时表示空间呈负相关,越接近于-1表示空间差异性越大;当取值=0时表示空间不相关。
显著性检验:采用标准化统计量Z值,P值来判断全局空间聚集性是否具有统计学意义及分析统计学特征以病例最多的小果庄村为例,计算得到其各指标值:Moran's I=0.1287>0,Z=2.4353>1.96且P=0.04<0.05。表明该区新冠肺炎感染明显为空间正相关分布,且呈聚集性分布,聚集性具有统计学意义。
2.2.3 局部空间相关分析
采用局部空间自相关性系数(Local Moran's I)分析:
根据Local Moran's I可分出4种类型空间聚集模式。Local Moran's I小于0时表示村庄和其周边村庄之间空间差异性大。分为低-高聚集:感染人数低于平均值的地区(低值地区)被病例高于平均值的地区(高值地区)包围;高-低聚集:高值地区被低值地区包围。Local Moran's I大于0时表示村庄和其周边村庄之间空间差异性小。分为高-高聚集:高值地区被高值地区包围;低-低聚集:低值地区被低值地区包围。
局部自相关分析显示,机场附近村庄新冠肺炎疫情分布主要表现为空间正相关,存在高—高、高—低和低—低三种聚集形式,分别位于刘家佐村周围聚集区,小果庄村周围聚集区以及吴村铺村周围聚集区。小果庄村为高度聚集区,附近路网分布密集,人流量大,疫情分布与路网具有很强的相关性。
2.2.4 疫情传播与路网相关性
经过调查,小果庄村存在若干名机场务工人员,在1月2日前在两地有过往返经历,而机场人流量大,属于病毒传播高风险区,这可能是导致小果庄村首先出现大批量感染患者的关键原因。
以小果庄村为中心,疫情传播与路网具有很强的相关性。小果庄村成为周围村庄的传染源,以其为中心有两条十字交叉的道路,连通附近村庄,南北向连接刘家佐村、南桥寨村以及北桥寨村,东西向连接牛家庄村和东桥寨村。
图9 以小果庄村为中心的两条十字交叉道路
由于交通便利,人员流通频繁,且人口密度较大,新冠疫情传播迅速。南北向道路流量较大,这可能是刘家佐村和南桥寨村感染人数增长过高的原因。三个村庄及其附近区域都是重点聚集区,需重点关注,加大疫情监测强度,并提前采取针对性防控措施;在非热点地区也应保持疫情监测的敏感性。
本文对遥感影像中道路目标的提取进行分析,旨在得到更准确的提取结果。基于深度学习技术,使用语义分割网络对自制的遥感影像数据集训练、测试,得到了石家庄国际机场及其附近的路网分布图。而后,将路网应用于疫情分析中,使用空间自相关分析路网与疫情分布的相关性。结果显示,机场附近村庄疫情呈空间正相关分布,并具有典型的聚集性,并以小果庄村为重度聚集中心。本文使用遥感影像提取路网,可客观全面反映农村道路信息,具备一定的实际应用价值。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!