基于空间抽样的上海市GlobeLand30 2020数据精度评估

时间：2024-05-22

贺超，张景雄，万月，杨文静，杨蕊宁

（1.武汉大学测绘学院，湖北武汉 430079；2.航天科工智能运筹与信息安全研究院（武汉）有限公司，湖北武汉 430048；3.山东师范大学地理与环境学院，山东济南 250358）

GlobeLand30数据2020基准年生产应用到的影像数据源丰富，对其进行科学合理的质量评价具有理论研究和实际应用的重要意义[1-3]。因此，本文针对土地覆盖数据的特点，考虑匀质区和异质区对数据质量评估的影响，以上海市数据为研究对象，应用顾及空间异质性的类别异质性空间抽样方法，结合同时相的高分辨率参考影像，对数据进行精度评估分析，供数据生产者和使用者参考[4-12]。

1 精度评估方法

1.1 抽样设计

采用类别异质性分层抽样方法，划分匀质层和异质层的原则为基于类别占优原则。统计各类别像素3×3邻域内的所有类别，类别中心像素在邻域内占比大于4个的像素划为匀质，小于等于4个的像素划为异质，得到匀质和异质层。该方法考虑匀质区和异质区的区别，将各类别划分为匀质层和异质层，在同类别区域内按层分别布设样本。针对类别数据划分匀质/异质层，在所得的每个层（设为h）中，样本的精度可表示为：

式中，nh为层内样本总数，

层内样本方差sh为：

参照文献[13]中的样本量估计模型所获得的分层抽样样本量计算公式进行样本量的确定。首先通过预采样的判读结果计算各个类别的样本层内方差，样本总量n为：式中，Z1-α/2为正态分布的分位数；d为定义的误差限差；Wh为每一层的面积占比。样本在各个层内的数量分布可由内曼分配获得，内曼分配可使得总体精度的估计值方差达到最小，其中各层的样本像素个数为：

按照内曼分配获得的样本量受面积占比影响较大，当某个地物类别面积占比较小时，获得的样本量往往较小。Hay[14-15]等在文献中给出建议，当区域内土地覆盖类别层数较多且小于12时，每个层的最小样本容量不能低于50。因此，需要对理论样本量根据该准则进行重新调整。确定样本量之后，在层内随机布设样本。

1.2 响应设计

精度验证以像素为最小评估单元进行参考数据采集。参考数据选择同时相或临近时相的Google Earth高分辨率影像数据、Landsat数据，且主要时相优先为2020年生长季，避免对草地和耕地等类别的误判。每个评价单元由3个专家按面积占优原则分别进行判读，并根据参考影像的色调、纹理、位置、形状等特征以获取参考数据。过程中，将该像素边界生成30×30矢量框，在矢量框外叠加像素中心300 m的矩形框便于判读（如图1）。每个专家指定唯一的类别标签作为该像素类别，取2个专家及以上判读的类别为最终类别。

图1 样本单元示例(耕地)

1.3 精度估计

分类数据的精度评估方法主要是应用混淆矩阵来计算总体精度（OA）、用户精度（UA）以及制图精度（PA），总体精度是指正确分类的类别像素数占总抽取的像素数的百分比，其估计方式为:

式中，N为像素总量，其方差估计为：

式中，Nh为每层像素总量，用户精度及制图精度应用比率估计进行估计[16]，用户精度是指在分类图上，落在该类别上的像素点被正确分类为该类别的比率，生产者精度是指该类别的地面真实参考数据被正确分类的概率，表示为：

式中，估计用户精度时：

估计制图精度时：

估计方差表示为：

式中：

2 实验分析

2.1 实验数据

本实验对上海2020基准年的GlobeLand30数据进行精度评估。上海是长江三角洲冲积平原的一部分，是我国的经济、金融、贸易中心，其地理位置为120°52′E～122°12′E，30°40′N～31°53′N之间，面积约6 340 km2。数据共包含耕地、森林、草地、灌木地、湿地、水体、人造地表7个类别，其中人造地表和耕地占比最多，分别占41.87%和40.68%。灌木地类别为稀少地类，且分布非常集中，面积占比低于0.1%，因此不纳入本文评价范围。各地类的分布如图2所示。

图2 上海GlobeLand30 2020土地覆盖分类图

2.2 预采样及样本量调整

对上海6个主要类别进行匀质/异质层划分，划分结果如图3所示，得到数据包含12个层。为确定抽样总样本量，需进行预采样以计算各层方差。按照文献[13]中的样本量设定，每个类别选取30个样本进行判读，判读的各层层内方差作为样本量计算的方差。取α为95%，d为0.01，按照公式(3)进行抽样12个层的总样本量理论值为2 024，按每个类别不低于50个样本像素，结合各层占比，对样本量进行重新分配和增加，样本量如表1所示。

图3 上海GlobeLand30 2020土地覆盖重分类图

表1 预采样结果及样本分配

2.3 实验结果及分析

根据布设样本产生2 500个样本判读单元，解译专家按照设计中的方式进行样本单元的真实性检验，并记录相关信息。得到的结果进行交叉制表，并以混淆矩阵的形式对分类结果和真实结果进行表示。上海2 500个验证点的混淆矩阵如表2所示。

表2 上海GlobeLand30混淆矩阵

根据混淆矩阵结果显示，各个类别的匀质区的精度总是高于异质区的数据精度。根据层内精度统计结果可知，人造地表类别的匀质区和异质区的差别最大，其次是水体和耕地。水体匀质层和耕地匀质层精度较高，分别达到了84.72%和78.97%。人造地表异质区的精度最低，仅有45%。通过混淆矩阵可进行总体精度、用户精度及制图精度的估计。其中，用户精度和制图精度的统计结果如表3所示。

表3 各类别用户精度及制图精度

从用户精度来看，耕地、水体、人造地表精度较高，均超过了70%。耕地的用户精度最高，为76.72%。草地的用户精度最低，因为在土地覆盖分类过程中，草地、耕地等地类因纹理相似而容易出现混淆的情况。人造地表地类的制图精度最高，为85.11%，表明该类别提取较为成功。草地制图精度最低，仅为15.07%，一方面是因为在利用比例估计时，草地为稀有地类(面积占比小于2%)，估值容易受其他地类错分为草地而受到影响；另一方面，在判读过程中，上海的城乡结合处因混合像元问题而导致的人造地表和其他地类，尤其是草地混在一起难以区分，在分类时容易导致错分。应用加权估计法对区域的总体精度、异质区及匀质区的总体精度进行估计。得到上海的匀质区的精度为78.92%，异质区的精度为50.65%，区域总体精度为77.89%。其中，匀质区比异质区的精度高28.27%，异质区的精度较低，数据质量较差，佐证了在异质区和匀质区布设样本的必要性，以及可使得样本分布更符合精度的分布模式。

3 讨论与总结

土地覆盖数据在制图过程易受到空间异质性影响而导致数据存在不确定性，在精度验证中估计空间异质性的抽样方式可顾及数据精度的空间格局，对土地覆盖精度验证有一定助益。针对GlobeLand30全球土地覆盖数据上海域，应用考虑空间异质性的抽样方法，在匀质区和异质区进行样本布设，采集了时相相近的参考数据，通过专家解译的方式进行样本的真实类别检核，并通过基于混淆矩阵的指标对上海的数据进行了精度评定。实验结果表明，2020基准年上海的6个类别2 500个样本总体精度为77.89%，基本反映了上海地区2020年的土地覆盖状况。异质区精度为50.65%，匀质区精度为78.92%。划分匀质层和异质层可助于样本分布符合精度的分布模式，且匀质区和异质区的精度差异较大，在数据质量评估时可关注该问题。未来该评价方法可应用于全球范围的土地覆盖数据产品，也可在大范围内探索更高效的空间抽样方法，在生产中考虑数据的错分模式，以提高未来土地覆盖数据生产的精度。