时间:2024-08-31
宿殿鹏,黄昱,阳凡林,2,赵荻能,杨安秀,2,刘骄阳
1.山东科技大学 测绘与空间信息学院,青岛 266590;2.自然资源部海洋测绘重点实验室,青岛 266590;3.自然资源部第二海洋研究所 自然资源部海底科学重点实验室,杭州 310012
海底底质类型是重要的海洋环境参数(赵玉新和赵廷,2020),是进行海底科学研究的基础。随着海洋牧场建设、海洋环境监测、海洋工程应用及海底资源调查等领域发展,亟需海底底质分类为其提供数据基础。因此,探求合理、有效的海底底质分类方法对于海上环境保护活动和海洋学科建设等方面具有重要的实际应用价值。
目前,海底底质分类方法大体可分为实地取样观测和声光遥感探测两类(刘永明 等,2017)。其中,传统的实地取样方法精度高,但效率低、成本高,因此该方法难以实现大范围高密度的海底底质取样(徐超,2014)。相对于取样方法,海底底质遥感手段具有更高探测效率,且主要分为声学遥感与光学遥感两种方式。
声学遥感方面,侧扫声呐作为高分辨率的水下声学成像设备,能够快速获得大范围、高分辨率的海底声学图像,在海洋湖泊等水下目标探测中应用广泛(Ge 等,2021)。陈佳兵等(2017)基于珠江口侧扫声呐图像数据,采用灰度直方图和灰度共生矩阵方法提取特征向量,采用PSO-BP 方法,实现了对砂、礁石和泥3 类底质样本的分类,其分类精度达到90%。然而利用声呐图像仅提取了纹理特征,分类特征空间考虑不够全面,进而影响分类精度,需要结合其他的特征提取方法提高底质分类的适用性。另外,多波束探测作为声学海洋遥感的重要技术之一,也经常用于海底底质分类(阳凡林 等,2021)。唐秋华等(2014)基于多波束反向散射强度数据,运用改进的学习向量量化神经网络,实现对海底粉砂质砂、黏土质砂以及砂—粉砂—黏土3种底质类型的快速自动分类识别,相比改进前分类精度有所提升。然而船只在浅水区域易发生触礁、搁浅等危险,其系统应用受到一定限制(刘焱雄 等,2017)。
海洋光学遥感方面,Ayustina 等(2018)运用Landsat 8 获取的影像和实地数据实现对浅海区域碎石、海草混合沙、珊瑚礁混合碎石、碎石混合死珊瑚、沙混合碎石和沙混合海草的分类,OA 分类精度为80%,分类精度相对较低。机载LiDAR 测深ALB(Airborne LiDAR Bathymetry)是一种主动式的海洋探测技术,在浅水区域具有测量精度高、测量效率高、机动性高、测量连续性等优点(刘焱雄 等,2017)。Velasco 等(2014)基于辐射传输模型矫正机载LiDAR 测深强度信息并生成强度图像,利用K-means 方法对强度图像进行无监督分类,与验证数据相比分类效果较好,但分类精度受限于单一强度特征数据。针对该问题,Eren等(2018)基于机载LiDAR 测深数据提取了11 维波形特征,并利用SVM 监督分类器进行分类,结果显示沙子和岩石分类的总体分类精度为96%,细砂和粗砂分类的总体分类精度仅为86%,说明仅利用波形特征进行分类还不够全面。为了更全面的利用特征信息,Su 等(2019)对分类特征空间做了进一步扩展,利用机载LiDAR 测深系统波形特征和地形特征数据建立特征向量,并将其输入到支持向量机中,将底质分为珊瑚礁和其他两类,OA 精度达到了93.57%。综上所述,多维特征向量往往包含更多特征信息,其分类精度要比单一特征的分类精度高,但特征冗余也会影响分类效果,因此分类之前进行特征优选就显得尤为重要(戴莫凡 等,2022)。
高维特征信息不仅会增加模型构建的复杂度,还会降低机器学习算法的性能,造成“维数灾难”和“过拟合”问题(陈科,2021;乔纪纲 等,2011)。特征优选可移除冗余的干扰特征,有效降低高维数据的维数,从而提高分类的准确度。臧卓等(2014)利用PCA 算法对乔木树种的高光谱数据进行降维与分类,实验结果表明,适宜的主成分个数可获得较高的分类精度,然而无监督PCA 投影原则使得不同类别的数据混合在一起难以区分。为找到数据中具有判别性的维度,不同类别尽可能区分开,杨明莉等(2020)利用线性判别分析法对高光谱数据降维处理,相比特征降维前分类精度有所提高,然而线性判别分析法不适合对非高斯分布样本进行降维且线性判别分析法最多降维到比类别数少1的维数。因此,找到合适的特征选择方法至关重要。
针对海底底质分类中存在的特征冗余问题,提出了一种顾及波形和地形特征优选的机载LiDAR海底底质分类方法。通过提取9 类波形特征变量(偏态、峰度、反向散射截面系数、残差振幅、残差波宽等)和9类地形特征变量(粗糙度、高斯曲率、高程熵、变异系数、凹凸系数等);基于Relief-F方法构建特征优选模型,设置贡献率阈值,精简18 类特征中贡献率低于阈值的特征;最后利用SVM、随机森林、BP 神经网络分类器,将底质划分为珊瑚礁、砾石、砂、植被和海岸带5类,并对分类结果进行精度评定与分析。
波形数据预处理主要包括波形去噪和波形拟合两部分。数据预处理旨在于更完整和精确地提出波形回波信号各个组分的详细信息(Lai 和Zheng,2015)。
(1)波形去噪。ALB 系统接收的回波信号是海面回波信号、水体后向散射信号、海底回波信号、背景噪声等回波信号在时间轴上能量的叠加(Abdallah等,2012)。实测波形回波信号各个组分如图1所示。公式如下:
式中,PT(t)为ALB 系统接收的总回波信号,PS(t)为海面回波信号,Pc(t)为水体散射信号,Pb(t)为海底回波信号,PBG(t)为背景噪声,PR(t)为传感器内部噪声,t为时间。因此,需要在特征提取前对含噪波形信号进行去噪处理,本文利用小波自适应阈值去噪方法进行ALB波形去噪。
(2)波形拟合。波形拟合是机载LiDAR 测深数据处理的重要环节,是有效提取波形特征的前提。本文基于分层异构算法分别对水面、水体、水底波形进行分解(亓超 等,2021,2019)。
(1)波形特征提取。本文基于2.1 节波形拟合结果进行9 类波形特征的提取,其示意图如图2所示。
图2 波形特征变量分布图Fig.2 Schematic illustration of sea bottom waveform variables
1)振幅(Peak amplitude):回波能量的最大值,表示回波强度(Lee 等,2001)。如图2(a)所示,波形最高处的能量值。
2)波宽(Pulse width):回波波形的平展距离。如图2(a)所示。
3)半幅波宽(Full width at half maximum):如图2(a)所示,回波能量为振幅的一半时所对应的波宽(Hou 等,2019)。
式中,GSE为高斯拟合时波形的标准偏差。
4)波形面积(Area):海底波形响应过程中激光脉冲能量的积累。当回波高度为振幅高度的20%时,两者之间对应的面积S,如图2(a)所示。
式中,Si为第i段回波波形对应的采样面积。
5)偏态(Skewness):对回波能量分布的偏移程度,如图2(b)所示。用式(4)来计算回波能量的分布趋势对称性的量度(Joanes和Gill,1998)。
式中,Pi为回波波形采样点的能量,为波形采样点处回波能量的平均值,n为采样点个数。
6)峰度(Kurtosis):表示回波波峰的尖锐程度,如图2(b)所示。由下式可计算出(Matsatsinis和Samaras,2000):
7)反向散射截面系数(Backscatter crosssection):如图2(c)所示,反映出海底水波和回波信号之间的有效碰撞面积(Alexander等,2010)。
式中,Ccal为校准常数,,R为激光发射器中心到海底的距离,βt为激光束发射角,P为振幅,W为脉宽,ρ为海底发射率。
8)残差振幅(Residual amplitude):是残差信号的振幅值。在75%峰值强度点处用于平均斜率拟合,所形成的多余线性回归与底部收益之间的面积作为残差信号,交点处的振幅值与底部收益点处的振幅值之差就是残差振幅(Li 等,2012),如图2(a)所示。
式中,PRES是残差振幅,PCL是交点处线性回归的振幅值,PCW是对应的底部收益点处的振幅值。
9)残差波宽(Residual pulse width):模拟底部收益率的线性部分顶部处的脉冲宽度,如图2(a)所示。
式中,WRES是残差波宽,WCR是右侧顶点处的脉冲宽度,WCL是左侧顶点处的脉冲宽度。
(2)地形特征提取。地形特征则采用局部二次曲面拟合算法进行提取。其主要步骤为:首先,设定拟合半径r,并基于LM 算法建立海底点的二次曲面拟合模型,根据拟合时间和拟合精度确定最优半径为2 m,进而得到最优半径下的最佳拟合参数;然后,根据最优拟合参数确定地形模型,依据表1 中的特征定义获取9 类地形特征数据。其中部分地形特征变量分布图如图3所示。
表1 海底地形特征参数表Table1 Description of sea bottom geometric variables
图3 部分地形特征变量分布图Fig.3 Schematic illustration of partial geometric variables
(3)特征优选模型构建。为精简并优化特征空间,分类之前需要进行特征优选处理,本文采用Relief-F 算法进行特征优选。基本思想是为实验数据特征集中的每一个特征赋予不同的权重,随后遵循“聚集同类样本,离散异类样本”的原则迭代更新权值,即根据其权值大小进行排序,并设立阈值舍弃贡献率较小的特征,最后得到优选的特征子集(黄莉莉 等,2012)。
首先找出k个与任意特征xi同类的最近邻样本集合H,其中表示特征xi与H内各特征在特征集A上的差异量化表达为式(9):
式中,j=1,2,3,…,k。然后找出与xi不同类的k个最近邻特征样本集合M(c),其中n行1列表示特征xi与M(c)各特征在特征集A上的差异量化表达为公式(10)(张鸿,2012):
随机森林分类器构建,首先利用Bootstrap 随机有放回的选取M个训练集且每个的大小约占原始数据的三分之二;然后训练每个样本集为单个决策树,根据Gini 系数的最小原则随机选取最优特征进行分裂,直到该节点训练样例都属于同一类;最后,按照决策树投票结果决定最终分类结果。随机森林分类输出判别式如下式所示:
式中,H(x)为最终分类结果;hi(x)表示单一决策树分类结果;argmax 表示函数取得最大值时的参数值;Y表示目标向量;I()为示性函数(表示当集合内有此数时该函数值为1,无此数时该函数值为0)(陈进 等,2020)。
本文是顾及波形特征和地形特征优选的海底底质分类,具体流程包括:
(1)对原始回波信号进行小波去噪,对原始点云进行点云去噪处理;
(2)对去噪后的回波信号进行峰值探测,然后分别利用高斯函数拟合水面反射回波,利用韦伯函数拟合水底反射回波,利用双指数函数拟合水体反射回波,进而提取出波形特征;
(3)对去噪后的点云数据采用LM 算法建立二次曲面拟合模型,迭代寻优获得最优化的拟合参数,提取出地形特征;
(4)基于提取的波形和地形特征,利用Relief-F 算法计算其贡献率排序,保留贡献率较大的特征;
(5)利用随机森林分类器提取出珊瑚礁、砂、海岸带、砾石、植被5类底质类型。
实验所用数据采集自中国西沙群岛永乐环礁西北侧的甘泉岛水域,南海西沙群岛区域。该岛是典型的珊瑚岛且岛内环境相对比较原始,拥有丰富的海底底质类型,有利于开展浅水环境下的海底底质分类研究。
实验中机载LiDAR测深数据由Optech Aquarius ALB 系统采用532 nm,70 kHz 绿激光采集,飞机飞行高度为300 m,激光扫描最低角为15°,激光发射角为1 mrad,脉冲宽度为8.3 ns。经数据预处理后,共获得1.8×107个海底点,海底点云密度约为4 pts/m2。同时采集了部分高清数码相片,分辨率5 cm,以此为参考进行训练样本和验证样本的选择,样本采集区域如图4(a)A区所示。
图4 研究区域图Fig.4 Study area
(1)波形和地形特征提取结果。根据波形和地形特征的提取方法,对ALB数据进行9维波形和9 维地形特征变量的特征提取,波形特征提取结果如图5所示,地形特征提取结果如图6所示。
图5 波形特征提取结果图Fig.5 Result diagram of waveform feature extraction
图6 地形特征提取结果图Fig.6 Result diagram of terrain feature extraction
(2)特征优选结果与分析。采用Relief-F 算法对9 类波形特征和9 类地形特征,根据其贡献率值由高到低进行排序。依据选取的特征输入到分类器内分类精度最高的原则,人工设置贡献率阈值为0.0048,贡献率小于此阈值的特征被去除。
如图7 所示,特征优选后,保留了13 类特征,其中波形特征有4个,分别是波宽、半幅波宽、波形面积、后向散射截面系数;地形特征有9个,分别是高斯曲率、坡度、水深标准差、平均偏差、高程熵、海底起伏度、粗糙度、凹凸系数、变异系数。进一步分析可知:地形特征贡献率占3/4 左右,证明了地形特征对于底质分类的重要性,但仅仅使用地形特征缺乏详细的空间尺度过程信息,需结合波形特征,波形特征约占比1/4,证明波形特征在此特征空间中对分类的有效性。
图7 特征优选结果贡献率分布图Fig.7 Distribution diagram of contribution rate of feature optimization results
如图9(a)所示,将实验区域划分为5种底质类型,并从实验区域A 中选取总训练样本,其中珊瑚礁点8601 个、植被点8104 个、海岸带点3976个、砂点8727 个、砾石点6323 个。在分类过程中,随机选取总训练样本的70%、20%和10%分别作为训练样本、验证样本和测试样本,3 个样本集之间没有重叠的点。为了减小分类特征过多或过少对分类精度产生的负面影响,本实验采用Relief-F 算法对18 类波形和地形特征进行特征优选,并设计对照实验对比分析。
由图8 可知,特征优选后,3 种分类方法的总体精度均有所提升,表明使用Relief-F 算法能够减少特征冗余度带来的不利影响,进而达到提高分类精度的目的。
图8 特征优选前后精度对比图Fig.8 Comparison diagram of accuracy before and after feature optimization
将最优的13 类特征输入到SVM,BPNN,RF 3 种经典分类器算法中进行分类,并利用用户精度、生产者精度、总精度OA 和Kappa 系数对分类精度进行精度评定,结果如表2所示。
表2 特征优选后分类精度对比结果Table2 Comparison of classification accuracy
由表2 实验结果分析可知,实验比对3 种分类方法中,随机森林分类器泛化性强且分类精度最高,总体精度达到95.36%,Kappa系数为0.94。
最后基于上述分类过程中训练好的SVM,BPNN,RF 共3 个分类器模型,对测区A 进行预测,预测结果如图9(b)、图9(c)、图9(d)所示,RF 分类器的预测结果与图9(a)最为相近;其次为SVM,BP神经网络预测结果较差。
图9 实验区域预测结果图Fig.9 Diagram of prediction results in the experimental area
针对海底底质分类中存在的冗余特征问题,提出了一种顾及波形和地形特征优选的机载LiDAR 测深海底底质分类方法。将所提算法应用于实测机载LiDAR 测深数据,通过对分类结果进行精度评定与分析,得出以下结论:
(1)基于9 类波形特征和9 类地形特征变量,利用构建的特征优选模型进行特征优选。基于优选特征,利用3种分类器进行分类。实验结果表明Relief-F 特征优选模型减小了冗余特征对分类精度的负面影响,基于优选特征进行分类可获取更高的分类精度。
(2)为了选择有效的分类器,进行特征优选后,基于随机森林,SVM,BP神经网络3种分类器分别提取珊瑚礁、砂、砾石、海岸带、植被5 种底质。实验结果表明随机森林分类器的分类效果最好,OA精度和Kappa系数分别达到了95.36%和0.94。
通过本文顾及波形和地形特征优选的机载LiDAR 测深底质分类方法研究,相关成果能够为海洋工程等领域对海底底质分类需求提供有效的技术支撑。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!