时间:2024-07-28
谭兴龙 赵晓庆 张玉华 胡 洪
(1.中国矿业大学(徐州)环境与测绘学院;2.国土环境与灾害监测国家测绘局重点实验室;3.江苏省资源环境信息工程重点实验室;4.兖矿集团东华地矿建设分公司)
矿山高精度高程基准的建立是矿山变形灾害监测的基础、安全生产的重要保障。由于矿区地形条件复杂,坡度变化较大,采用常规水准仪测量工作量大,时效性差[1],难以满足复杂矿区高程快速测定的需求。随着全球定位系统(Global Position System,GPS)技术迅速普及,GPS已成为大地测量的重要手段,可以实现矿区高程的快速测定。但GPS高程是基于WGS-84参考椭球的大地高,实际应用中通常采用基于似大地水准面的正常高,它们之间的差值称为高程异常[2],因而精确地确定高程异常是将GPS高程应用到矿区高程测量的关键。目前,国内外常用高程异常计算方法有多项式拟合(Polynomial fitting,Polyfit)[3-4]、神经网络(Neural Networks,NN)[5-6]、支持向量回归(Support Vector Regression,SVR)[7]。支持向量回归的理论基础是小样本统计学习的结构风险最小化原则,基本思想是通过用内积函数定义的非线性变换将输入空间映射到一个高维的特征空间,在高维的特征空间中寻找输入变量和输出变量之间的映射关系[8]。本研究基于遗传算法(Genetic Algorithm,GA)选取支持向量回归算法最优参数,构建GPS测站坐标与对应高程异常的非线性映射模型,内插出其他各点的高程异常值。最后选取某矿区实测数据对算法进行计算分析,验证算法可行性。
假设训练数据集
式中,xi是第i个输入向量,yi是第i个标量输出,l是样本数。SVR回归的基本思想是利用满足Mercer条件的核函数将输入数据x映射到高维特征空间,并在该空间构造优化超平面f(x),
式中,ω为权重向量,b为偏置项。为求优化超平面,引入不敏感损失函数ε和惩罚参数c,根据Wolfe对偶理论,将参数ω,b的求解问题转变为最优化问题:
其中,Qmin为优化问题最优解;αi,αj,为非负拉格朗日乘子;i,j=1,2,…,l;α*∈ R2l。
式(1)属于凸二次规划问题,其可行域为空,所以一定有解[8]。设优化问题Q的最优解为
则
鉴于径向基函数在处理空间线性不可分数据时具有较好的效果,引入径向基核函数
将其作为式(1)中xixj的映射函数,则超平面回归函数为
值得注意的是,径向基核函数中控制半径的参数γ和惩罚参数c选取是否合理直接决定最优超平面的泛化能力和回归精度。
将参数γ,c表示为适于遗传算法求解的2个染色体问题,寻找其最优值,计算步骤如下。
(1)参数编码。为避免联系状态之间转换时可能出现逻辑混淆,采用二进制雷格码编码。
(2)生成初始群体。设定参数的取值范围0≤γ≤1 000,0<c≤100,随机产生染色体数量为20,变量数为2(即核函数参数γ和惩罚参数c),染色体用20位雷格码表示。
(3)基于交叉验证法和线性排序分配适应度函数值,计算个体适应度函数值。
(4)对个体进行遗传算子操作。采用适应度比例方法进行选择运算,以概率为0.7进行交叉运算,以概率为0.05进行变异运算,生成子代群体。
(5)判断是否满足终止条件(遗传代数达到100次),若满足则停止计算解码输出优化解,否则将子代染色体代替父染色体转入步骤(3)。
根据矿区GPS测站分布,选取部分均匀分布的站点作为支持向量回归算法的训练数据,基于遗传算法自动选取支持向量回归训练最优参数,构建适用于训练数据的支持向量回归模型,将剩余GPS测站数据作为预测数据,采用训练好的支持向量回归模型预测出回归结果。同时基于多项式拟合和神经网络算法分别对预测数据进行计算,通过对比残差,分析3种算法优劣。数据处理流程图见图1。
图1 数据处理流程
在沿江某矿区布设GPS控制网,经后处理得到无粗差且同精度的GPS高程点32个,平均边长为1.2 km,测区面积约50 km2,按国家GPS网B级要求实测,同时采用二等水准联测得到各GPS点的平面位置和高程异常,选择第1~第20个平均分布的点作为训练样本,选取第21~第32个点作为测试样本。数据见表1,其中X,Y为地方坐标,ζ为高程异常。
表1 原始数据
为避免数据较大影响回归效果,将样本数据做归一化处理。基于遗传算法对训练数据计算支持向量回归最优参数γ和c过程见图2。迭代18次后收敛到均方差精度为0.001 m,收敛后支持向量回归最优参数为:核函数宽度γ为0.55,边界系数c为455。
图2 遗传算法参数寻优△—最佳适应度;○—平均适应度
采用遗传算法寻优后的参数,对训练数据进行支持向量训练构造回归模型,产生13个支持向量,得到如式(2)所示的回归函数,其中权重向量α*iαi的值见表2,偏置项b为0.148。
表2 支持向量回归参数
经多次验证,采用 a0,a1,a2,a3,a4,a56 个参数的二次多项式拟合对训练数据拟合效果最好,基于最小二乘法拟合后得到拟合函数
其中,拟合多项式参数 a0,a1,a2,a3,a4,a5的值分别为 -82.01、3.254 ×10-4、-1.399 ×10-3、-2.984×10-10、2.309 ×10-9、8.729 ×10-10。
径向基函数神经网络具有全局最优和最佳逼近性能。令神经元的最大数目为20,径向基函数的扩展速度为 5,训练截止均方误差为 0.01,采用RBFNN算法对训练数据进行学习训练。
将训练数据、测试数据分别代入遗传算法辅助的支持向量回归(GA-SVR)、多项式函数(Polyfit)、径向基神经网络(RBFNN)模型预测高程异常值,并与真值对比计算残差,见图3。
图3 残差对比□—Polyfit;●—RBFNN;○—GA -SVR
支持向量回归算法、多项式拟合和径向基神经网络模型分别对实测数据拟合精度比较见表4。结果表明:3种方法的预测精度都可满足矿区四等水准的精度要求;三者对测试数据预测的残差最大值基本相当;GA-SVR算法残差曲线更为平缓,其内外符合精度分别为5.162、5.972 mm,为三者之中最小,精度最高。
表3 不同方法精度比较 mm
(1)支持向量回归机结构简单,基于遗传算法可以寻找到最优参数,且具有全局最优解,增强泛化能力强,可有效避免人为设定参数的盲目性。
(2)GA-SVR、多项式拟合和RBFNN均可用于矿区GPS高程异常拟合,其精度与矿区似大地水准面的复杂情况、测站点分布有直接关系。基于凸最优化理论,SVR训练时选取凸域内的训练数据预测精度最高,选择凸域外的训练数据精度较低,因而,如何选取最合理的训练数据是下一步值得深入研究的课题。
[1] 刘晓君,孙久运,周 峰.支持向量机回归在矿区GPS高程转换中的应用[J].金属矿山,2011(1):98-101.
[2] 周忠谟.GPS卫星测量原理与应用[M].北京:测绘出版社.1997:238-241.
[3] Reguzzoni M,Sanso F,Venuti G.The theory of general kriging,with applications to the determination of a local geoid[J].Geophysical Journal International,2005,162(2):303-314.
[4] 陈俊勇,李建成,宁津生,等.中国似大地水准面[J].测绘学报,2002(S1):1-6.
[5] 胡伍生,华锡生,鲍兴南.转换GPS高程的神经元网络方法[J].河海大学学报,2001,29(6):87-89.
[6] 杨明清,靳蕃,朱达成,等.用神经网络方法转换 GPS高程[J].测绘学报,1999,28(4):301-307.
[7] 吴兆福,宫 鹏,高 飞,等.基于支持向量机的GPS似大地水准面拟合[J].测绘学报,2004,33(4):303-306.
[8] 邓乃扬,田英杰.数据挖掘中的新方法——支持向量机[M].北京:科学出版社.2004:34-95.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!