时间:2024-05-18
姬瑞军++王明月
摘 要:研究不同性别人群足底压力分布对性别进行分析识别,利用足底压力步态分析系统对20名男性和20名女性正常行走的足底压力分布数据进行测量,提取足底各区压强峰值特征,使用支持向量机对不同性别人群的足底压强峰值进行训练并进行验证。结果表明:利用支持向量机对左足、右足及左右足的足底压强峰值特征建立的数学模型对性别具有较好的分析识别能力,识别正确率在80%以上,为利用犯罪嫌疑人足迹所反映的步态特征分析性别提供了实验依据。
关键词:支持向量机 性别 足底压强 识别
中图分类号:TB391.4 文献标识码:A 文章编号:1672-3791(2017)08(c)-0248-03
足迹作为犯罪现场出现率较高的一类痕迹物证,在分析犯罪嫌疑人人身特点中发挥了重要作用。由于不同性别人群在身体结构和运动机能方面的差异从而导致其足迹中反映的步态特征具有各自的特点,从而为利用足迹分析犯罪嫌疑人性别提供了依据[1]。当前科研工作者除了利用传统的足迹学理论对不同性别人群的步态特征进行了研究外,还使用大量足底压力测量系统对不同性别人群行走留下的足底压力分布进行了测量研究,并发现了不同性别人群行走留下足底压力分布差异[2-5]。本文基于不同性别人群在身体结构、运动机能方面的差异,通过Footscan足底压力步态分析系统采集不同性别人群的足底压力分布数据,利用支持向量机进行训练,并使用交叉验证的方法对不同性别人群的足底压力分布数据进行分析识别,为利用足迹分析性别提供实验依据,丰富足迹学的理论基础,为刑事案件侦查提供强有力的线索。
1 支持向量机的原理
支持向量机简称SVM,是90年代中期发展起来的基于统计学理论的一种机器学习方法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。
支持向量机分为线性可分支持向量机、线性不可分支持向量机和非线性支持向量机。在不同性别人群足底压力的分析识别中,足底压力特征与性别之间存在比较复杂的非线性映射关系,在此本文主要详细介绍非线性支持向量机的问题。对于线性不可分情况,SVM的主要思想是将输入向量映射到一个高维的特征向量空间,并在该特征空间中构造最优分类超平面。
假设有训练样本集(xi,yi),(i =1,2,…,l),x∈Rn,y∈{ ±1}是类别标号,超平面方程为:
g(x) =ωxi+b =0 (1)
在约束条件上加入一个非负的松弛变量ξi,这时最大间隔超平面成为广义最优分类超平面,对应的优化问题转变为:
min1/2(ω·ω) +C∑ξi
s.t yi(ω·xi +b) ≥1 -ξi,其中ξi ≥0,i =1,…,n (2)
式中,ω∈Rn是超平面的法向量,b是阈值,ξi是引入的松弛变量,C>0是惩罚因子。采用拉格朗日乘子方法和技巧,进而求得优化问题(2)的对偶规划为:
max∑ai1/2∑∑aiajyiyjK(xixj)
s.t∑aiyi=0,0≤ai≤C,i=1,…,n (3)
式中,ai是拉格朗日乘子,K(xi,xj)是满足Mercer条件的核函数。SVM的决策函数可以表示为:
f(x)=sgn[aiK(xi,xj)+b]
式中,sgn表示二值函数,值为{-1,+1}。
2 应用实例
2.1 实验对象
选取体态匀称,年龄在22~26岁,无足部疾病史,行走运动正常的受试对象40名,其中男性20名、女性20名。
2.2 实验方法
本实验仪器采用比利时RSscan公司研发的Footscan足底压力步态分析系统,在受试对象完全熟悉实验环境和实验过程后,让受试对象赤足正常行走状态下走过足底压力步态分析系统2m长,0.4m宽的测试平板,从而获得至少一个左足一个右足的足底压力图像和相关足底压力分布数据,以此让每名受试对象重复行走3次有效数据并记录性别。
2.3 数据处理
为了对不同性别人的足底压力进行分析识别,利用Footscan足底压力步态分析系统对采集的足底压力分布图像进行自动分区,将足底分为第1趾区(T1)、第2-5趾区(T2-5)、第1跖区(M1)、第2跖区(M2)、第3跖区(M3)、第4跖区(M4)、第5跖區(M5)、足弓区(MF)、跟内侧区(HM)、跟外侧区(HL)等10个区域(见图1),并将每个人3次的左右足底各区峰值压强数据导出求平均后输入到SPSS Modeler 15.0软件中建立左足、右足和左右足的SVM模型并验证。
2.4 构建和验证SVM模型
将Footscan足底压力步态分析系统对采集的足底压强数据导出并将其导入SPSS Modeler15.0软件,选择“字段选项”选项卡中的“类型”节点,设定性别为目标变量,其他变量为输入变量,然后利用“字段”选项卡中的“分区”节点将数据集按照7∶3的比例分为训练集和测试集,最后将“模型”选项卡中的SVM节点放置到流编辑区域,并进行参数设定。设定停止标准为10-5,惩罚因子为8,松弛变量ε为0.1,核函数选择RBF核函数,在构建并验证左足和右足SVM模型时设置RBF伽马为0.4,在构建并验证左右足SVM模型时设置RBF伽马为0.2,最终构建并验证左足、右足及左右足的SVM模型。
2.5 结果与分析
表1是将左足足底10个区域足底压强峰值组成10维特征向量,性别作为分类变量输入SPSS Modeler软件进行建模分析识别的结果。由表1可知,左足训练集识别正确的百分比为90%,测试集识别正确的百分比为80%,综合训练集与测试集识别正确的百分比为87.5%。可见左足足底各区压强峰值组成的10维的特征向量所建立的SVM模型具有较好的分析识别能力,可以为利用左足足底压强峰值分析识别性别提供参考。endprint
表2是将右足足底10个区域足底压强峰值组成10维特征向量,性别作为分析变量输入SPSS Modeler软件进行建模分析识别的结果。由表2可知,右足训练集识别正确的百分比为83.3%,测试集识别正确的百分比为80%,综合训练集与测试集识别正确的百分比为82.5%。可见右足足底各区压强峰值组成的10维的特征向量所建立的SVM模型的分析识别能力与左足一样,识别正确的百分比均较高,可以为利用右足足底压强峰值分析识别性别提供参考。
表3是将左足和右足足底20个区域足底压强峰值组成20维特征向量,性别作为分析变量输入SPSS Modeler15.0软件进行建模分析识别的结果。由表3可知,左足和右足组成的训练集识别正确的百分比为93.3%,测试集識别正确的百分比为80%,综合训练集和测试集识别正确的百分比为90%。可见左足和右足足底各区压强峰值组成的20维的特征向量所建立的SVM模型对性别的分析识别能力得到明显的提高,说明左足与右足足底压强峰值的组合特征更加体现了不同性别群体在足底压强峰值方面的差异。
3 结论
本文通过Footscan足底压力步态分析系统采集20名男性和20名女性足底压力分布数据,使用SPSS Modeler软件应用支持向量机对40名受试对象的足底压强峰值进行建模并对性别进行分析识别,经过实例可知,支持向量机可以应用于不同性别人群的分析识别,并且在利用单足、双足足底压强峰值识别不同性别人群时,均具有较好的识别正确率,识别正确率均可达到80%以上。支持向量机在不同性别人群足底压力分析识别中的应用为利用犯罪嫌疑人足迹所反映的步态特征分析性别提供了实验依据,也从侧面论证了利用犯罪嫌疑人足迹所反映的步态特征分析性别的科学性。同时,更加有价值的论证有待增大实验样本进行进一步的实验研究,进而提高分析识别性别的正确率,为利用足迹分析性别提供更有力的理论支持。
参考文献
[1] 史力民.足迹学[M].北京:中国人民公安大学出版社, 2007.
[2] 张思亮.中国正常成人足底压力参数值范围、分布特点及其影响因素的探讨[D].广州:中山大学,2008.
[3] 赵丽.性别与BMI对中学生足底压力的影响[J].廊坊师范学院学报,2016,16(4):87-90.
[4] 袁刚.正常人足底压力分布及其影响因素分析[J].中华物理医学与康复杂志,2004,26(3):156-159.
[5] 张腾丹.青年大学生行走步态足底区域压力特征变化的研究[J].辽宁警察学院学报,2016(1):85-91.
[6] 张莉.支持向量机在高考成绩预测分析中的应用[J].中国科学技术大学学报,2017,47(1):1-9.
[7] 郝文宁.数据分析与数据挖掘实验指导书[M].北京:国防工业出版社,2016.endprint
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!