基于K-means算法的人员体能考核标准研究

时间：2024-09-03

武警工程大学高见文葛卫丽

武警杭州士官学校郭程

武警工程大学高见文葛卫丽

武警杭州士官学校郭程

在人员体能分类训练和考核中，根据传统的四级制分类方法对考核人员进行分类，但传统方法往往存在标准固化、缺乏定量考察、人员分类不具体等问题，进而导致训练人员训练积极性不高，出现“及格万岁，多一秒浪费”的消极训练倾向。针对这一问题，本文提出将K-means算法应用于人员体能考核标准的制中，运用K-means算法对人员体能考核成绩进行分析和处理，根据人员总体考核成绩制定分类标准。

K-means算法；体能考核标准

1.引言

随着信息技术和网络技术的飞速发展，现实生活和网络世界中产生越来越多的数据，如何在这些海量数据中挖掘出对人们有用的信息，是一个急需解决的问题。因此数据挖掘技术应运而生，数据挖掘顾名思义就是在给定的数据集中挖掘出有用信息的过程，而聚类分析是最为常用的数据挖据方法之一［1］。“物以类聚”形象的说明了聚类的含义，聚类分析就是将相似的失事物聚集起来，使其相似度最大；不相似的事物区分开来，使其之间的不同尽可能的大［2］。聚类是一种无监督的学习过程，是在没有先验知识的前提下将未标注的数据集划分为多个相似子类。聚类分析能够对数据进行有效分析和管理，是数据处理中的一个重要研究方向。

聚类分析作为一种有效的数据处理方法，具有不依靠先验知识和有效处理多个变量决定的分类等优点，成为当前数据挖掘领域具有代表性的分析和挖掘方法并得到广泛关注［3］。随着信息检索技术不断发展，聚类被广泛应用于文档自动摘要、信息检索等领域，而K-means算法是各种聚类算法中最为常用的一种聚类算法。

2.K-means算法

K-means是将未标注的数据集划分为k个簇，使得簇内数据点具有较高相似度，簇间数据具有较高非相似度的一种聚类算法［4］。每个簇表示一个聚类，相似度即为簇中全体数据点的平均值。

相似度的计算采用欧氏距离或曼哈顿距离，通常使用误差平方和（SSM）作为收敛评价标准，SSM定义如下：

式中，dist表示元素与聚类中心的距离，Ci表示第i个簇，x为属于簇i中元素的集合，ci表示第i个簇的中心。

具体算法流程如下：（1）随机选择数据集中k个元素作为初始簇的中心；（2）根据簇中元素的均值，将每个元素归于最近的簇中心，形成k个簇；（3）重新计算每个簇中元素的均值；（4）重复（2）（3）步，直到簇的中心不再变化为止。

3.传统人员体能考核标准和分类存在的不足

传统的人员考核标准采用四级制分类，即优秀、良好、及格、不及格，在不同成绩范围内的人员，被分配到不同的类别中，进而获得相应的成绩。

四级制分类方法虽然简单易操作，但是其缺点也是非常明显的［5］。四级制分类方法正是因为其操作和处理简单，使得考核成绩中蕴含的大量有用信息无法得到利用，信息增益过低。此外，由于考核标准制定过于宽泛，使得在同一层次类别中的人员，在实际考核成绩中往往也存在着巨大的差异，例如在5000米考核中22′01″的人员与22′59″的人员是被划入同意类别中的，但二者之间的差距足足有1分钟之多，显然，这是不合理的。再者，由于缺乏定量分析，四级制分类法不利于后续的人员分类训练，在考核划分时“一刀切”和“大锅饭”进一步导致在下一步的训练中也出现“一刀切”和“大锅饭”的问题，非常不利于提高人员训练成绩。