考试成绩评价模型研究

时间：2024-05-04

刘丽峰，黄海明

（1.山东理工大学，淄博255049；2.32148 部队61 分队）

1 问题介绍

学生的考试成绩对在一定程度上能够反映学生学习状况，通过分析考试成绩的特征，对进一步提高学生的学习效率，分析学生学习的规律，从而能提高培养学生的质量意义重大。学生的入学时的基础知识水平存在客观的差异，采用固定的标准衡量学生的学习状况难以反映学生学习的真实情况，因此建立能够反映学生入学成绩差异的考试成绩模型对客观学习状态有重要意义，对教师掌握学生学习的情况，如何找出影响学生学习成绩的相关因素，为提高教学工作的效率提供一些理论和事实依据。

2 基于个体差异的考试成绩分析模型分析

2.1 成绩分析模型综述

目前国内外学者对考试成绩分析方法、分布特征及其影响因素已经进行了深入的研究：孙高强利用数据分析技术分析评教成绩，再将分析的结果和结论通过数据可视化的方式进行展示[1]；陈潇潇使用数据挖掘知识对学生的成绩进行数据分析预测，应用Apriori 关联规则算法挖掘出影响学生成绩的潜在的规律[2]；杨王黎等人研究了学生考试成绩的统计规律，采用χ2检验法实现了成绩的正态性检验，建立了根据学生成绩评价试卷质量的模型[3]；刘丽峰提出一种以Zernike 矩模式识别为基础的工程测量课程分类方法，建立工程测量成绩评定的数学模型[4]。梁利亭对如何在高职院校的成绩分析当中使用决策树算法进行了分析[5]。王进和陈晓思采用学校固定效应模型，分析不同的班级环境对学生学习成绩造成的影响及其性别差异，研究结果显示在较差的学校中，女生比男生较不易在同伴群体中形成反学校的认知、态度和行为，因而容易造成学习成绩上的性别差异[6]。贺超凯和陈云芳通过对现行的学生平均学分绩点的计算方法进行分析，指出了存在的问题，并提出改进的计算方法[7]。李金屏等人提出了一个定量的研究学生成绩分布的数学模型，该模型可以预测学生考试成绩的分布规律[8]。李翔等人利用三次Hermite 样条和B-spline 构造了新的考试成绩标准分布函数，并对成绩分布特征进行了分析[9]。张国才认为成绩分布模型与学生人数、学生群体和教师的能动性、学生的素质和基础以及成绩评定的标准四方面因素密切相关。师生的教学活动可改变成绩分布模型，负偏态分布具有合理性[10]。鉴于以上文献的研究发现，考虑学生的基础知识水平的研究较少，本文则以入

学考试成绩为基础综合考虑影响学生考试成绩的主、客观因素，对成绩进行分析并建立其分布模型。

2.2 考试成绩分析模型构建

（1）考试成绩的影响因素

根据影响学生学习的主要因素：自主学习、就业形势影响、游戏娱乐和基础知识水平，选择三个指标构造加权平均分函数，其中自主学习通过考试成绩体现，由于考试难度中等，由于本模型中假设各指标相互独立，因此在不考虑基础知识水平差异的情况下，自主学习的时间与考试成绩（y）成正比。就业形势好坏直接反映在招生的人数上，因此由班级总人数（NT）代表这一指标。针对游戏、娱乐方面的因素，这里仅考虑影响学习成绩的游戏、娱乐，由受不及格人数影响的平均成绩反映这一指标，该指标仅在模型结果分析时应用。基础知识水平对学生学习难易程度影响较大，由于学生学号（N）跟入学成绩呈反比，即学号末尾数值越小，高考成绩越高，理论基础越扎实。

分析模型评定等级标准：根据成绩分布一般服从正态分布的特点，将成绩分为三个等级：大于1 倍标准差之外（或对应学号加权平均分）的成绩为优异（Y1），小于60 分（或对应学号加权平均分）的为不及格（Y2），余者为良（Y3）。

定义1 加权平均分模型（ACG，y=ln（TN+2-N*Si）*Ai）：以学号、学生总数为自变量的自然对数函数，在10 为底的对数坐标轴的雷达图表示，成绩图形近似为圆形，该圆上对应学号的点表示良好或中等学生，圆外部及外切的点成绩为优异，点在外部距离圆越远成绩越优异；反之，内部或内切的点为不及格，点在内部距离圆越远成绩越差，且要求该函数为班级学生成绩最优或近似最优拟合函数。

（2）影响因素定权（Si，Ai）

为评定各影响因素在考试成绩中的贡献率，本文采用了两种方法进行确定：区间法加权平均分模型（IACG）图为圆环通过值域区间确定[Vmin，Vmax]（Rmin=Vmin，Rmin=Vmax），使不及格数据位于圆环的内部（Y2＜Vmin），成绩优异数据位于圆环的外部（Y1＜Vmax），其余数据则位于包含的区域内（Vmin＜Y3＜Vmax）内；综合型加权平均分模型（CACG）通过最优非线性拟合的方法确定各个指标的权重，采用最小二乘法计算学号N学生的加权平均函数值与其考试成绩的残差，使残差平方和最小的参数为最优。

图1“区间型”加权平均分模型（IACG）和“综合型”（CACG）加权平均分模型

（3）模型优化

区间法（IACG）采用基于和谐度方程的参数优化方法：由步骤（2）确定的指标权重不一定能满足与全班考试成绩的误差和最小，因此采用和谐方程使其累计和最小：

上式中，y1N为学号末尾2 位数（以下简称为学号）为N个学生分数，GN为学号N学生的考试成绩，NT为班级学生总数。为解决图形大小变化点值相切随之改变，选择1 倍标准差作为点值的起算标准线。

（4）模型分析

定义2 点值比（PVR）：加权平均分函数曲线上的数据之和与全班人数之比称为点值比。

利用以上步骤确定的加权平均分函数计算各个学生的加权平均分，并计算点值比，通过例子和理论证明点值比与平均成绩一致性，从而验证模型的有效性。

定理1 点值比（PVR）的百分数与平均分数成正比，在人数增多的情况下趋近于平均成绩。

证明：将全班成绩集合TG及其3 个子集（优异G、中等M和不及格F）所对应的人数分别设为Ntg，Ng，Nm，Nf，考试成绩用Gi表示，符合正态分布，可得：

那么PVR 可以表示为：

上式中，a1、a2、a3，分别表示成绩优异、良好和不及格学生的平均成绩，根据正态函数的概率统计分布特征，在班级考试成绩已知时为Ntg、Ng、Nm、Nf常数。点值比与平均分之差在人数无限多的情况下是相等的，人数有限的情况下，点值比逼近平均分，即PVR与平均分（Gˉ）之差（Dap）趋近于零，证明如下：

当班级人数Ntg无限多时Dap趋近于0；反之，根据正态分布的性质，落入两侧（1 倍标准差、2 倍标准差、3倍标准差之外）的区域概率为小概率事件（分别为31.74%、4.56%、0.26%），根据10 个班的统计结果，以1倍标准差为例，由正态分布的对称性，选择不及格、优秀的比例都为0.1587，优良和中等的比例为0.6826，据此可以构造隶属度函数。

各因素的权重：

将（9）和（10）式代入公式（8）可得：

上式可以看作3 个直线函数的合成（图2）：

图2 成绩函数解析

由图3 可以看出y1和y3属于同一函数，区别仅在于不同的值域，因此可以用一个函数y4=0.1587*x,x∈(0,60)∪(80,100)表示，因此，y=y2+y4，而y2、y4之和在其值域范围内逐渐靠近，在（130.29，20.68）点函数y（即Dap）为0。由此命题得证。

定理2 加权平均函数（y1N）与拟合加权平均函数（y2N）相逼近或成比例关系，即y1N/y2N=1。证明如下：

由于拟合加权平均函数（y2）趋近于考试成绩，因此y2趋近于平均成绩，因此只要证明加权平均函数（y1）趋近于平均成绩即可。

由于在一个班级内考试成绩相差不大的情况下，加权平均函数趋近于圆，a1表示加权平均函数相对于圆的变化情况，因此a1趋近于零，当班级人数TN 一定时，N/T＜1 为小于1 的固定值，因此N/T*a1趋近于零，ln（1+N/T*a1）也趋近于零；由于针对某一班级最优加权平均分模型具有唯一性，因此为a2具有唯一性和不变性，y1趋近于固定值lnT*a2，因此有：

采用区间法加权平均函数模型和综合法加权平均模型的计算步骤见图3。

图3 IACG（a）和CACG（b）建模

3 应用举例

下面采用某职业大学的工程测量成绩分析区间法和综合法加权平均函数的应用。

3.1 工程测量考试成绩应用

本例子采用某职业大学2011-2015 届10 个班工程测量考试成绩（不含平时成绩和实验成绩），每个班的人数招生规模为40 人，女生比例为2.6%～26.4%，在班级总人数下降的情况下，呈现逐年上升的趋势。

（1）考试成绩原始数据的特征分析

由于学生考试成绩的随机性，根据学号顺序难以找到理想的拟合模型，因此对10 个班级的学生成绩按升序排列，并对排列后的成绩进行拟合，拟合结果见表1，相关系数（R2）＞0.754，属于强相关，因此加权平均分函数选择自然对数函数y=a*ln（x）+b进行拟合，其中a表示班内成绩变化的速率，变化的速率越大说明班级成绩差异越大，在不考虑边远地区招生影响的情况下，学生之间高分和低分分异明显，说明部分学生由于内外部因素的影响，部分学生成绩出现大幅度下降，b 表示班级内的最低分，比较10 个班的拟合公式发现：b 值有逐年下降的趋势，也说明考试成绩的差距逐年增大。

表1 某职业大学10 个班级工程测量拟合函数比较

（2）加权评分函数模型计算结果

分别采用区间法加权评分函数模型（IACG）和综合法加权评分函数模型（CACG）对10 个班的考试成绩进行建模，并计算了各个班级分平均考试成绩和点值比（表2），两者的点值比之差最大值为14.29%，最小值为0，平均值为3.72%，由此可见两者的差异不大，也说明了IACG 是反映学生成绩基础差异的近似最优解。为比较两者方法的点值比（PVR）与平均成绩、和标准差的变化关系，计算了10 个班级的均值和标准差（图4）。

图4 点值比与均值、标准差对比

表2 工程测量考试成绩加权分析函数统计表

表3 某职业大学考试成绩加权平均分拟合结果

均值与由区间法、综合法加权成绩加权模型函数计算的IACGPVR、CACGPVR 在变化趋势上都有很好的一致性，说明该模型在1 倍标准差范围内（68.28%）的拟合值能够在均值上下一定范围内波动，证明了该模型的收敛性和正确性；在数值上IACGPVR 更加接近平均值，CACGPVR 变化幅度较小，这是由于综合法加权成绩分析模型要求模型在整体式达到残差最小的原因，因此数值上更趋于10 个班级平均值的均值，而标准差却与平均值（IACGPVR、CACGPVR）有相反的变化趋势，这说明考试成绩优秀的学生越分散，部分入学前成绩较好的学生进入大学后由于某些外界因素或主观对专业爱好程度的影响，致使学习兴趣下降，成绩出现了大幅度下滑，反之，某些学生通过个人努力成绩有了很大程度提高。

面对着严峻的就业形势职业大学测绘工程专业的人数趋于饱和，也出现了缩招的现象，例如某职业大学的由原来的每届4 个班（每个班40 人以上），下降到两个班（每个班30 人左右），对5 年内10 个采矿工程卓越班的招生人数进行拟合，公式如下：

上式的相关性（R2=0.7202）达显著水平，这是学校招生方面对就业形势的应对策略。学生对就业前景的担忧，表现出专业课不努力学习，如转修第二专业、参加其他社会就业考试等，减少了用于专业课的时间，平均考试成绩也呈现一定程度的下滑趋势。

（3）结果分析

由表2 可以看出区间法和综合法加权平均函数计算得到的点值比除（1102 班较大，14.3%），这是由于1102 班考试没有出现不及格的现象，跟正态分布差异较大的原因。面积指数Ai表示在极坐标下加权成绩分析函数包含的面积，由于两者都近似于同一考试成绩，因此相差不大（1.9%～8.9%）。形状指数Si越趋近于0，加权成绩分析函数就越趋近于平均分，其形状就越趋近与半径为分析分的圆形；区间法中的形状指数逐渐减小，及综合法的SI 大于0，说明了：①部分入学成绩好的学生由于受到主客观原因（如对学习失去兴趣、就业形势影响、网络、手机等游戏影响）导致成绩明显下降，反之入学成绩较低的学生通过认真学习，成绩则不断提高，从而减小了学号之间的差距，使得区间法表现出形状指数下降，综合法则表现出不降反增的趋势；②除1101 班外都有1～3 名边远地区的特招生，入学成绩较普招生低100～200 分，但由于人数较少，对形状指数的影响不明显（相关指数仅为-0.0103），但他们由于入学基础较差及格率极低（7.14%）；③部分女生作为调剂生，学号排在班级的末尾，平时上课认真听讲，因此考试成绩偏高，随着女生的比例逐渐增加（由2.6%增致26.4%），对形状指数影响显著（0.7817）。

3.2 某职中各科考试成绩应用

从网络上下载的某职中一年级32 名学生语文、数学、英语、政治、历史、物理、生物和地理8 门的中考考试，其中成绩分布的雷达图见图5。由图5 可以看出该班的各科成绩也与学号之间存在很强的相关性，随着学号的增加成绩下降明显。

图5 某初中（1）8门课程成绩分布雷达图

在表4 班级考试平均分与点值比的误差英语课程最小（-0.55%），地理课程误差最大（8.50%），平均误差0.86%，平均成绩的误差率为8.50%，总成绩转换为百分制的误差率为3.70%。由此也说明了入学基础理论成绩的影响对学生来说在各门课程都很显著，而且形状系数SI 变化不大，标准差仅为0.0542，也说明了入学成绩对各门课程的平均影响程都相同，但形状因子的平均值0.7395 明显大于大学，这也是职中和职业大学课程特点的不同，从小学到初中学习的各门课程都有很紧密的联系，差生不容易有大幅度的提高，且入学成绩好的学生不受外界因素（手机、网络等）因素的影响，成绩依然保持很好；另外职业大学则由于学习了专业课，与职高学习的内容有较大差异，相对来说受到入学成绩影响较小。

表4 某职中（1）考试成绩加权平均分拟合结果

形状指数为负数也说明考试成绩跟入学基础知识有重要的关系，已经能够体现区间法加权指数分析模型的要求，即形状指数（Si）＜0，学生学号N＞0，那么N*Si＜0，且N*Si随着学号N 的增加递减，那么（NT+2+N*Si）就表示出学号增加权重减少，即入学基础与学号呈反比的关系，因此本实例不需要再采用区间法进行分析。

该班级学生各科考试成绩的最优拟合模型为：班级各科成绩的全集合拟合函数y=ln（TN+2-N*0.02）*23.41 的拟合结果最好，形状指数Si小于零也说明了初中班级学生的学号对成绩有重要的影响。由于没有相关的数据资料，因此采用各科的平均分对模型进行验证：平均值与点值比的误差为-9.4531%。

为了对比对数模型在职中、职高、职业大学二年级学习的适用情况，选择某职高（1）的期末各科考试成绩进行比较结果见表5，由IACG 拟合的模型有71.43%的课程Si小于零，稍微低于初中的100%，但大于职业大学的40%，说明学生的入学基础知识对高中成绩影响仍比较大，只有语文、英语两门语言类课程考试成绩与学号无关，也表明了这两门课程成绩差的学生通过努力学习可以短期内有较大提高；适合于该班级各科的最优拟合模型为y=ln（TN+2+N*0.03）*17.31。

表5 职高中（1）理科考试成绩加权平均分拟合结果

用该校职高（1）大致相同程度的文科班相同科目（语文、数学和英语）的考试成绩进行验证，结果见表6。

由表6 可以看到语文成绩的误差最小（5.83），英语成绩误差为13.68%，由于文科生数学较理科弱，因此误差最大33.93%，这也反映了文理科的差异。

表6 某高中（1）文科考试成绩加权平均分拟合结果

4 结语

针对考试成绩的分布模式，本文定义了点值比的概念，并证明了点值比（PVR）与平均分数成正比，在人数增多的情况下点值比（PVR）的百分数趋近于平均成绩；同时建立了“区间型”加权平均分模型（IACG）和“综合型”（CACG）加权平均分模型，并对大学的多门专业课程考试成绩、职高和职中的考试成绩计算出的考试成绩与实际考试成绩进行比较，并通过两者的差异分析影响学生成绩的关键因素。与传统的考试成绩统计模型相比，IACG 和CACG 模型能反映学生的基础成绩对当前考试的成绩的影响，同时也能反映出学生在已有基础知识水平上学习状况，为因人制宜地、客观地评价学生的学习状况提供了指导。所以，将IACG 和CACG 考试评价模型应用到教学中，具有很好的实用价值，为考试教学改革提供了更切合实际的评价方法。