当前位置:首页 期刊杂志

基于Rasch模型对学生推理能力进行测评的研究

时间:2024-05-04

郭习佩 薛亮 古丽茹?吐尔逊冯珏

摘要: 运用Rasch模型对高中学生的化学推理能力水平进行研究,开发了测验工具,同时进行了推理能力测验、数据统计及数据分析。研究结果显示,高二比高一学生进行化学推理时的思维复杂程度更高,即随着年龄增长,学生的推理能力也提高。

关键词: 化学推理; Rasch模型; 测验编制; 能力分析

文章编号: 10056629(2019)4001807中图分类号: G633.8文献标识码: B

目前世界各国在科学教育方面都在强调学生需要积极地投入到科学实践中去,例如使用模型建立解释和基于证据进行论证[1]。化学学科核心素养共包括五个方面,其中一点就是模型认知与证据推理。推理指的是由一个或几个已知判断推出新判断的思维形式[2]。推理能力是影响推理活动效果,在推理活动中形成、体现和发展,相对稳定的个性心理特征的综合[3]。化学推理能力是学生在学习化学知识,解决化学问题时的一种高级思维形式。学生在进行复杂的化学推理时,需要运用物质性质、概念、原理等核心知识,经过多角度分析、多步系统推理解决情境陌生、综合度高的复杂问题,分析复杂的远变式活动程序的合理性及其原理[4]。

为了解高中生化学推理能力的发展现状,不同年级的高中学生在化学推理类型上的差异,本研究在Hannah Sevian对学生的化学推理模式的水平划分的基础上,对高一高二学生所能达到的推理能力的水平进行了研究。

1 Rasch模型简介

根据Rasch模型原理,特定的个体对特定的题目做出特定反应的概率可以用个体能力与该题目难度的一个简单函数来表示。个体回答某一题目正确与否完全取决于个体能力和题目难度之间的比较。通过个体在题目上的表现(通常表示为原始分数)来测量不可直接观察的、潜在的变量[5]。根据测量的数据类型,可以把Rasch模型划分为二分模型、部分给分模型和等级量表模型;根据维度的多少,可以划分为单维模型和多维模型;根据参数估计数目不同,可以划分为两面模型和多面模型[6]。针对不同的测量量表和测量心理结构需要选择相对应的测量模型。

根据Rasch模型的测量原理,Wilson(2008)提出了四个构建模块作为用于开发测量的工具。第一个模块为结构图,结构图是从发展的视角来对要测量的心理结构由低到高发展的一种描述。第二个模块为项目设计,项目是学生心理结构的外在表达,它指的是用系统的任务设计来引出一个或多个结构图所描述的学生的知识水平的特定类型的证据。第三个模块为结果空间,学生对项目的反应被映射到结果空间,通过对各项目反应的结果进行评分分类使其与结构图中的各水平层次联系起来。即在对个体反应现象分析的基础上,记录和评判个体在各个项目上是如何反应的。第四个模块为结果空间,用以解释和评估学生在测验中获得的分数,从而将结果空间与心理结构联系起来[7]。

2 研究过程

2.1 学生“推理能力”的水平构建

Hannah Sevian通过对8~16年级的学生进行研究,根据学生推理思维复杂性的不同,提出了一套全新的关于学生化学推理思维的学习进阶模型。

2.2 “推理能力”测验工具的开发

根据所建构的“推理能力”的四个水平及具体的行为表现,编制了“推理能力”试测工具。同时综合考虑高一、高二学生不同的知识进程,编制了高一和高二两套试题,通过“锚题”将两套试题连接起来。对于初测试题,在试题编制完成之后请化学教育专家及高中一线化学教师对试题进行分析,提出建议,并依据建议对试题进行了调整和修改。初测试题调整完成之后,进行了初测,根据试测结果对试题进行了删减和修改,之后进行了二次测试,确定了最终的测试量表,具体如表2所示。

2.3 研究对象

本次测验共进行了三次测验。第一次测试旨在测试量表的质量,选取了高一、高二各52名学生,合计共104名,根据Rasch测量结果对量表进行修改和调整之后进行第二次试测,二测选取高一年级60名、高二年级55名学生,试测结果显示调整之后的量表质量较好。之后进行了第三次大样本测试,在西安的两个学校分别选取高一高二各50多位学生,组成了第三次大测试样本。大样本测试的样本具体组成如表3所示。

3 研究结果

本研究运用Winsteps对测试结果进行数据统计分析及建模分析,检验测试结果的信度和效度。

3.1 总体统计

由总体统计结果可知,高一测试的项目难度估计误差为0.27,被试的估计误差为0.67,均在许可的误差范围内。高二测试的项目难度估计误差为0.24,被试的估计误差为0.59,均在许可的误差范围内。高一测试卷和高二测试卷的项目拟合指数MNSQ均在标准值1左右,ZSTD均在标准值0左右,说明了两份试卷的测验数据与理想模型的一致性良好。高一测试卷的被试分离度为1.36,项目的分离度较高,达到了6,被试的信度为0.65,项目的信度相对较高为0.97;高二测试卷的被试分离度为1.36,项目的分离度较高达到了3.85,被试的信度为0.65,项目的信度为0.94。這说明学生的能力选取还是相对集中,能力分布水平不够广,但从总体情况来看,测验工具的性能还是相对较好的。

3.2 单维性

从图1可以看出,对于高一测试卷而言,有三个项目的标准残差系数超出了范围,有一个项目在边界处,表明这几个项目可能受其他因素干扰还测有其他的结构或能力,但大多数项目分布区间在-0.4~0.4之间,所以说明高一测试卷测量的主要是学生的推理能力,具有单维性。由图2可以看出,对于高二测试卷而言,有三个项目超出了范围,有两个项目在边界处,但大多数项目分布区间-0.4~0.4之间,故而可以说高二测试项目从总体来看是在测量学生的一种能力,具有单维性。

3.3 项目—被试对应

Rasch分析用怀特图将项目、被试按其难度、能力高低放置在同一Logit区间尺度上,以此来反映项目难度与个体能力之间的关系,检测学生成绩的有效性。高一怀特图如图3所示,从项目整体分布上来看,18个项目分布比较广泛,覆盖的范围比较大,基本上涵盖了学生的能力,且分散基本均匀。学生的分布情况也比较好,能力分布显示出中间多两边少,大部分学生能力都集中在0左右,是较为理想的状况,说明参加测试的高一学生代表性好,能力分布比较均匀。图4为高二测试怀特图,从总体来看,高二学生能力分布比较理想,中间部分人数居多,两边较少且具有一定的跨度,呈正态,19个项目分布比较均匀。大部分考生水平在0以上,表明高二测试项目对于高二样本来说比较简单。对于高一和高二测试而言,都存在一些难度较小的项目几乎没有可以与之匹配对应的学生能力。

3.4 项目拟合、误差

通过对高一和高二年级测试各个项目的拟合情况及误差进行统计分析,我们可以看出,对于高一测试项目而言,项目难度值在-3.54~3.17之间,除了项目1的项目难度估计的误差相较其他项目偏大外,其他项目难度估计的误差均较小,除了项目9、 14、 16的ZSTD稍微超出范围之外,大部分项目拟合指数都在可允许范围之内。除项目1的点—测量相关较低之外,其余项目的点—测量相关都较高,表明项目具有较好的鉴别能力。对于高二测试项目而言,项目难度值在-2.56~1.75之间,项目难度估计的误差均较小,除了项目7的拟合指数超出范围之外,其余项目拟合指数都在可允许范围之内。项目的点—测量相关都较高,表明高二测试项目都具有較好的鉴别能力。

3.5 化学推理能力测评分析

3.5.1 总体分析

采取单因素方差分析对两个年级学生的能力差异进行检验。结果显示,方差检验F值为8.94, P值为0.003,小于显著性水平0.005,故两个年级学生的能力存在明显差异。

3.5.2 在各级水平层次上的比较

由于高一高二测试题并不完全相同,且高一高二学生能力不同,故高一、高二年级的水平划分并不是绝对相同的,而是存在一定的差异。高一年级的各级水平的难度平均值如表5所示。高一年级测试卷的水平1包含5个题目,难度范围为-3.54~-1.36,难度平均值为-1.986;水平2包含5个题目,难度范围为-0.97~-0.04,难度平均值为-0.564;水平3包含5个题目,难度范围为0.56~1.4,难度平均值为0.928;水平4包含3个题目,难度范围为2.02~3.17,难度平均值为2.7。即当学生的能力值低于-1.986时说明学生的推理能力没有达到水平1;当学生的能力值在-1.986~-0.564之间时,表明学生的推理能力达到了水平1;当学生的能力值在-0.564~0.928之间时,表明学生的推理能力达到了水平2;当学生的能力值在0.928~2.7之间时,表明学生的推理能力达到了水平3;当学生的能力值高于2.8时,说明学生的推理能力达到了水平4。通过表4我们可以看到,高一年级学生的平均能力值为0.27,即高一学生的推理能力整体上处于水平2。

高二年级的各级水平的难度平均值如表6所示。高二年级测试卷的水平1包含五个题目,难度范围为-2.56~-0.56,难度平均值为-1.268;水平2包含4个题目,难度范围为-0.32~-0.02,难度平均值为-0.145;水平3包含7个题目,难度范围为0.08~0.72,难度平均值为0.357;水平4包含3个题目,难度范围为1.17~1.75,难度平均值为1.48。即当学生的能力值低于-1.268时,认为学生的推理能力未达到水平1;当学生的能力值在-1.268~-0.145之间时,认为学生的推理能力达到了水平1;当学生的能力值在-0.145~0.357之间时,认为学生的推理能力达到了水平2;当学生的能力值在0.357~1.48之间时,认为学生的推理能力达到了水平3;当学生的能力值大于1.48时,认为学生的推理能力达到了水平4。通过表4我们可以看到,高二年级学生的平均能力值为0.72,即高二学生的推理能力整体上处于水平3。

从以上分析可以知道,高一年级学生整体的推理能力达到了水平2,即大部分学生可以根据日常生活经验来推断某物质的物理性质或化学性质,可以根据物质体现出来的某个化学性质或物理性质来推断物质可能存在的某个结构,也可以依据已知物质的性质来对未知物质的性质做出自己的假设和判断,他们可以通过简单的线性分析来进行推理,但进行连续性的或综合性的复杂分析对高一年级学生而言难度较高。这可能是由于高一年级学生学习的大部分内容都是从宏观层面来了解物质的物理性质和化学性质,虽然会有部分内容涉及到物质发生变化的微观层面分析,但由于刚开始接触物质变化的微观分析,所以学生对这一部分内容了解得不够透彻。包括必修2的很多内容,例如化学反应速率、化学能与电能、有机化合物等内容,高一年级的学生都只是做一个初步了解,所以对高一学生而言一方面可能是知识储备不够,从而限制了高一年级在某些方面做深度的分析和推理,他们只能局限于变化发生的表层来进行推理,进一步局限了高一学生的思维的复杂程度,且学生的思维复杂程度是随着年龄增长而增强的,对于高一学生而言,可能由于年龄影响,导致其对问题的思考不全面,从而限制了其思维模式。

高二年级学生整体的推理能力达到了水平3,即高二年级的学生在遇到需要解决的问题时,能够将所学的物质的若干个性质或物质的物理变化或化学变化联系起来思考,形成一个线性的思维网络,能够由已知条件,通过连续不断地利用物质之间的转化关系或结合物质在量方面的转化来简化自己的推理,得到最终的推理结果。这可能是因为高二年级的学生已经开始深入地从微观变化来分析化学能与电能、热能之间的转化,也开始深入地了解物质的微观结构以及微观结构对物质性质所带来的影响,也开始从多个角度来进一步分析影响化学平衡和化学反应速率的因素,所以高二学生在学习的过程中已经潜移默化地形成了更为复杂的思维习惯,他们已经可以从宏观和微观等多个方面来看待物质变化,也能够将自己所学习的知识联系起来思考问题,因此他们也就能够将多个变量之间的关系梳理清楚,进一步进行更为复杂的线性推理。但对于高二大部分学生而言,在涉及由多方面影响因素或作用产生某现象的分析推理方面存在一定的难度,存在思考问题不全面,不能够将多重因素之间的相互作用联系起来进行综合思考和推理。这可能是由于高二学生还没有经过系统化的知识梳理,没有能够形成完整的知识网络,故对于同时考虑多种复杂因素的动态推理还存在一定的不足。

4 结论与启示

本文的测量工具具有一定的测量信度和预测效度。它可以用来测量学生所能达到的推理能力的复杂程度。当使用测量工具对高一高二年级进行测试时发现,高二年级学生的推理能力要高于高一年级学生,高二年级学生的推理能力大多集中在水平3,高一年级学生的推理能力大多集中在水平2,虽然两个年级都有未达到水平1的学生,但只是极少数的个别学生。两个年级在四个水平上都有不同比例的学生,且集中的水平层次差别很明显。这说明随着年龄增长和所学知识难度和复杂性的增加,学生的推理能力会有明显的提升。这说明学生的推理能力一定程度上是受学生所学知识的难度和年龄增长影响的。

对于一线教师而言,可以在锻炼学生可达到的思维水平的基础上,通过扩展学生的知识面和视野,让学生在学习过程中来自主地进行探究和发现知识,从而合理地发展学生更复杂的推理思维,提高学生的推理能力。同时要注意培养学生形成知识网络,以使学生能够在进行推理时意识到不同物质結构与性质、变化之间的多重关系,从而可以在已有知识的基础上进行复杂推理。

参考文献:

[1]M. L. Weinrich & V. Talanquer. Mapping students modes of reasoning when thinking about chemical reactions used to make a desired product [J]. The Royal Society of Chemistry, 2016, (17): 394~406.

[2]陆海燕. 高中学生的物理推理能力调查研究[D]. 南京: 南京师范大学硕士学位论文, 2015.

[3]吴宏. 推理能力表现: 要素、 水平与评价指标[J]. 教育研究与实验, 2014, (1): 47~51.

[4]王磊, 支瑶. 化学学科能力及其表现研究[J]. 教育学报, 2016, (4): 46~56.

[5]晏子. 心理学领域内的客观测量——Rasch模型之特点及发展趋势[J]. 心理科学进展, 2010, (8): 1298~1305.

[6]何鹏. 理科教师课堂教学表现的测量与评价研究[D]. 哈尔滨: 东北师范大学硕士学位论文, 2016.

[7]Linda Morell. A Construct — Modeling Approach to Develop a Learning Progression of How Students Understand the Structure of Matter [J]. Journal of Research in Science Teaching, 2017, (8): 1024~1048.

[8]Hannah Sevian & Vicente Talanquer. Rethinking chemistry: a learning progression on chemical thinking [J]. The Royal Society of Chemistry, 2014, (15): 10~23.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!