当前位置:首页 期刊杂志

基于决策树的自适应教育超媒体课程系统海外案例介绍

时间:2024-05-07

李方圆+杨絮+张海+罗立成

● 自适应教育超媒体课程系统开发的现状与问题

自适应教育超媒体系统(AEHS)是一种在线学习系统,它根据每个学生的特点和需求,通过网络平台随时向学生推荐最合适的教学内容,以使学生的学习过程更容易。目前,AEHS已经在不同的情境下成功使用,并且一些研究者已经开发了许多在线教育系统(如AHA、TANGOW、NavEx和CoMoLE等)。虽然大多数AEHS对学生不太适应的一些课程进行了测试和评估,但它在真实的教育环境中应用的潜力并未被完全挖掘,而充分采用AEH技术的主要障碍是创建和测试自适应课程。

自适应课程创建的一个主要问题是,教师需要分析自适应课程如何才能在不同学生的学习特征中起作用。因此,设计专门用于支持自适应系统开发和评估的方法及工具对于教师来说有很大的帮助。一些国外研究者提出了一种自适应课程的生命周期螺旋开发模型。在这一模型中,首先,教师(或教育内容设计者)使用创作工具开发课程,并将其加载到课程交付系统中;然后,将课程交付给学生,并搜集学生与系统(日志文件)的交互;接下来,教师借助数据挖掘工具检查日志文件,检测课程可能失败的地方或弱点,并提出改进课程的建议;最后,教师按照这些建议,利用创作工具对课程进行相应的修改,并再次在交付系统中加载课程。

用上述方法,教师可以改进每个周期的课程。然而,方法虽然可行,但对于非专业用户来说,使用数据挖掘工具分析交互数据并解释结果可能是一个艰巨的任务。因此,要解决这一问题,就需要帮助教师和课程设计者掌握分析数据的方法。本文将展示一些海外案例,介绍如何采用关键节点法、使用决策树来协助开发AEH课程。

● 使用关键节点法发现学习者的自适应问题

AEHS的学生模型属性或维度与不同的AEH系统,甚至同一系统的不同课程都是不同的,它们包括先前的知识、语言、年龄和学习风格等,且学生模型的维度就是学生的特征。学生可以在自适应课程中遵循不同的活动路径,教师可以从学生的活动路径中了解学生选择的某些路径是不是正确的学习方式,以及这些路径是否与学生的特征相关。因此,在自适应规则中寻找问题的一种方法是,在用户与AEHS的交互中寻找不良适应的潜在症状。通过这些症状就能够检测到相关的自适应问题,而发现这些症状的方法则是数据挖掘技术(Web挖掘)。

关键节点法就是使用数据挖掘技术(决策树)寻找潜在的症状,以表明系统中存在适应不良。该方法利用可读输出的C4.5算法,具体步骤如下:

①清理阶段。选择活动类型为实际活动或测试的记录,所有条目必须包含每个活动成功或失败的指标。

②应用C4.5算法,具体参数如下:

属性,学生模型的维度和活动变量的名称。

分类变量,成功变量指标。此指标表示学生是否通过了一个给定的实际活动或测试。该变量有Yes和No两个值,Yes表示学生成绩高于教师指定的最低要求,否则其值为No。

③評估结果。生成决策树,该树包含每个属性的节点。换句话说,该树由与学生基本特征维度相关的节点组成,并且节点与活动变量的名称相关。树的叶子是分类变量的值也即成功指标。然后根据指标找出症状:选择成功指标的值为No的叶子,这些叶子表示学生在给定的某个活动中失败;分析从先前选择的叶子到树根的每个路径。对于每个路径,需要两个步骤:①在路径中查找具有活动名称的节点并存储。自适应问题应该与此活动密切相关。②在路径中找到学生基本特征的值。

● 关键节点法的两个应用案例

下面为海外研究中关键节点法应用的两个案例。这两个案例使用了Simulog和Weka两个工具。Simulog用于生成日志文件,Weka用于分析这些数据。Simulog是能够模拟几个学生基本特征的日志文件工具,其中包含不良适应症状。Weka提供学习算法的实现,如分类技术、关联规则和聚类。此外,Weka包含的各种工具可用于预处理数据和数据可视化。在下面的案例中,日志文件是由一门有关交通规则的记录良好的课程生成的。

第一个案例的数据是来自240个模拟学生的互动,第二个案例的数据是来自480名学生。

TANGOW教育系统中日志文件的条目由以下几个属性组成:户名、基本特征、活动、完成、等级、访问次数、行动、活动类型、合成时间、成功。如下表所示。

用户名为s100的学生的条目示例为:

“s100,年轻,西班牙语,新手,S_Ag_Exer,0.0,0.0,1,初次访问,实践活动,否”

“s100,年轻,西班牙语,新手,S_Ag_Exer,0.0,0.0,1,离开原子活动,实践活动,否”

第一个条目显示,具有“西班牙语,新手,年轻”基本特征的学生s100参加了“交通警察标志练习”活动(S_Ag_Exer),完成0.0,等级0.0,是这次活动的第一次访问。第二个条目表明,学生离开这个活动,没有完成活动(完成=0.0),并且在练习中得分不足,为此,成功设定为否。

案例一:

研究者首先对Simulog生成的240名学生的数据进行研究。交互数据包含的不良适应的症状为70%具有“西班牙语、新手、年轻”基本特征的学生在“交通警察标志练习”活动中失败。

接着,根据关键节点法分析数据。第一步(清理阶段)是清理数据。它包括清除日志文件中不同于“LEAVE-ATOMIC”和“P”的活动,最后记录集包含960条。第二步(应用C4.5算法)是生成决策树(如下页图1)。最后一步(评估结果)是找到节点活动和学生基本特征,具体描述为:在树中,只有一个叶子的值为No。这个叶子有77%的良好分类的例子,节点活动的值是“S_Ag_Exer”,学生基本特征是“年轻”“新手”“西班牙语”。

决策树表明很多学习西班牙语版本的课程,具有新手经验且年轻的学生在S_Ag_Exer活动中多次失败,但需注意的是,该树的良好分类例子的百分比很高。这一结果是由于当学生与不良适应症状无关时,可变等级中缺乏随机效应,因而学生总是能完成这一活动。

案例二:

研究者首先对480名学生的数据进行研究,由Simulog生成了两个不良适应的症状,并在可变等级中增加了随机效应。因此,在该案例中有两个噪音来源,它们分别是症状的数量和随机效应。这些症状有60%具有“西班牙语、新手、年轻”基本特征的学生未能通过S_Ag_Exer(交通警察标志练习)活动,60%具有“英语、新手、年轻”基本特征的学生不能通过S_Circ_Exer(循环标志练习)活动。

本案例中,关键节点法的第一步与案例一相同,都要实现清理数据(清理阶段)。第二个步是应用决策树算法处理清理阶段最后产生的1920个记录(如图2)。最后一步得到以下结果:

①在树中找到值为No的两个叶子。两个活动与两个叶子相关,因此可以找到两个可能很强的不良适应症状。

②第一个叶子的No与节点“活动=S_Ag_Exer”相关,学生的基本特征是变量“经验=新手”“年龄=年轻”和“语言=西班牙语”。

③第二个叶子的No与节点“活动=S_Circ_Exer”有关,学生的基本特征是变量“经验=新手”“语言=英语”和“年龄=年轻”。

檢测到两个不良适应的症状,由于两个为No的叶子的良好分类例子的百分比(超过70%)相当高,因此,学习西班牙语课程和英语课程的新手经验的年轻学生分别在S_Ag_Exe、S_Circ_Exer活动中都有很多困难。

● 结论

两个案例旨在说明决策树技术是检测自适应程序潜在问题症状的有用方法。案例一证明了决策树的有效性,它可以在无噪声的数据中检测适应不良的现有症状。案例二是以大量的学生为对象进行研究,通过等级变量中的随机因素将噪声包含在数据中,使生成的数据更加接近现实。当然,决策树也有它的缺点,因为算法C4.5处理的是概率事件,所以提取的信息可能不会完整。因此,未来的工作应集中在测试决策树与其他技术的组合上,如通过关联规则为决策树提供额外的信息,了解失败的阈值指标以表明学习者的不适应症状。

基金项目:本论文获得吉林省教育厅“十三五”社会科学研究规划项目重点课题“基于数据挖掘的卓越教师能力结构与培训研究”、东北师范大学本科教改研究课题“卓越新闻传播人才创新培养模式与评价研究”、吉林省高等教育教学改革课题重点项目“卓越新闻传播人才创新培养模式与评价研究”资助。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!