时间:2024-05-04
刘冬邻
(四川外国语大学网络信息中心 重庆市 400031)
随着网络与信息技术特别是云计算的发展,各高校都建设了各种网络教学平台和大量的网络学习资源、网络开放课程,学生可以在任意时间和地点利用这些平台和资源,进行自主学习。目前,像高校建设的MOOC开放式课程平台,网络教学平台,网络资源平台等系统,虽然学生用户数量巨大,但实际课程完成率却很低,学生在课程学习过程中出现大量的中途弃学现象,学习过程不完整,学习效果不理想[1]。为了找到这些问题的原因,找到大学生网络学习效果的关联因素,需要基于大数据分析,建立基于机器学习的网络学习分析系统,对平台中的大学生学习行为轨迹进行跟踪分析,进而对老师的网络教学,对学生网络自主学习,对教学管理的教学安排进行评估、指导和改进。
然而,包括网络教学在内的任何一种教学模式,在没有得到使用效果反馈的情况下,不管是教师教学内容安排、教学形式设计、还是教学平台功能结构上,显然都是不能进行针对性的调整和改进的[2]。本文即是以某高校的网络教学平台为例,使用基于机器学习和统计分析及数据可视化的技术,构建对其平台中的网络教学数据进行分析的系统,为网络教学过程和教学效果的分析、评估提供自动化的信息手段。
网络教学评估一般从教学管理、教学条件和教学过程以及教学效果这四个方面,进行综合的评估。具体评估内容包括:对学生、教师、学习资源、支持系统和支持服务这五部分的评估[3]。通过对教师、学生和教学资源的综合分析实现对教学过程的评估;通过对学习服务支持的评估实现对教学条件的评估;通过对学生成绩进行形成性分析,实现对网络学习效果的评估。高校网络教学平台的教学应用特点是以大学生自主学习为主,对学生学习效果的评估是系统评估的主要内容。
本文设计、实现的基于网络教学平台的大学生网络学习评估系统,对于学生的评估主要包括对大学生在网络教学平台的学习活动和最终学习效果的评估。该系统通过对网络教学平台的学生学习行为数据、教师和学生个人信息数据、作业和测试结果数据以及教务系统的相关科目考试成绩数据等信息进行采集、集成、转换处理并进行分析、挖掘。进而完成对大学生在网络教学平台上的学习活动和学习效果的综合分析与评估,让教师和学生真正掌握学生的学习过程,找到网络学习行为和学习效果之间的关系,建立基于大学生网络学习行为的,网络教学平台-评估模型。并通过该模型对学生的学习进行形成性评估,帮助学生了解自己的学习状态,指导老师的教学内容安排和教学设计,为教学管理者提供教学管理决策支持。
目前,基于Web的网络教学系统,是高校里大学生进行自主网络学习,老师进行在线授课的主要平台。其主要以Web作为内容载体,不但能向师生提供不受时空限制的访问,还能提供交互式学习环境,方便了师生之间、学生之间的交流讨论。现在,国内高校都建设了基于各种网络和信息技术的网络教学平台,众多教育学者和系统提供商都对网络教学平台的建设进行了大量研究。中国学者张伟远在分析了众多在国际上广泛使用的网络教学平台后,提出网络教学平台三大主要功能:课程设计功能、交流和协作功能、管理功能。这三大功能模块下又包括教学设计工具、课程设计模板、个人空间、讨论区、工作组等17项子功能[4-5]。
本文研究的网络教学平台所使用的教学模型如图1所示。基于此教学模型,设计并实现了网络教学平台学习评估系统。
图1:网络教学平台教学模型
基于高校网络教学平台的网络学习分析评估系统主要由三个模块组成:数据采集模块、学习数据统计分析模块、基于机器学习的数据分析和挖掘模块。学习评估系统总体结构如图2所示。
图2:系统总体结构图
数据采集模块主要负责采集、量化学生在网络学习平台上进行在线学习的学习行为数据、操作日志数据和一些结果数据,同时根据分析评估的需要从教务系统等数据库采集各科考试数据,并存储于数据库中。
统计分析模块主要负责对数据库中的数据进行提取、加工,采用统计分析技术和方法对教学平台的各种数据进行探索性分析、相关性分析,同时为数据提供图形化的直观展现,进而为整体教学情况和平台应用情况提供评估依据。
学习行为评估模块主要实现两个功能:
(1)运用机器学习技术构建“网络教学平台-评估”模型;
(2)根据所构建的“网络教学平台-评估”模型对学生在线学习行为进行评估预测。
基于本文的应用场景,数据的采集就是根据学习评估系统的需要,主要从网络教学平台数据库及其日志文件、教务管理系统的成绩数据库和相关学生信息数据库中,采集系统进行统计分析和教学系统应用效果分析所需要的数据。从采集来的数据中可以得到学生学习某门课程的具体行为数据如:每单元学习次数、每次学习时间、每次开始结束的具体时间、每单元的视频学习时间及次数、每单元的文字、课件等资料学习情况、参加BBS讨论情况、单元作业完成情况、提问情况、考勤情况等数据。
根据学习分析评估系统需要,抽取所需数据并在MySQL数据库系统,建立分析评估数据库,建立相应数据库信息表如:用户信息表User_pg见表1、课程信息表Kc_pg见表2、学习行为信息表Study_log见表3、BBS讨论信息表Bbs_pg、考试成绩信息表KS_pg、小组讨论和作业信息表等。
表 1:用户信息表
表 2:课程信息表
表 3:学习行为表
除以上数据表外,还有各种学习行为信息表如:视频观看信息表、BBS讨论信息表、作业完成信息表、小组讨论信息表、科目考试成绩表等。
统计分析模块主要是在完成对数据库中用于分析的数据进行提取、加工处理,即对采集的数据进行合法性验证,对不完整记录进行检查处理,确保数据一致性和完整性的基础上,对用于分析的相关数据进行探索性分析、相关性分析,同时为数据提供图形化的直观展现[6]。
主要从学生和课程这样两个不同的角度,进行统计分析,从而能较全面的掌握学生在线学习情况,分析教学平台的使用情况。以学生为分析对象,可以分析大学生利用网络学习平台进行网上学习的整体情况和具体科目、具体章节的具体内容的学习情况如:某同学一学期、一个月等不同时间周期的网络平台学习时间曲线,学生参加的网络课程数量以及每门课程的时间投入等详细的学习情况。以课程为分析对象,可以分析某门课程被同学们选择和学习的情况比如:分析课程被同学们选择学习的人数、专业分布、人均学习时间、课程各章节的完成度、作业完成情况等。
基于教学评估理论的研究和大学生学习的客观规律,如果学生平时学习努力、认真,相应会取得较好的期末考试成绩。因此本文采用基于机器学习的方法,通过对大学生在网络教学平台的学习行为数据,进行建模分析从而挖掘出学生学习行为和他获得的相应期末成绩之间的关系,并将学习得到的模型用于以后对大学生在网络教学平台的学习状况进行评估、预测。
常用的分类器构造方法有统计方法、机器学习方法、神经网络方法等。机器学习方法包括决策树方法和规则归纳法,前者对应的表示为决策树,后者则一般为产生式规则。机器学习的决策树方法,比神经网络和贝叶斯方法更直观,效率也更高更适合于大数据集;决策树方法不需要属性信息之外的附加信息,算法受属性字段的影响也较小;决策树获得的分类模型有更好的可解释性、通用性。因此,本文采用C4.5决策树构建算法,构建“网络教学平台-评估”模型[7-8]。
通过使用Python的数据分析工具,如Pandas、Numpy的数据库读写和统计分析功能,可以通过计算某些属性的特征量进行数据特征分析;也可以根据网络教学平台分析、评估的需要,对特定分析目标进行分析;还可以使用Matplotlib绘制各种图表,直观展现数据特征。
可以对某科目的期末成绩数据的分布特征和分布类型进行分布分析,在此基础上上做出频率分布表、绘制频率分布图,对定性的优、良、差之类的定性数据,可用饼图或条形图表示;可以进行对比分析,把两个相关的指标进行比较,比如进行纵、横向比较、时间序列的比较分析;可以计算统计量,用统计指标对定量数据进行统计描述,比如计算数据的均值和中位数,方差、变异系数和四分位间距等统计指标。
以对某学期“大学计算机基础”课的期末成绩,进行分布分析为例,绘制期末成绩分布直方图见图3所示。
图3:成绩分布直方图
该模块的实现,就是根据3.4提出的评估模块构建方法,采用机器学习的决策树算法,通过对大学生在网络教学平台的学习行为数据进行学习,找到大学生网络学习行为和学习效果之间的关系,得到教学平台评估模型,进而使用该模型对未来的大学生网络学习行为进行分类预测[9-10]。
首先对采集的分析数据库进行数据预处理,选取机器学习所需的数据字段,构建分析对象模型即大学生网络教学平台学习模型。在分析这些可用数据后,根据其与分析建模的关联性和属性间的相关性,选择相关属性用于构建学生网络学习对象模型,并对相关数据进行预处理,得到模型训练和测试用的数据集。比如为提高机器学习效率,使决策树算法最后得到的模型易于使用,预测结果易于理解,将期末的科目考试成绩从数值成绩映射成A、B、C、D、E,5个等级,将部分内容的学习时间进行加权组合,组合成新的属性数据等。
准备好学习数据集后,使用C4.5算法用于完全决策树的构造,它选取当前数据集中有最大信息增益率的属性作为测试属性,不断对样本进行划分,直到形成一颗完全决策树。C4.5算法生成的完全决策树规模太大,难以理解应用,甚至对学习样本产生过拟合问题,因此本文使用EBP方法,即基于错误的剪枝方法进行剪枝,生成最终的决策树。
准备好样本集T后,完全决策树的构造过程如图4。
图4:决策树构造过程
为验证所设计的基于机器学习的,大学网络教学平台分析评估系统的分析评估效果和评估模型预测准确性,本文使用2018-2021年的大学网络教学平台上,“大学计算机基础”课程教学数据及相应期末考试成绩数据进行实验。经过处理,选取满足实验要求的25800名同学的学习样本参与实验,将2/3的数据用作训练集,1/3的数据用作测试集。
系统使用训练集数据生成的决策树模型,对测试数据集进行预测分类,分类正确率见表4,通过实验测试,显示系统预测分类准确率达到85.36%,基本达到将该系统用于网络教学平台分析评估的要求。
表4:测试数据实验结果
本文通过大学生学习行为日志数据和相关科目期末考试成绩等数据进行建模,并采用统计分析方法和基于机器学习的分类预测算法,建立了基于高校网络教学平台的大学生网络学习分析评估系统。系统的统计分析功能,能呈现出网络教学平台的整体应用情况,可以对各院系网络学习课程建设和质量进行比较,也可以对学生个体或群体的网络学习情况用图表的形式进行直观展现;系统的模型分析预测功能可以分析大学生具体的网络学习行为特征及其与学习效果的关系,还能提前预测其期末考试成绩。
本课题,可以继续研究收集更丰富的数据种类,用于系统分析;继续改进用于网络教学平台分析评估的算法,提高算法执行效率和预测精度。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!