时间:2024-06-19
王 慧,孙德红
(闽南理工学院 信息管理学院,福建 石狮 362700)
在教育信息化改革不断深入的时代背景下,在线教育实现了快速发展,信息化技术的应用使其迎来了巨大的发展机遇,同时也为学习模式的创新发展指明了新的方向。受互联网强大的信息传输功能影响,用户可以选择的学习资源更加丰富,学习活动的开展也不再局限于固定的时间和空间范围内,不仅提高了用户学习的积极性,而且优质学习资源的价值也实现了指导提升。因为在互联网环境中资源的共享范围更大,优质资源被重用的次数更高[1]。因此,学习者的学习积极性极大地提高,其能够以自主意愿更加全面地了解所属领域的知识内容,在学习效率和学习效果上表现出惊人的成绩[2]。但是,在线学习用户数量的快速增长使得与之相关的产业链不断优化,以学习资源为产品的企业以爆炸式的趋势快速发展,由此带来的信息大爆炸也产生了一定的负面影响。因此,国内学者针对资源信息过载这一情况展开研究。张晓丹[3]提出对改进的图神经网络文本分类模型应用进行研究,利用文本、句子及关键词构建拓扑关系图和拓扑关系矩阵,采用马尔科夫链采样算法对层节点进行采样,再利用多级降维方法实现特征降维,完成文本分类。该方法虽然能够保证文本及文献大数据得到有效的分类,但其分类的精准率较低。学习资源的个性化推荐成为现阶段个性化学习的重要工具。与系统化教育相比,个性化学习更加注重对学习资源与用户需求之间的匹配关系[4]。任蓓蓓等[5]提出基于深度学习的数字图书馆资源个性化推荐模型设计方法。通过深度学习算法,根据用户特征、行为与偏好等信息对数字图书馆用户进行建模,从而实现数字图书馆资源个性化推荐。但该方法对目标资源的定位需要用户花费大量的时间,最终的定位结果也无法得到保障。
基于此,文中从用户的角度出发[6],以用户自身的偏好为基础,结合学习资源的知识点构成,实现个性化的学习资源推荐,并通过试验测试的方式与不同方法同时进行应用分析,验证了文中算法的有效性。
对用户特征进行分析是掌握用户的基础学习情况和学习偏好的主要途径[7],以此为基础可以更好地确定用户的学习目标,为学习资源的组织推荐提供依据。就现阶段以E-learning为主要环境的学习而言,用户学习的特征在学习过程的价值和重要性被放大[8],因此,文中在进行资源推荐之前,对用户学习的内部因素进行了充分了解,而该过程主要是通过对用户在线学习行为特征分析实现的[9]。
一般情况下,学习行为的出现以目的性的形式存在,用户为了达到某种学习效果,在学习活动过程中会通过优化学习习惯、调节学习方式、选择学习内容的方式提高学习效率,而这一系列行为的出现都是以一定共性存在的[10]。为了切实实现对用户行为特征的全面挖掘,文中对其进行分析。
如图1所示,对用户在线交流互动情况的分析与以教师面授学习为基础的传统教学模式不同,在线教学更加注重对课堂沟通、交流的应用,媒体课件展示的方式也可以将知识点更加直观地传达至用户[11]。当在学习过程中出现不能理解的难点时,用户可以通过线上交流的及时性特征实时提出自己的疑问。因此,文中以用户在小组讨论、主题讨论、发布问题、回答问题等交互行为中的表现对其偏好以及主要问题进行采集。其次就是学生自主学习的意识。在学习过程中,用户会根据自己的学习需求以及兴趣趋向主动对相关知识内容进行搜索和浏览[12],由此产生的点击、收藏以及下载操作都会直接或间接地体现用户的偏好。除此之外,用户在知识社区、论坛的答疑解惑行为也是由用户主观能动性引起的,也可以在一定程度上反馈其偏好。用户结合自身存在的不足,根据自己的实际情况对相应的知识点进行重复学习,该部分内容也是资源推荐的重要组成部分之一。除了上述特征外,用户自身对知识的掌握能力决定了推荐学习资源的难易程度。在学习目标的推动下,用户对知识掌握能力可以实现不断发展,但这种发展也是阶段性的,因此,按照现阶段用户对知识的理解程度和深度对其进行资源推荐决定了最终用户对其使用情况。
图1 基于用户特征的偏好挖掘方法
以此为基础,文中将用户在学习过程中表现出的学习行为特征作为其偏好的判定依据,并实现个性化学习资源推荐。
要实现对学习资源的有效推荐,仅考虑用户的偏好是远远不够的,在目前的教育环境中,学习资源无论是在结构上还是表现形式上都呈现出明显的复杂化和多样化的趋势,其中,表现形式就可以分为课件、案例、文献、索引、网络课程、试题、试卷、作业、文本等。在此背景下,通过改进图神经网络实现以知识点为基础的本体构建。该过程以充分体现各级各类的学习资源数据共享价值为基本原则,对存在无序性、非结构性的学习资源进行划分,具体的划分类别包括文本类资料、媒体类资料。其中,文本类资料包括课件、案例、试卷、辅助材料练习册等;媒体资料包括视频、动画、音频、文本、图片等。对于部分难以直接界定其划分类别的资源,利用改进的图神经网络对其进行结构重组,采用基于元数据的本体表示构建方法解决图神经网络中存在的知识领域定义模糊问题。
为此,首先构建了学习资源模型,具体为
(1)
式中:γ为学习资源模型;xi为其知识点组成;sim(x1,x2,…,xi)为各知识点间的相似程度;p为资源中元数据占比。该模型主要用于学习资源中知识点的管理和检索,利用知识点描述资源本体时,通过元数据建立本体与知识点之间的关联关系,利用元数据属性对不同类别的层次进行定义,构建出包括父类(资料、动画、课程类等)和子类(文本类、图形类、视频类、图像类、音频类等)的图神经网络。此时学习资源本体的层次关系可以体现出资源在知识点构成上的差别。为了关联不同资源,将改进图神经网络资源结构中的知识点间关系设计为父子、参考、依赖、平行4种。其中,父子关系主要体现资源间的部分与整体性,依赖关系主要体现资源间的重叠性,平行关系主要体现资源间在知识点构成上的独立性。
在获得用户偏好信息和学习资源本体信息后,为了提高推荐结果的可靠性,分别对二者进行双重聚类处理,即通过双重聚类算法分别产生用户聚类和学习资源聚类,对聚类结果进行匹配,确定最终的推荐内容。
对于同属于一个聚类中的用户,其对学习资源的偏好具有更高的相似性。为了尽可能提高聚类中用户对资源需求的一致性,文中确定聚类划分的标准是以其对资源的评价结果为基础设计的,用L表示用户集合,用ln表示生成的n个用户聚类。其具体计算方式为
L=l1∪l2∪…∪ln,
li∪lj=Ø.
(2)
由此生成n个用户聚类,对应的用户聚类中心数量也为n,在每个聚类中心位置的用户对学习资源的评分结果即为聚类用户划分的目标值。文中设置到聚类中心点的距离r不超过50%。对于学习资源的聚类也采用相同的方法。
在完成对用户偏好以及学习资源的聚类处理后,通过计算二者的中心拟合度判断资源是否满足对应用户类的需求,其计算方式为
D=sim(Ol,Oz).
(3)
式中:Ol和Oz分别表示用户和资源的聚类中心。在此基础上,是否进行推荐的判定标准如表1所示。
表1 资源推荐判断标准
按照表1设置的标准,确定是否需要进行推荐。对于需要进一步对知识点拟合度进行计算的资源,同样按照表1的标准进行判定。
文中进行实验的环境为Windows 10 64位操作系统,CPU参数为Intel(R)Core(TM)i5-3470,系统的内存空间为64 GB,使用的Matlab R为2020a版本。为了更加准确地验证文中提出的算法,分别从可行性与有效性两个角度进行测试。从某互联网教育平台中随机选取10名学生参与实验。参与实验的10名学生均为在校大学生,其中,4名学生成绩优异,3名学生成绩中等,3名学生成绩中下。按照抽取顺序将10名学生设置编号为1~10。实验数据集以“人工智能”课程为基础自主构建,其中,分为试题和考试答题数据两种类型,具体的实验数据集设置如表2所示。
以表2中数据为基础,将所有试题的答案数据归一化处理,并将主观题的最终分数与客观题的最终分数映射到[0,1]的区间范围内。与此同时,为了确保测试结果的可靠性,构建了3个指标作为测试结果的评价依据,分别为推荐精确率Precision(用P表示)、推荐内容召回率Recall(用R表示)以及F1综合评价指标,精准率、召回率、F1值越高越好。三者的计算方式为
(4)
(5)
(6)
式中:P表示推荐学习资源中知识点与实际学习需求一致的程度,也就是推荐精确率程度;R表示推荐学习资源中知识点与实际学习需求一致的比例;TP、FP和FN分别表示最终推荐内容包含的知识点、需要的知识点以及不需要的知识点。
表2 实验数据设置
为了确保后续指标计算结果的可靠性,对所有知识点对应知识图谱中的贡献值进行分析,并得到了如表3所示的结果。
表3 知识点贡献值统计
以此为基础,在10名参与实验的学生中随机抽取5名学生,从宏观角度分析学生对于不同知识点的失分率,其结果如表4所示。然后对这5名学生完成推荐内容学习后的知识点失分率再次进行计算,其结果如表5所示。
通过对比表4和表5不难看出,经过学习推荐的内容后,知识点的失分率呈现出明显的下降趋势,表明文中设计方法的推荐内容对于学生的学习需求具有较强的判断能力,推荐效果良好。
表4 学生对知识点的失分率统计
表5 学习推荐内容后学生对知识点的失分率统计
为了验证该方法的优越性,分别采用SETB算法和TBTFIDF算法作为对照组,与文中推荐方法进行试验测试。通过比较3种方法的推荐结果,对文中方法的有效性进行分析,得到实验结果如表6所示。
表6 不同方法的推荐效果统计 %
从表6可以看出,与SETB算法和TBTFIDF算法相比,文中方法的推荐精度、推荐内容的召回率以及F1综合评价指标都表现出明显优势,表明文中设计方法能够实现以学生需求为基础进行个性化学习资源推荐,对提高学习效果具有明显作用。
随着现代通信及信息技术的不断发展,资源的共享程度实现了全球化发展,与此同时,这种高度复合化的资源一方面丰富了学习的可利用资源,另一方面也对资源的选择提出了更高要求。为此,如何充分结合资源自身的知识组成以及用户的学习需求,实现高质量的学习资源个性化推荐成为值得关注的重点问题之一。
文中基于改进图神经网络和用户偏好聚类的个性化学习资源推荐算法进行研究,以用户行为为基础,挖掘用户的偏好,并通过改进图神经网络搭建学习资源的知识点架构,在聚类的基础上实现二者之间的匹配关系,确定最终的推荐内容。这种推荐方法在测试中取得了良好的效果。通过本研究,以期为提高学习资源的利用率,降低用户在资源选择中的时间成本提供有价值的帮助。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!