时间:2024-05-04
牛志梅
(武汉工程大学计算机科学与工程学院,湖北武汉 430205)
伴随我国高等教育迅速发展,高等教育目前已步入大众化时期。随着科学技术的快速发展与高校规模的逐渐增大,人们对教育资源的需求也逐渐增多[1]。高等教育中的表率即为高校,而高校本身资源利用率不大,硬件配置具有重复性,软件更新效率不高。同时伴随时间延长,此类问题越来越严重。只有从根本上处理高校教育资源问题,我国的教育事业方可出现质的飞跃。目前高校师资培训体制大多以政府主导形式为主,本质上属于计划经济体制的产物,属于一种政府掌控与管理的体制[2]。伴随市场经济体制的设定与高等教育改革的推动,我国高等教育体制也逐渐变成以市场机制为核心,将政府管理作为主导的形式,运行体制也慢慢出现变动。已有高校师资培训不存在科学性、合理性培训理论,且培训内容过于单一化,不能达到理想效果。随着云计算的出现,构建一个统一化、开放化以及灵活性的教育师资培训资源管理平台可实现教育师资共享,减少教育信息化差距[3]。本文提出云计算Hadoop 平台中基于遗传算法的高校师资培训资源管理方法,用于高校师资培训资源管理。
建立基于云计算Hadoop 平台的高校教育资源网架构能够有效整合各大高校优秀师资培训资源。高校教师想在高校教育培训资源网中获取自己所需培训资源,第一步需要向云计算服务提供商上传资源获取申请,在云存储培训资源名称节点中获取对应的网址ID,并在网址的ID得到自己所需的培训资源,详细架构如图1所示。
图1 云计算Hadoop 平台的高校教育资源网架构Fig.1 Frame diagram of college education resource network in cloud computing Hadoop platform
其中各大高校师资可看作培训数据节点,通过高校管理员往云存储服务系统中传输数据,为了减少高校服务器存储容积,管理人员可判断是否删掉已上传培训资源。
培训资源名称节点将培训数据传输至云服务提供商的数据节点中,并将培训资源名称节点实行记录后存储在培训文件里,通过培训资源辅助名称节点将培训资源名称节点里的原数据实行备份,然后将数据备份文件在培训资源名称节点中实时刷新,储存最新培训资源。如果有高校师资需要该资源时,可往云服务提供商传输请求,培训资源名称节点能够通过基于遗传算法的高校师资培训资源调度方法获取资源编号,传输给客户端[4]。
遗传算法是在1975 年生物进化理论的影响下提出的,在云计算Hadoop平台里,本文使用基于遗传算法的高校师资培训资源调度方法合理管理高校师资培训资源。
1.2.1 编码设计
在云计算Hadoop 平台中,高校师资培训资源染色体编码使用自然数直接编码方法进行处理,高校师资培训资源染色体的长度与需要分配的培训任务数目相同[5]。假定一个高校师资培训资源染色体是Y={a1,a2,…,ai,…,an},那么ai表示第i个高校师资培训资源分配任务的资源,高校师资培训资源分配任务编号i具有唯一性。对各个高校师资培训任务分配一个资源,不一样的任务被分配的培训资源存在一致性。使用此方法实行编码,有利于促进高校师资培训资源染色体交叉变异,编码与解码步骤也易于操作[6]。
1.2.2 高校师资培训资源任务量
将第j个资源所具有的计算性能设成Aj,第i个培训任务大小设成Bi。假定第j个培训资源空闲时间是Cj,高校师资培训资源数目总值是n,高校师资培训任务总数目是m。则高校师资培训任务量总值B为:
若高校师资培训任务i在高校师资培训资源j中的管理用时是AB[i][j],那么AB[i][j]=D[i][j]+F[i][j]。其中F[i][j]表示第i个培训任务在第j个资源中的应用耗时,同时F[i][j]=BiAj。D[i][j]表示高校师资培训任务i在高校师资培训任务j中开始应用时间,如果D[i][j]=Cj,则表示高校师资培训资源没有被分配;如果高校师资培训资源已分配,则此资源已分配的培训任务用时设成G[i][j],D[i][j]=Cj+G[i][j]。
算法一:理论实现时间最小值运算
1)初始化目前已分配高校师资培训任务量BD=0,将n个高校师资培训资源空闲时间Cj按照自小至大的形式排列,获取n个根据顺序排序的时间段信息。
2)自第2 个时间段至最后一个时间段,实现步骤1)与步骤2)。
①判断此时间段(不包含此时间自身)和上个时间段中可用培训资源数量,运算高校师资培训可用资源运算能力总值ATotal,运算此时间中能实现的培训任务量BD=ATotal。
②如果BD+Bp≥B,那么记录上个时间段的培训资源分配情况,跳转至步骤3),反之设BD=BD+Bp,返回操作步骤2)。其中,BD表示目前培训任务量,Bp表示过去时间段中的培训任务量。
3)如果没有时间段被分配标记,那么标记最后一个时间段。
4)运算高校师资培训资源分配时间的最小值:r=被分配标记的时间+(B-BD)/被分配标记的时间中全部可用资源具有的运算能力。
通过算法一运算在理想的前提下,高校师资培训任务的分配时间最小值r,现实中因为培训任务大小和每个资源运算能力不同,最短分配时间一般不小于r。第j个培训资源理想的状态下,需要分配的培训任务量的大小Rj为:
1.2.3 高校师资培训资源初始种群的构建
在云计算Hadoop 平台里,对资源调度的及时性存在较大的要求,为了增大算法收敛效率,优化算法管理效果,高校师资培训资源初始种群中不仅存在随机性的培训资源个体,也存在较为优秀的培训资源个体[7]。则主成初始种群的方法是:
算法二:高校师资培训资源初始种群生成
破坏高校师资培训任务的顺序,针对各个培训任务,根据下述四类方法分配至每个培训资源:
1)选取一个高校师资培训资源,获取培训任务放入此资源后的用时和r之差的绝对值的最小值。
2)选取一个目前培训任务量低于Rj的高校师资培训资源j,获取培训任务放入此资源后的用时和r之差的绝对值的最小值。
3)随机选取一个目前培训任务量低于Rj的高校师资培训资源j。
4)随机选取一个高校师资培训资源。
通过算法二生成培训资源个体比直接通过随机方法生成培训资源个体的优势在于,前者生成较为优秀的培训资源个体的机率更大[8]。
1.2.4 交叉与变异
算法三:交叉算法
1)选取两个高校师资培训资源个体,标记全部的培训资源没有被选择。
2)如果全部培训资源均被选择,跳至步骤4),反之选取一个之前未被选取的培训资源,标记此资源属于已选择,对比两个培训资源个体在此资源中的培训任务,若全部培训任务均一致,则反复执行步骤2),反之跳至步骤3)。
3)基于步骤2)里最终选取的培训资源j,对比两个培训资源个体在此培训资源中已有培训任务量和Rj差的绝对值,针对绝对值很大的高校师资培训资源个体,将资源j中分配的培训任务设成没有被分配状况,将其他培训资源个体资源j中所分配的培训任务分配至此个体资源j中,再将之前设定没有被分配的培训任务按照算法二中第一个方法进行分配,从而产生新培训资源个体[9]。
4)完成。根据算法三的方法实行交叉,能够留下优秀培训资源个体某个培训资源中的所有任务分配情况。针对一个培训资源j而言,分配在它上面的培训任务数目总值和Rj的差较小,则此资源的分配方法即为高校师资培训任务用时最短的资源个体中培训资源j的任务分配形式,所以该方法可促进较为优秀的个体生成。
1.2.5 个体的选取
在实行高校师资培训资源个体交叉前,需要选取合适的培训资源个体,培训资源个体的选取方式不在少数,本文使用两种方法来运算培训资源个体适应度,第一种方法基于培训任务用时运算培训资源个体适应度,一个培训资源个体里培训任务用时越短,此培训资源个体的适应度便较大。第二种方法基于培训资源个体里资源分配的优秀水平运算适应度,详细方法是:
假定一个培训资源个体里培训资源分配的优秀水平是此培训资源中分配任务用时和r间之差的绝对值,此差的绝对值较小,则此培训资源的任务分配数目合理,此培训资源分配情况较为优秀。针对各个培训资源个体里的全部培训资源,根据培训资源的优秀水平进行排列,删除p⋅m个优秀水平较差的培训资源,将剩下的培训资源放至集合O里,p表示培训资源j中实行分配任务的用时情况,针对O集合里的培训资源,运算用时和r间的均方差K为:
式中M表示集合O中培训资源数目。
本文通过K值判断适应度的情况,K值越小,则适应度越大;K值越大,则适应度越小。为了使用更为优秀的培训资源,上述方法中删除了优秀水平较小的培训资源数,但其中一部分优秀水平不高的培训资源个体适应度较大,也会被留下。
针对培训资源个体的选取,先通过第一种适应度方法获取一部分培训资源个体,再通过第二种适应度方法在剩下的培训资源个体里挑选剩余培训资源个体。第一种方法选取能够留下整体较好的培训资源个体,第二种方法选取能够留下一部分较为优秀的高校师资培训资源个体,此类培训资源个体在和别的培训资源个体实行交叉时,能够为剩余个体给予更好的交叉点,促进了高校师资全局最优培训资源个体的生成[10]。全局最优培训资源个体即为最符合用户所需的培训资源。
为验证本文方法对高校师资培训资源管理的性能,选取本文方法、基于资源签名的自动寻优方法以及基于神经网络的资源管理方法进行对比实验。将2010—2015 年随机抽取的实验高校师资依次分成985 工程院校师资、211 工程院校师资以及普通高等院校师资。
采用三种方法对三种不同类型的高校师资进行培训,培训次数设成6 次,分析三种方法管理下培训资源提取结果,判断其调度精度并进行对比,对比结果如图2 所示。
图2 三种方法对高校师资培训资源调度的精度对比结果Fig.2 Comparison of accuracy of college teacher training resources scheduling of three methods
分析图2 可知,在985 工程院校师资、211 工程院校师资以及普通高等院校师资的培训管理中,本文方法的培训资源调度精度始终位于基于资源签名的自动寻优方法和基于神经网络的资源管理方法的上方,本文方法的培训资源调度精度均大于0.95,由此可知,本文方法的培训资源调度精度最大,高校师资培训资源管理效果最好。
分析上述实验中三种方法在管理高校师资培训资源时的资源利用率并进行对比,对比结果如表1 所示。分析表1 可知,本文方法在管理高校师资培训资源时,整体资源平均利用率是(0.98+0.99+0.98)3=0.98;基于资源签名的自动寻优方法和基于神经网络的资源管理方法的资源平均利用率分别是0.88,0.86。经对比,本文方法的资源利用率最高。
分析三种方法在管理高校师资培训资源时的灵活性,该灵活性侧面体现了三种方法应用在云计算Hadoop 平台中的负载均衡性。三种方法的资源管理灵活性对比结果如图3 所示。
图3 三种方法资源管理灵活性对比结果Fig.3 Comparison of resource management flexibility of three methods
表1 三种方法资源利用率对比结果Table 1 Comparison of resource utilization rate of three methods
分析图3 可知,本文方法对高校师资培训资源的管理灵活性最大值为98.88%,基于资源签名的自动寻优方法和基于神经网络的资源管理方法的资源管理灵活性最大值依次是91.23%,87.98%。由此可知,本文方法的资源管理灵活性最高,说明在云计算Hadoop 平台中,本文方法管理下的高校师资培训数据处理效果好。
本文提出云计算Hadoop 平台中基于遗传算法的高校师资培训资源管理方法,和其他资源管理方法相比,该方法不单调度精度高达0.95,而且资源利用率高达0.98,除此之外,资源管理灵活性也未低于97%,可为各大高校师资培训资源管理提供有效帮助。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!