时间:2024-05-04
韩 敏,乔 陆(河南职业技术学院,河南郑州 450046)
基于自适应容错机制的网络资源调度平台的设计
韩敏,乔陆
(河南职业技术学院,河南郑州450046)
摘要:网络资源调度过程中存在多处理机同时发生故障的情况,传统方法在处理多处理机发生故障时,主要分析执行时间和通信时间,未对资源调度的稳定性进行考虑,资源调度存在较高的误差。为了有效解决资源调度过程中存在的故障问题,设计了基于自适应容错机制的网络资源调度平台。该平台具有网络资源发现、网络网络资源预约、网络资源动态信息查询以及资源调度运行时监控等功能。网络资源调度模块的错误检测服务包括进程监控模块、汇总模块、错误评估模块以及报警模块。通过自适应错误检测算法,对网络资源调度进程中的错误进行检测,并采取对应的解决措施,确保资源调度的顺利运行。实验结果说明,所设计调度平台在进行资源调度过程中,网络利用率、调度性能以及可靠性都较优。
关键词:容错机制;网络资源;资源调度;错误检测服务
随着科学技术和通信技术的高速发展,网络已经成为人们生产和生活必不可少的一部分,网络资源的高效调度对于提高生产和生活质量具有重要作用。而网络资源调度过程中存在多处理机同时发生故障的情况,传统方法处理多处理机发生故障,主要分析执行时间和通信时间,未对资源调度的稳定性进行考虑,资源调度存在较高的误差[1⁃3]。网络资源调度的高可靠性是系统内在要求的关键,容错调度是调度系统实现容错的有效方法。因此,考虑容错机制,设计出高质量的网络资源调度平台,具有重要应用意义[4⁃5]。
文献[6]分析了依据可靠性驱动的动态网络资源调度方法,该方法在大量资源失败条件下,基于资源调度可靠性代价为目标,实现非周期的的动态资源实时调度,但是该方法的调度效率较低。文献[7]提出了基于主动复制策略的List启发式调度算法,其可将一个资源的N+l个副本调度到不同处理机,但是在划分资源的大规模副本时,产生了较高的通信消耗和时间复杂度。文献[8]在启发式调度算法基础上,采用新的数据结构处理网络资源映射到的处理机间的通信关系,降低大量冗余通信,但是存在调度误差高的缺陷。文献[9]中的CAFT资源调度方法,其重复考虑资源调度的时间复杂度,将资源多个副本映射到不同的处理机上,但是该方法在调度资源过程中的稳定性较差。
本文设计了基于自适应容错机制的网络资源调度平台,该平台具有网络资源发现、网络网络资源预约、网络资源动态信息查询以及资源调度运行时监控等功能。
1.1网络资源高度平台的总体结构
网络资源调度平台的总体结构如图1所示。
图1 网络资源调度总体结构图
在图1所示的网络资源调度结构中,网络资源提交者将资源提交给资源调度程序,资源调度程序从其中的等待调度资源序列中采集有关待调度网络资源的反映信息以及资源申请信息,在资源提供者中搜索相关的网络需求。网络资源调度模块中的资源匹配子模块能够对资源进行匹配分析。资源管理模块将现场网络资源调度模块中采集到的网络现场资源,传输给资源提交模块,实现网络资源的有效调度,并将调度结果存储在数据库中,同时通过调度结果显示模块向用户提供网络资源调度结果。
1.2基于自适应容错机制的网络资源调度模型设计
随着网络规模的不断扩大,网络资源调度故障发生率逐渐增加,引入自适应容错机制实时检测故障,有效处理故障形成的不利干扰,确保网络资源调度的顺利进行。
1.2.1错误检测服务的设计
错误检测服务是自适应容错机制的关键部分,其可实时采集网络故障资源节点,同时将错误信息传递到错误调控服务,通过错误控制服务制定解决方案,完成错误的恢复,最终实现网络资源调度容错性能。错误检测服务包括进程监控模块、汇总模块、错误评估模块和报警模块,其结构图如图2所示。图2所示的基于自适应容错机制的网络资源调度模块的容错检测服务过程为:
(1)进程监测模块可检测到网络中运行的进程以及对应的资源,采用故障机制检测网络资源调度进程的情况,通过将故障信息传递给汇总模块。
(2)汇总模块用于采集进程监测模块传递的故障信息,采用合理的方案评估故障信息达到世界的历史信息,分析后续故障信息到达的时间。
(3)错误评估模块对网络资源调度平台是否存在错误进行评估,该模块对服务器预测的下次故障信息以及故障信息实际到达的实际进行匹配,基于该匹配结果评估是否存在资源调度错误。
(4)通信模块在存在网络资源调度错误情况下,将错误信息传输到元计算目录模块以及错误控制模块。通信模块能够在网络资源调度过程中对错误资源进行标识,并通过错误控制模块针对发生的错误进行合理的处理,确保网络资源调度的顺利运行。
图2 容错检测服务结构图
1.2.2错误检测服务的实现
基于自适应容错机制的网络资源调度模块,通过自适应错误检测算法,检测网络资源调度进程中存在的错误。自适应错误检测算法的思路为:检测进程P塑造一个滑动窗口其范围是N,其用作描述近来N次故障消息的传达,所花费的时间,用t1,t2,…,tn来描述,在任意一个新增故障消息抵达的过程中,会更换掉最初记载的那个时间,通过以上时间的记载,则可获取临近两次故障消息抵达的时间间隙Δt,如果故障消息抵达的时间间隙服从正态分布,则可预测出后续故障消息到达的时间概率,获取待检测进程超出时间t的命中率,自适应错误检测算法中的猜测程度函数Φ的分析过程如下:
(1)检测网络资源调度过程p中存储待检测过程q近期的N次传递的故障消息抵达时间为t1,t2,…,tn;
(2)基于过程(1)中的时间t1,t2,…,tn,按照ΔTi= ti + 1-ti,能够得到相近两次消息抵达的时间间隙Δt1,Δt2,…,Δtn-1;
(3)按照过程(2)获取的n-1个时间间隔,得出时间间隔的均值μ与方差σ2,如式(1)、式(2)所示:
式中:E表示参与网络资源调度的节点能量;n表示参加资源调度的节点数量。
(4)通过正态分布函数公式可获取下一个故障消息在相差t时间后抵达的概率,如下:
(5)基于过程(1)中存储的最近一次故障消息抵达的时间Tlast,获取目前网络资源调度的时间Tnow,则函数Φ值如式(4)所示:
式中:Φ(Tnow)为若网络资源调度平台在时刻Tnow,检测网络资源调度进程p未获取到待检测进程q反馈的故障消息,则进程p确定进程q存在故障的概率是Φ(Tnow)。检测网络资源调度平台是否存在错误前,网络资源调度进程会基于资源调度平台对错误检测服务的要求,设置合理的阈值α,因此,在检测错误时,实时对比Φ(Tnow)值与α值,若Φ(Tnow) >α,则说明被检测的网络资源调度进程存在错误。
1.2.3引入自适应容错机制的网络资源调度算法
通过1.2.2节的计算结果,将错误检测容错机制引入网络资源调度中,具体运行过程为:
(1)用户和网络使用者将资源传送至调度平台,并放置在网络待调度的列表中;
(2)网络信息服务依据容错机制完成资源的检测,得到有价值的资源列表;
(3)网络资源调试模块依据有价值的资源列表完成资源调度;
(4)开始调度网络资源时,根据固定的时间段塑造检验点并恢复原始数据错误等级是1;
(5)错误检测模块根据自适应容错机制检测处理单元的错误,同时将检查的信息反馈到错误决策模块;
(6)在故障消息超出设定时间后,错误决策模块分析出存在错误,则执行过程(7),否则说明不存在错误,执行过程(8);
(7)错误控制模块基于NakedJoystick提取对应的容错方案:
①NakedJoystick=1时,利用检测点与发生错误重试的容错方案,同时设置NakedJoystick++;
②NakedJoystick=2时,利用检测点与资源替换的容错方案,同时设置NakedJoystick++;
③NakedJoystick=3时代表出现了重大错误,这时要利用检测点与资源复制的容错方案;
④若无综上情况发生就代表容错机制运行失败,资源实施也以失败告终,执行过程(9)。
(8)分析是否完成网络资源调度,若完成则执行过程(9),否则执行过程(6);
(9)完成网络资源调度,说明基于自适应容错机制的网络资源调度过程结束。
1.2.4代码的设计与实现
基于自适应容错机制的网络资源调度算法执行过程代码如下:
Begin
(1)网络信息服务依据资源描述信息获取有价值的资源列表;
(2)对GA_TS网络资源进行调度;
在网络信息服务里记录发生错误的资源,同时从可用资源列表中清除;
容错机制失效,网络资源调度失败;
通过实验验证本文提出的基于自适应容错机制的网络资源调度平台设计方法的性能。实验采用的对比方法为神经网络方法。实验从网络利用率、调度性和可靠性三方面评估本文方法和神经网络方法的优劣。两种方法的网络利用率的实验结果如图3所示。
图3 两种方法的网络利用率对比
从图3中可看出,网络利用率在开始阶段,两种调度方法的网络利用率都相对较高,但是随着调度时间的逐渐增加,两种方法的网络利用率都不断降低,并且本文方法的网络利用率始终高于神经网络方法,本文方法能够充分利用网络资源完成网络资源的调度。并且本文方法的变化趋于平稳,说明本文方法能够很好地完成网络资源的调度,具有较高的调度均衡性。
如图4所示为两种方法的调度性表现,分析图4可以看出,随着资源数的增加,本文方法和神经网络方法的调度性逐渐降低,并且神经网络方法的调度性能出现显著的波动,但本文方法的调度性高于神经网络方法,表明在多资源调度环境下本文方法具有较强的健壮性。
图4 两种方法的调度性对比
如图5所示为不同网络资源调度失败比率条件下,两种调度方法的可靠性。从图5中能够分析出:随着资源调度失败比率的不断增加,两种方法的可靠性都有所下降,但是本文方法的可靠性远远优于神经网络方法,特别当通信延迟较高时,说明本文方法具有较高的可靠性。
图5 两种方法的可靠性对比
为了有效解决资源调度过程中存在的故障问题,本文设计了基于自适应容错机制的网络资源调度平台。该平台具有网络资源发现、网络资源预约、网络资源动态信息查询和资源调度运行时监控等功能。网络资源调度模块的错误检测服务包括进程监控模块、汇总模块、错误评估模块以及报警模块。通过自适应错误检测算法,对网络资源调度进程中的错误进行检测,并采取对应的解决措施,确保资源调度的顺利运行。实验结果表明,所设计调度平台在进行资源调度过程中,网络利用率、调度性能以及可靠性都较优。
参考文献
[1]华楠,郑小平.智能光网络发展历程的回顾和展望:从ASON到PCE,再到SDON[J].电信科学,2014,30(2):88⁃98.
[2]彭彬,于浩,苏韵掣,等.基于物联网的智能厂站位置服务系统[J].电力系统自动化,2013,37(16):114⁃118.
[3]鲁睿,郑小平,华楠.多域异构光网络互连互通管控机制[J].清华大学学报(自然科学版),2013(7):982⁃990.
[4]WEI Yongjian,GUO Junhu,LI Hui,et al. Experimental demon⁃stration of centralized control mechanism over all⁃optical net⁃work based on OpenFlow protocol [C]// 2014 Optical Fiber Communications Conference and Exhibition. San Francisco,CA:OFC,2014:1⁃9.
[5]真才基.TD⁃LTE网络规划原理与应用[M].北京:人民邮电出版社,2013:57⁃59.
[6]孙维成.云资源调度技术在区域医疗卫生信息平台中的应用研究[D].青岛:中国海洋大学,2013:19⁃21.
[7]汪楠.基于OpenStack云平台的计算资源动态调度及管理[D].大连:大连理工大学,2013:45⁃50.
[8]敖文凤.云计算中基于Hungarian算法的资源获取研究[D].成都:电子科技大学,2013:21⁃24.
[9]石华.异构无线网络中频谱资源动态分配[D].西安:西安电子科大学,2014.
Design of network resource scheduling platform based on adaptive fault⁃tolerant mechanism
HAN Min,QIAO Lu
(Department of Information Engineering,Henan PolyTechnic,Zhengzhou 450046,China)
Abstract:In order to effectively solve the fault problems existing in the process of resource scheduling,a network resource scheduling platform based on adaptive fault⁃tolerant mechanism was designed. The platform has the functions of network resource discovery,network resource appointment,network resources dynamic information query,resource scheduling run⁃time monitoring,etc. The error detection service of the network resource scheduling includes process monitoring module,summary module,error evaluation module and alarm module. The error in the process of the network resource scheduling is detected with the adaptive error detection algorithm,and the corresponding measures are taken to ensure the smooth operation of the resource scheduling. The experiment result shows that the platform has high network utilization,perfect scheduling performance and better reliability in the process of resource scheduling,.
Keywords:fault⁃tolerance mechanism;network resource;resource scheduling;error detection service
中图分类号:TN915⁃34;TP393
文献标识码:A
文章编号:1004⁃373X(2016)10⁃0061⁃04
doi:10.16652/j.issn.1004⁃373x.2016.10.016
收稿日期:2015⁃12⁃25
基金项目:国家“863”计划项目(2013AA09A413)
作者简介:韩敏(1982—),女,河南郑州人,讲师。主要研究方向为网站建设、软件工程。乔陆(1979—),男,河南郑州人,讲师。主要研究方向为电子商务。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!