时间:2024-05-04
戴山
摘要:计算机房的运维工作—直属于一种复杂类型工作,尤其是高性能计算机房仅仅依靠单个运维人员技能根本无法实现全面的操作和管理,为了建立起系统的标准化运维体系,需要在高性能计算机房运行维护中引进流程管理技术,促进计算机的运行和维护工作更加快捷和高效。文章从机房运维的现状出发,对流程管理模式进行了深入分析。
关键词:流程管理;机房运维;标准化
对于核心的高性能计算机房的使用和日常维护要求较为复杂,完备的机房运维体系的建立是近些年来高性能计算机快速发展和广泛应用大背景下的重要趋势,流程管理的主要技术服务和价值方向就是保证高性能机房的运作效率,同时要保证机房的使用安全性和低成本,利用流程管理这一先进的计算机管理模式有利于机房“标准化”的建立。
1.机房运维现状分析
我国目前的大部分学校、企业都拥有自己的独立高性能计算机房,与此同时,企业的机房运行和维护体系也都已经处于长期连续工作多年的状态,据统计,企业核心高性能计算机房人为事故没有发生过,突发的停机状况也较少。但是随着企业的技术革新进步和发展,机房设备也在不断升级,用电制冷越来越处于复杂状态,由此导致运行维护工作的难度逐步加大。
1.1运维设备多导致技术复杂
每个不同企业的机房场地和内部为了实现不同功能的维护和运作,设备种类较为复杂,例如:必要的高低压配电装置,机房内部和科室的精密空调,不间断电源(UPS)、中央空调装置、防火报警器、安保设施、电梯维护检测系统等,一共包含了25种以上的运维设备,部件单元数量更是达到一百以上之多,其中各种设备均利用了不同的尖端应用技术,同时不同设备之间也会存在彼此的联系和影响,每个不同的设备单元在实际运作过程中如果存在问题都对整体的计算机系统造成连锁影响,所以对运维的技术要求较高,实际操作的运维难度可想而知。
1.2故障停机损失大
对于企业的核心高效能计算机,如果在运行过程中突发安全故障就会导致重大损失,所以核心计算机的安全运行维护责任重大,根据调查研究表明,企业的运维程序启动中拖延半个小时,会造成实际产值5万元以上的损失,同时也会有设备和耗材的多种不同损失。我国的安全生产管理条例中明确规定,运维人员需要承担因为操作失误和未采取运维措施导致的生产损失,对于情节严重者依法追究其法律责任。所以运维人员对设备操作安全责任意义重大,维护工作的进行必须时刻谨记具体的操作规范,这些都必然造成运维工作的任务量加大。
1.3缺乏先进设备的使用经验
目前我国的很多企业在高性能计算机房的使用环境保障领域都开始大量引进先进的科学技术和设备,致力于建立高品质的机房工作环境,但是目前单一依靠现行的高性能计算机运行和维护体系很难实现安全规范操作和运行成本的降低;在短期内,国有企业在人员调整方面无法实现较大的变动,外部运维技术力量的引进和新技术的实际操作完全掌握也需要较长时间;实际企业运维部分安全和服务意识已经长期建立,提升空间有限。对于以上问题的解决必然需要对企业的管理模式进行开拓和创新。
2.流程管理模式概要
改进和完善计算机环境同时实现运维环境的安全稳定保障是管理模式调整的重要目的,从而实现更加快捷、安全、低成本的运行管理。最优解决方案就是在实现机房运维长期安全稳定的基础上,以最低成本实现最高效率。
通过研究管理分析,流程管理是有效解决高效能系统运作和管理中各类问题的有效措施,可以快速实现安全操作和效率提高,流程管理模式的主要目的就是提高组织业务业绩,实现系统化管理分析,其中流程管理的主要内容包括流程分析、流程分析和重复定义、资源合理配置、时间分配、管理流程的组织和服务质量、效率评估等。流程管理实现了对日常工作的合理划分,同时实现不同流程和环节的嵌套和衔接,将不同部门的工作人员进行详细划分,赋予不同角色安排在不同岗位。流程管理技术可以有效实现管理目标的合理改变以及过程运作的标准化发展,保证动作、参数、验证等多个环节的合理标准进步。引进流程管理模式的结合可以有效实现运维工作流程的标准化发展,实现对现有工作模式的的有效调整和优秀资源配置,通过潜移默化地影响,实现工作效率的改进和提高,实现企业管理水平的有效提升。
3.流程管理模式内容研究
3.1梳理资源同时界定职责
流程化工作的主要内容第一步就是对工作内容进行合理的划分和安排,对所有可用资源进行优化组合。核心机房的运维资源内容主要涵盖了对人力资源的整理、设备机械资源、维修防护整理、技术技能的掌握整理,其中对于人力资源的优化整理主要的对象就是对所有在岗在职人员,可以对在职人员进行定岗定员分配,对于不同的技术掌握程度进行不同的岗位安排,对于运维的值班安排和场地的维护以及相关操作人员需要格外注意,场地的技术指导和设备安全管理必须有明确的规章制度可循。对于流程优化应该有一个明确认识,明确流程管理的核心目的,同时也是提高流程管理效率的重要方式和重要手段,对流程管理资源配置方面的梳理和总结,有利于实现流程管理的合理化进步,实现运行速度的提高。机房运行和操作具有很大的危险性,对于不同的设备和机械要进行细节和技术验证以及实践证实。
3.2梳理流程并践行标准化
在对现有资源进行合理规划后,紧接着的一项任务就是流程梳理和具体流程体系的设计。高性能计算机房环境进行控制和保证的主要系统包括:设备运行状态监控系统、设备操作规范流程存档、环境稳定流程体系。设备运行状态监控系统主要作用是对现有设备进行标准化和实时监测分析。对于设备的操作规范流程存档应该进行预期的步骤标准化研究和安全标准化员工培训,对于环境稳定流程体系需要对工作环境的规范化和检验过程的标准进行综合整理。
3.3进行标准化交互培训
流程培训的标准化发展是确保流程执行和发展安全舒畅的重要保证,同时也是流程管理和技术管理的核心所在,可以快速实现流程执行者的系统知识掌握和操作规范性以及效率的提高,对于机房的运行和维护需要确保维修岗位和值班岗位的合理调整和安排。对于维修岗位人员应该选择年龄较小同时接受力和理解力较强的员工担任,重点进行岗位运行和维护的原理分析和基础操作规范的学习和能力培养。值班岗位人员在大部分企业都属于已经工作多年的有经验员工,对于相关设备的维修和管理拥有一定的实际经验和窍门,在接受系统的流程培训以后,再对维修岗位进行实践操作培训,积极传授操作流程和操作管理等实际经验,对操作和管理中的不正当行为进行合理解释和回答。
4.结语
通过流程管理技术在企业的实践和应用,可以有效实现企业核心高性能机房的运维体系合理化水平提高,同步实现了工作流程和设备维修的标准化进步,可以更好地推动高性能机房合理化管理工作环境的构建,达到服务企业的管理目标。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!