时间:2024-08-31
宋忠洋
摘 要:核电企业由于岗位编制人员数量限制,内部IT资源无法完成与日俱增的信息系统运维工作任务,为保证信息系统稳定运行,只能通过服务外包管理模式或者混合管理模式借助外部IT资源开展运维工作。综合考虑业务、人员、技术、安全、财务等多方面因素,多数公司倾向采用混合管理模式,内外部资源共同组成运维团队。本文讲解了某核电企业通过混合管理模式运维信息系统所遇到的管理上问题,并介绍如何借助信息系统提升运维管理水平,保证运维人员的工作效率。
关键词:核电 信息系统 运维管理
信息系统建设期尽管项目组编写测试脚本对系统进行充分测试,但是后续上线运行使用过程中难免还会有遇到新的缺陷。公司内部IT人员负责需求调研、业务梳理、蓝图编制、系统配置等,外部人员负责代码实现和测试验证,从而及时解决系统缺陷,完成需求变更,支撑公司各项业务工作正常开展。
1 运维管理现状
2009年为了提高维护响应效率,规范维护流程,提供单点接入服务平台,并参考同行的良好实践,某核电企业依据ITIL(Information Technology Infrastructure Library,信息技术基础架构库)理念建立了面向公司用户的IT服务体系,设置了IT服务台。服务台按照ITIL理念为公司用户提供IT服务,实现了用户报修→服务台建单→二线工程师处理→为用户解决→服务台与用户确认并关闭事件单的闭环处理流程。根据职责分工,公司运维小组承担二线工程师岗位,主要的工作内容包括如下。
(1)事件单处理。
用戶在信息系统使用过程中如果遇到问题或存在疑惑,联系服务台,服务台人员登记请求人、信息系统、问题详情等信息形成事件单转派给运维组,运维组工程师分析问题产生的原因并进行处理,并把通过结果反馈给请求人。
(2)缺陷修复。
运维组负责分析缺陷产生的原因,寻找解决方案进行修复,然后部署到生产系统,以保证业务正常执行。
(3)需求变更。
运维组需要根据业务部门提交的需求变更申请,编写配置文档或开发文档,调整系统功能,已适应新的管理要求。
(4)业务数据修改。
业务数据修改包括前端修改和数据库层面修改,运维组主要负责数据层面的修改。根据业务部门提交的数据修改申请,构造SQL(Structured Query Language,结构化查询语言)语句,提交数据库管理员执行。
(5)知识积累。
信息系统运维过程中,很多问题重复出现,运维组需要对常见问题进行总结、提炼,形成文档,保证运维知识能共享,可传递。
整个运维组工作任务中,事件单管理使用基于BMC Remedy产品搭建了ITSM运维管理系统,但是由于未对BMC Remedy产品进行深入开发,无法支持需求、缺陷全生命周期管理。因此除了事件单外,其他均无信息系统支持。随着运维组负责运维的信息系统数量越来越多,运维管理矛盾日益突出,包括:
(1)信息系统需求变更申请、数据修改申请线下纸质审批,效率低下;
(2)信息系统需求变更和功能缺陷通过Excel维护管理,无法快速掌握任务进展情况;
(3)运维经验总结存在个人办公电脑中,不利于知识分享和传递;
(4)无法掌握每位运维人员工作量及各系统需求和缺陷未完成情况。
2 运维管理平台建设过程
为了规范化需求变更、数据修改审批流程,准确掌握系统缺陷、需求变更进展,共享运维经验,科学管理运维人员,运维组启动运维管理平台建设工作。为了不影响计划中运维工作,运维平台建设以“快速、实用、经济、好用”为宗旨,采用使用成熟软件为主、自开发为辅的模式。根据不同的阶段面临的管理需求不同,一体化运维管理平台建设分“三步走”。
2.1 系统建设
(1)工作流开发。
根据公司管理程序要求,信息需求变更和信息系统业务数据修改均需经过批准后才予以实施,两项任务均涉及到工作流。由于公司基于SAP BPM引擎开发大量审批流,基础框架高效、稳定,同时流程中的工作任务均集成到统一工作门户中,实现集中处理,所以信息系统需求变更流程和信息系统数据修改流程均通过自开发的方式,基于SAP BPM引擎实现。
(2)需求、缺陷管理。
信息系统需求管理、缺陷管理均有一套方法论支持,自主开发不仅需要先消化方法论内容,而且工作量非常大。经过市场调研,最终选择禅道国产开源项目管理软件用于需求和缺陷的管理。
(3)知识管理。
知识管理系统需求比较简单,主要是知识创建和使用,其中知识创建过程一定要简单,使用过程一定要方便。经过调研,市场上存在一些产品,但是操作过于繁琐,界面复杂不满足需求。经过评估最终采用Java语言自主开发。考虑到工作量,本系统不使用复杂的框架,但是依旧遵循DAO(Data Access Object,数据访问对象)设计模式,数据库操作使用Mybatis框架,UI(User Interface,用户界面)界面EasyUI组件。
2.2 系统集成
第一步走完后,运维中的工作任务均实现信息化覆盖,有效提升运维管理水平,实现运维知识共享化。但是由于整个运维工作使用了多套信息系统,系统间没有集成,来回切换影响工作效率,故第二步打通系统间数据壁垒,实现数据交互与共享。通过对运维管理流程进行梳理与讨论,一体化运维管理平台系统间数据流。
(1)ITMS中事件单经过分析后确认为系统缺陷,通过接口需把相关信息传递到禅道系统中,按照缺陷的管理方法进行管理;
(2)缺陷解决后,通过接口更新对应的事件单状态;
(3)需求变更经过批准后,通过接口把相关信息传递到禅道系统中,按照需求的管理方论进行管理;
(4)数据修改经过批准后,通过接口把相关信息传递到ITSM系统中,按照事件的管理方法进行管理。
(5)对于常见的数据修改,形成解决方案,后续相同的数据修改申请流程直接引用已经存在的知识点,而无需每次都写修改方案。
为了降低耦合度,提高系统的可扩展性,各系统间采用SOA(Service-Oriented Architecture,面向服务的架构)架构,首先制定服务的接口规范,然后按照规范开发SOA服务。系统间数据壁垒打通后,减少了需求、缺陷创建重复工作,有效提高了运维工作效率。
2.3 指标分析
从2011年试验性引入2名Java开发人员开始,随着上线的信息系统增加,运维工作量越来越大,陆续引入多种语言开发顾问,内外部资源组成的运维团队超过20人。如何保证运维人员认真处理分配的工作任务,如何保证运维任务分配的科学合理,是运维组负责人需要思考的问题。虽然相关纬度数据均存在系统中,但是统计分析耗费大量时间,因此,一体化运维平台搭建第三步,开发指标分析系统。
指标分析系统上线后,运维组负责人可实时掌握每个运维人员工作量,用数据督促大家积极努力工作。同时通过分析各信息系统需求和缺陷未解决数量,及时调整投入的运维资源,快速解决遗留问题,有效提高的用户的满意度。
3 结语
一体化运维管理平台从构想到落地经过3个阶段,历经5个春秋,充分验证了随着精细化管理水平的不断提升,业务部门对信息系统的需求也在不断的改变。运维团队唯有通过科学合理的管理制度,简单易用的信息系统方能快速响应新的需求变更,提高运维管理水平,保证运维人员的工作效率,保障了信息系统安全、稳定、高效运行。
参考文献
[1] 曹姝媛.山东核电调试生产信息管理系统运维管理研究[Z].电力信息化文库,2016-07-19.
[2] 符长青,符晓勤,符晓兰.信息系统运维服务管理[M].北京:清华大学出版社,2015.
[3] 项目管理协会.项目管理知识体系指南[M].北京:电子工业出版社,2013.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!