当前位置:首页 期刊杂志

数据中心全生命周期理论分析及实践

时间:2024-05-19

董江波

【摘 要】由于近年来国土资源信息化飞速发展,利用科学理论进行数据中心的建设与管理成为目前保障和支撑信息化系统安全运行的必要手段,本文依据数据中心全生命周期理论,回顾了河南省国土资源数据中心多年来在建设、运维、优化等方面的体会。

【关键字】数据中心;生命周期;七个阶段;应用实例

中图分类号: TP308;F426.61;F426.91 文献标识码: A 文章编号: 2095-2457(2018)27-0253-002

DOI:10.19694/j.cnki.issn2095-2457.2018.27.117

0 引言

依据《国家信息化发展战略纲要》、《国土资源信息化“十三五”规划》和《河南省国土资源信息化“十三五”规划》的要求,我省国土资源信息化的发展要在十三五期间实现6个覆盖,即国土云端全覆盖、智能审批全覆盖、監管决策全覆盖、数据共享全覆盖、智慧服务全覆盖和安全保障全覆盖,这就要求我们从技术和运维保障方面全时全域的支撑业务系统的发展及安全运行。我们已经步入了国土资源云时代,本地数据中心正从固化的服务器和应用系统的集合进化为弹性的智慧云计算数据中心,对于省级国土资源部门来说,作为全省国土资源信息系统安全运行的重要基础之一,本地数据中心的改造与升级也日趋迫切,而数据中心的建设与维护是一个庞大而复杂的信息系统工程,我们可以依据数据中心全生命周期理论进行更高效的管理,本文就河南省国土资源数据中心的建设及运维现状结合数据中心生命周期理论提出建设与管理方面的改进建议,详细阐述了如何利用目前的主流技术解决当前建设及运维过程中出现的问题。

1 数据中心全生命周期理论简述及实践

数据中心全生命周期共分为七个阶段,其中的闭环管理过程包括六个阶段,通过这六个阶段可以提升数据中心的持续可用性及性能。

(1)规划阶段:首先要确定容量、关键程度、功率密度、效率、发展规划与预算等重要的项目参数,这些都是决定整个数据中心项目成败与否的关键。2013年开始筹备建设的厅第二机房在规划阶段就对这些关键因素进行了详细调研,一切从实际出发进行规划,这些因素的第一项就是发展规划,要满足未来5年信息化建设对机房空间的需求,而这一要求也同《国家信息化发展战略纲要》、《国土资源信息化“十三五”规划》和《河南省国土资源信息化“十三五”规划》是一致的,所以厅第二机房自建成至今完全满足了实际使用需求,建成后没有对基础设施追加任何投资,达到了规划目标。

(2)设计阶段:这个阶段的核心内容是将规划结果转化成图表和施工文件。厅第二机房在规划方面要求大容量,高机架功率密度,在关键程度方面要求高可用性等级,在效率与环保方面要求节能环保,这些规划结果都需要在设计中来实现。厅第二机房面积为90平方米,而且房间内可使用空间不规则,如何实现大容量就成为一个亟待解决的设计问题,按照传统的机房设计根本无法实现,因此采用了封闭冷通道系统,不仅解决了容量问题,还实现了节能要求;高机架功率密度主要是针对配电系统的要求,厅第二机房采用的是每机柜6KW的用电标准,主配电柜采用双路供电,UPS采用双机独立运行的模式,每个机柜都有两个独立供电的PDU,这样使单点故障的几率降到50%,提高了整个系统的高可用性;在环保节能方面,主要是采用了环保的装修材料,对精密空调的选择提出采用ECC风机及使用绿色制冷剂的节能环保机型。

(3)建设阶段:数据中心所有者及管理者必须关注项目进度、质量性能并进行风险分析,数据中心建设是一项复杂的系统工程,涉及基础装修、消防系统、承重、供配电系统、空调系统、布线系统、安防系统、防雷接地系统以及环境监控系统等方方面面的内容,要确保每项、每个具体细节施工工艺的高标准和科学规范性,是数据中心建设工程高质量的重要体现。一是充分发挥项目监理方的作用,通过合同明确目标责任、工程质量标准和规范施工程序及流程,细化量化其监理职责和范围,督促其搞好建材质量、施工程序、设备质量等方面的施工过程监理。二是坚持单项工程完工检验制度,对单项工程完工检验,按工程设计和质量标准进行认真逐项审核和初步验收,对初验不合格工程按初验意见进行整改,对初验合格工程留待整个项目建设竣工后再一并进行整体验收。三是拟定机房建设项目分项验收表,细化工程质量验收标准,做到有章可循,并采取三方检查验收及实行共同签字制度。

(4)评估阶段:机房电气设备的检测是数据中心建设中十分重要的一个环节,作为数据中心的首要要求就是数据中心的运营安全与高可用性。当数据中心新建成时,所有的电气设备、暖通、制冷和备用电源,都是以单组件组合的方式建成。整体的运行检验,也仅仅是通电、启动、关闭。作为空载机房,它的实际运行情况与空载差距甚远,数据中心验证测试的相关统计数据表明新建机房经第三方验证测试质量问题可降低60%,在机房定期检测评估后,风险率降低50%。由于数据中心必须满足计算机等各种电子设备和工作人员对温度、湿度、洁净度、电磁场强度、噪音干扰、防漏水、电源质量、防雷和接地等条件的要求。所以一个合格的数据中心应该是一个安全可靠、节能高效和具有可扩充性的机房,因为一个承载关键负载的设备一旦投入运行就很难停下来进行维护。

(5)运行阶段:运营及维护管理是数据中心的全生命周期中最长的一个阶段,也是一个动态的过程,第一机房自2006年12月投入使用以来已经运行12年,第二机房自2015年3月投入使用以来已运行了3年。长时期的运行中出现的问题也最多,特别是精密空调和UPS这些关键设备,一般IT设备的使用年限为5年,而这些关键设备的使用年限是一般IT设备使用年限的2到3倍,所以如何在关键设备出现问题后及时发现并解决就显得尤为重要,而这就需要运维阶段严格按照设备的维护周期进行检查并维护,同时通过机房环境监控软件及时发现机房的异常情况以减少设备故障所带来的损失。

(6)优化阶段:随着应用系统的不断增加,对数据中心的需求也与日俱增,必须通过优化数据中心基础架构来满足性能的提升、设备密度的增加和高水准的服务。而这就需要优质的运维工具、完备的管理经验及大量的基础数据,确切的知道物理系统上正在运行着什么,分析出当前和未来的潜在需求,从而更好的主动分配系统资源,让数据中心未来支撑更多的信息系统。

(7)老化阶段:数据中心老化的标准是已经无法支撑不断增长的需求、能源效率低、运营成本高,这就需要我们对数据中心重新规划,并依据出现的新标准,采用新技术对数据中心进行重建或重塑,而如何有条不紊的让新旧数据中心进行平滑的过渡将成为一项重要的工作。

2 河南省国土资源数据中心的建设及优化

河南省国土资源数据中心包括两个机房,分别建于2006年和2015年(下文分别称“第一机房”和“第二机房”),其运营也符合上述生命周期规律。

2.1 第一机房

第一机房是2006年建设的,规划、设计、建设、评估都是按照当时的标准建设的,满足了当时的使用需求,而在第五阶段即运维阶段出现了很多问题:一是不能满足信息化发展的需求,不断增加的应用也使设备数量猛增,而设备的增加导致强电系统无法满足数据中心安全稳定运行的要求,机房内新增的大量设备又使温湿度失控成为机房的突出问题;二是维护成本增加,由于目前关键设备厂商已停止了该型号设备的生产,所以后期维护成本不断增加;三是环保节能问题,由于机房空间没有按照节能的方式进行整体规划设计,所以机房中50%以上的电力主要用于精密空调的运行,从而浪费了大量的能源。

为了解决这些问题,第一机房进入了优化阶段:2009年进行了强电系统改造,满足了设备的增加需求,并在原有的40KVA UPS的基础上逐步增加了2台5KVA UPS、2台10KVA UPS和3台20KVA UPS,这些UPS增加的另一个目的是为了实现电源的冗余;2012年增加一台精密空调,由于第一机房建设之初采用下走线方式,线槽阻挡了送风的风道,所以老空调一直处于超负荷运行状态,经常出现高压报警,特别是在高温天气,机房内可达到40多度,新空调的使用使这一问题得到了缓解,但是用电量则不断攀升。不断出现的问题在解决后又带来新的问题,所以第一机房已进入老化阶段,从而进入新的生命周期,以满足国土资源云建设的需要。

2.2 第二机房

在第二机房建设的规划阶段坚持科学性的同时,力求机房建设的先进性,适应绿色、节能、环保的数据中心机房建设理念,适应未来虚拟化建设的需要,兼顾当前与长远,通过机柜系统和供配电系统的藕合对接,为我厅提供一个节能、高效和可靠的模块化数据中心。相比第一机房,第二机房建设有以下几个新特点。一是采用封闭冷通道架构,冷通道和热通道分离,使得组织气流井然有序,提高了空调的制冷效率,适应了当前倡导的绿色节能的机房建设要求。二是采用了可随需扩展的全模块化设计的UPS系统;我们在设计UPS时秉承标准化、模块化、冗余化的设计理念,能够在不影响业务的前提下在线扩容,采用两台最大配置200KVA模块化UPS主机组成双总线的供电架构,目前每台UPS主机端配置4个40KVA功率模块,形成3+1冗余,并可在低负载运行时模块自动轮值休眠,保障可靠性的同时提升低载高效的性能。三是配置了两台高可用的精密空调,该空调具备红外加湿功能,免去了频繁清洗的维护工作,满足简单运维和高效管理的需求。四是采用远程KVM技术,实现了服务器的远程管理和操作。五是采用机柜顶部弱电布线方式,由核心交换机通过光纤与各个机柜的接入交换机相连,这样既满足了高密度的设备安装,也大大减少了弱电线缆的数量,提高了设备安装的灵活性。六是总控中心实现集中运维管理、机房环境和关键设施的集中监控。

第二机房在运行阶段也不可避免的出现了一些问题:一是后备电源不足,可供电时间短,特别是在夏季用电高峰期间,如果出现意外停电,而供电时间又不确定的的条件下,就不可避免的会出现宕机现象;二是精密空调可更加节能,目前两台空调是联机使用,但是采用的是回风口温度控制,温度设置在机房标准温度的情况下,冷风道内的温度一般低于机房标准温度,这就增加了空调的压缩机及风机的使用时间,如果采用送风口温度控制,不仅能够使机房温湿度符合机房标准,也能够减少能源消耗;三是没有进行定期检测评估,而第一机房也缺少这个管理环节,所以才会不断的增加问题,而不是在问题出现之前消除隐患。

3 结语

河南省国土资源数据中心的建设与管理过程是数据中心生命周期理论的具体实践,事实证明,数据中心的建设与管理不是一劳永逸的事情,需要与时俱进,不断扩容、不断增添新功能,以更好地支撑河南省国土资源信息化业务的发展。

【参考文献】

[1]彭成.全生命周期概念与数据中心的模块化机房设计,《智能建筑电气技术》,2016.

[2]王建民,赵世萍.简述新一代數据中心全生命周期建设,《信息与电脑(理论版)》,2014.

[3]陈亮.绿色数据中心,《智能建筑与智慧城市》,2011.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!