时间:2024-05-04
赵德宁 李舒涛,2 吴劲松,2 廖霄 邓振华
(1.中国能源建设集团广东省电力设计研究院有限公司 广东省广州市 510663 2.华南理工大学 广东省广州市 510641)
随着经济全球化进程的加速和我国改革开放的纵深发展,数据中心对业务连续性要求极高,对关键业务数据安全性要求也非常之高。随着数据中心的设备越来越复杂,系统也越来越多,使得故障诊断困难,并且管理也变得庞大和复杂。对于如何做好数据中心维护,及时发现一些潜在隐患和排除突发故障,降低管理的成本,提高运维的效率,降低数据中心的能耗,已经变成管理者关注的重点。而要实现这些目标,数据中心的管理者面临着诸多挑战:
应用系统和系统管理、网络管理、机房管理等工具系统各自独立运行,缺乏整合,无法提供统一管理视图,难以协调配合。
各个技术领域之间没有建立关联关系,在系统发生故障时,故障的根源定位非常困难,经常要耗费很多时间处理。
目前多数系统还是停留在数据库管理和表格管理的二维维护层面,缺乏有效的可视化处理方案。
相当部分运维数据维护仍然使用传统的表格(纸质或电子化),管理比较分散,没有进行统一管理,准确性也是个问题。
针对当前存在的上述问题,广东省电力设计研究院有限公司积极探索,经过研究,决定采用BIM 技术、物联网、人工智能等科学、可行的管理方法来解决这些问题。建立基于BIM的数字孪生智慧机房管理系统以满足公司的人员和领导及时掌握数据中心运行状态;通过动环监控数据进行关联和分析,实现对数据中心运行故障进行有效的防范决策,最终实现对数据中心精细化管理的目的。
根据《数字孪生白皮书(2019年)》书中的定义,数字孪生是综合运用了现代科技的物联网感知、大数据计算、仿真建模等现代信息技术,借由软件定义功能,实现了对物理空间进行展示以及故障诊断、运行及状态预测、行为决策,从而实现了赛博空间与物理空间二者的交互映射。如图1所示。
BIM(英文全称:Building Information Modeling 建筑信息模型)是用建筑工程项目中各个项相关的信息数据来作为基础从而建立起建筑模型,它通过数字化信息来仿真模拟物理世界的建筑物所具有的物理信息。BIM 模型可存储设计、施工、运维,甚至时间、成本等信息,因此它成为建筑物管理的一个理想载体,贯穿全生命周期各个阶段。
通过安装的物联网检测设备,对数据中心的基础设施进行监控,监控数据通过物联网关实时传输到数据平台,物联网支持RS485,ModBus, MQTT 等协议。
图1
图2
通过机器学习和深度学习,结合知识图谱,对系统故障进行诊断,找到故障原因及位置定位,对故障诊断结果可以生产工单,进行闭环管理。
本系统前端使用vue+bim+webgl 轻量化引擎(模型,数据分离)技术实现,服务应用层基于springcloud 框架,采用Eureka 作为注册中心,Config 做为配置中心统一管理配置文件,Feign 实现各服务之间的数据调用,Hystrix 实现熔断降级,Redis 实现数据缓存,Websock 技术实现客户端与服务端的实时通信。利用关系型数据库Mysql 存储系统关键业务数据,非关系型数据库Mongodb 存储动态模型数据及测点数据。系统采用大数据平台作为离线计算及存储支撑。在Iot 层制定统一的协议标准,通过MQTT 等通用协议做统一的接入口,开放厂商协议和数据的接入。如图2所示。
通过BIM 技术对数据中心进行可视化展示,从楼栋、楼层、房间、机柜一直到设备,逐级下钻展示,并且建模的精度比较高,达到LOD500 级别,可以精细到线缆和端口,清晰看到某根线缆的精确走向和位置,甚至在桥架中线缆夹的位置都可以看到。
5.1.1 数据中心可视化
系统基于三维模型对数据中心的建筑结构、机房布局、设备及强弱电链路进行展示,设备及链路均可以在三维模型中进行查看,对机柜的容量、机柜空间、电力信息等进行统一展现,实现对设备性能、告警信息的实时监控。
5.1.2 资产配置可视化
通过BIM 三维建模,把各个机柜以及机柜内IT 设备的基本配置信息导入可视化平台,通过三维模型里的设备就可查找相应的配置信息,反过来也可以通过配置信息查找到对应设备,实现资产配置的可视化展示。
5.1.3 设备配线可视化
通过采用自管理或集成CMDB 系统的方式,把各个机柜内设备的连接信息导入可视化平台,通过设备、链路、端口信息相互查找,完成设备配线可视化展示。
5.1.4 机房容量可视化
把数据中心的机柜U 位、端口、机房的承重情况、空调负荷、电力负荷等集成在BIM 模型中展现,便于运维人员掌握机房容量情况。
通过数字孪生模型与机房各个监控子系统实现数据集成和控制集成,实现设备数据集成化展现,可以在数字模型中直接对设备进行操作,调整设备运行参数与状态。
5.2.1 动环监控系统
5.2.1.1 配电监测
(1)监测设备:配电柜、UPS 主机、智能母线等。
(2)监测内容:监测主开关及所有输出开关的支路开关状态;输入三相全电量参数(电压、电流、功率、频率、功率因数、电量等)。
5.2.1.2 蓄电池监测
(1)监测对象:蓄电池12VDC 或2VDC。
(2)监测内容:监测每节单体电池的内阻/电压/电流、电池表面温度、电池总电压、总充放电流等。
5.2.1.3 空调系统监测
(1)监控对象:智能精密空调。
(2)监测内容:温度、湿度、温度设定值、湿度设定值、空调运行状态、风机运转状态、报警等数值。
5.2.1.4 温湿度监测
实现对机房的环境以及重要设备等目标进行温度和湿度的高精度监测。
5.2.1.5 漏水监测
对于空调周围以及其它地方可能发生漏水的重要位置,比如机房内如果有水管流经的地方以及没有设置封堵的门窗等重要位置进行漏水监测。
5.2.2 安防监测系统
5.2.2.1 门禁监测
在智慧运维系统三维可视化展示门禁系统设备布局,通过对门禁人员常规进出信息的读取解析,在三维可视化环境中展示各个门禁入口的人员进出情况。
通过联动视频系统以及红外双鉴设备对人员入侵以及目标越线和小动物入侵等特殊异常情况进行实时监控告警。
5.2.2.2 消防监测
在智慧运维系统三维可视化展示消防设备布局,通过视频系统、烟雾探测器、红外热能探测器等设备对消防异常情况进行实时监控及告警。
5.2.2.3 视频监测
在智慧运维系统三维可视化展示视频设备位置,在系统实时调用视频监控内容,协同联动门禁系统、消防系统进行异常发现、追踪、告警流程的处理。
5.2.3 告警处理系统
系统通过接口接入各类物联网传感器的数据。当系统中运行的设备如果有告警发生,在三维场景中实时展示告警数据,并且三维可视化系统中以高亮、闪烁告警,同时会发出声音提示用户。
5.2.4 AR 运维
系统把AR 增强现实技术结合BIM 三维建模技术应用于各种场景的巡视和运维工作中,通过AR 技术在图像识别、虚实叠加、信息交互,智能判断纠错等各方面的优势,通过AR 设备对被检查的关键信息进行扫描捕捉,把提醒内容进行实时叠加,并且与后台信息进行对比核查。运维人员通过AR 设备可对故障发生位置进行定位和导航,快速找到故障设备。
5.3.1 故障算法诊断模型
系统通过采集的监控信息和运行数据,使用故障算法诊断模型进行智能诊断,判断故障原因,定位故障源头设备,并结合知识图谱专家库进行验证和匹配解决方案。
5.3.2 健康度评估模型
系统通过健康度检测模型,结合全生命周期数据(包括初始数据、历史数据和运行数据)对各专业系统和设备进行健康度检测评分,并进行预测性维护推荐,使得系统故障或者停机检修时间大为减少。
5.3.3 绿色能耗模型
运用数字孪生技术,对机房设备进行1:1 仿真建模,系统调用设备建模数据,搭载绿色能耗模型,通过安装在设备末端的智能传感器,反馈数据到运维系统,经过能耗模型的分析,系统能自动调节冷冻水管水流的大小并实时调节精密空调的风力来达到节能的效果。在服务器夜间较少运行时,空调系统可以减少冷量输出来节能。
综合来说,本系统基于BIM 和数字孪生技术,初步实现了数据中心的智慧运维。通过物联网监测设备采集数据,然后对各个物理实体的要素部分进行实时监测和动态的展现,基于历史数据进行分析,检查各个设备的功能 、性能变化的情况及原因,揭示各类模式之间的关系,对于系统和设备的未来运行情况进行预测,实现对运维行为进行指导。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!