时间:2024-05-04
房磊
【摘要】 随着虚拟化乃至云原生网络的逐步商用,由传统物理网络和虚拟化网络组成的“混合”网络正成为愈加普遍的网络形态,而传统的网络运营系统已不能很好地满足此种混合网络的自动化运营需求。为此提出一套端到端自动化运营系统模型,旨在提供更加自动、智能、高效的混合网络运营能力。
【关键字】 混合网络 网络功能虚拟化 运营系统 自动化 闭环
经过多年发展,网络功能虚拟化已逐渐成为主流运营商新建或改造网络时的首选。然而由于传统物理网络存量依然很大,所以在很长一段时间内将出现传统物理网络与虚拟化网络共存的局面。本文中“混合”网络特指此种由传统物理网络与虚拟化网络共同组成的网络。运营自动化一直是业界热门话题,而面向混合网络的自动化运营已成为业界的一道难题。目前业内已有诸多机构对此进行了探索实践。如由ETSI主导发起的OSM,致力于关注混合网络的端到端业务编排。由ECOMP和Open-O合并而成的ONAP项目,致力于为混合网络打造实时的、策略驱动的编排及自动化平台。OpenDaylight作为最大的开源SDN控制器,致力于驱动网络自动化并提升运营效率。这些项目各有侧重,本文将从更整体、通用的视角,探讨混合网络自动化运营面临哪些难题、如何搭建混合网络自动化运营系统等。
一、混合网络在自动化运营方面的难题
由于设备性质不同,物理网络与虚拟化网络各有特点,因此在运营自动化上也各有难题。而混合网络要将这两种网络的难题均考虑在内。
传统物理网络:运营自动化起步更早,但由于网络由专用物理设备构成,因此运营过程中难以避免地充斥大量人工处理环节,运营效率和质量很难提升。
虚拟化网络:通过通用服务器承载虚拟网络功能,运营人员无需面对繁杂的多厂家专用物理设备,维护难度大大降低。此外,更IT化的网络有利于更快的问题发现、上报及自动化处理。但相对于更加静态的物理网络,虚拟化网络更加动态,运营系统必须要提供更高的灵活性,适配动态的资源调整和业务变更。而新出现的虚拟化层及上层网络功能软件等新实体和新技术对运营人员的技能,尤其是IT层面技能,也提出了更高的要求。
混合网络:当前很多运营商对于物理网络和虚拟化网络仍然分别运营,或增强传统运营系统,进行过渡性地统一管理。但由于MANO与EMS和传统OSS的接口尚不够细致,在实现时会遇到很多困难,从而会拖累NFV技术的部分优势。因此,缺乏统一的运营方式,极大地提高了混合网络的运营成本,降低了运营效率和质量。
二、优化思路
2.1 搭建统一运营系统,构建端到端自动化闭环
当前很多运营商在设计混合网络运营系统时,仍然采用“新网新管、老网老管”的思路,即物理网络利旧原先的运营系统,虚拟化网络新建运营系统。好处是保护现有资产、减少CAPEX,弊端是两套系统相对独立,难以有效协同、实现端到端自动化运营,增加后续OPEX。
因此应构建一套统一的运营系统。其核心设计思路是,通过自动化大闭环+人工处理流程自动化小闭环,实现面向混合网络的端到端自动化运营闭环。
2.2 利用AI等新技术,进一步提升系统自动化水平
近年来又掀起一阵AI热潮,网络运营领域也在加快使用AI优化运营效率和质量。如Gartner提出AIOps概念,从智能检测、预测、根因分析等方面探索AI在运营领域的可能性。如基于图像识别的安装审计技术,可自动评判设备安装的规范程度,提升安装质量。如类似聊天机器人的运维助手,将知识库与NLP结合,为运维人员提供更加高效智能的随身运维助理等。结合以上实践,可设法将AI融入运营系统各环节、各场景,进一步提升自动化和智能化水平。
2.3 组织架构及文化演进,人员技能提升
由于混合网络运营涉及新旧两种网络,可能涉及不同的运营部门或团队,所以在考虑端到端运营方案时,不应局限于系统本身,也应考虑组织架构及文化上的调整。如成立统一协调小组,甚至将原先两套团队融合成统一的团队。另外,鉴于虚拟化网络带来的新的技术要求,应针对性地提升运营人员的技能。
三、模型设计
针对前文所述种种难题,下文将对混合網络端到端自动化运营系统模型进行顶层设计(如图)。该模型旨在搭建一套更加自动、智能、高效的运营系统。
1、整体架构概述。从下而上,第一层是网络层,支持传统网络和虚拟化网络。第二层是适配层,包括各专业网管、SDN控制器、VNFM、VIM。该层用于对下层网络的控制管理。第三层是统一数据采集平台,用于采集全网告警、性能等数据,作为统一的数据订阅和提供源。第四层是核心层,下文将详细阐述。核心层之上是BSS。核心层会与BSS交互,如完成客户订单接收及分解、产品-服务建模等。最上层是展现层,包含自服务门户、能力开放等功能。下文对核心层进行详述。
2、设计中心。设计中心负责全网各类设计工作。网络规划设计负责全网概要设计和详细设计。服务目录管理负责服务建模。业务模型设计通过使用TOSCA、YANG等模型对业务进行设计。智能策略设计负责设计自动化策略。沙盒测试用于业务发布前的测试,通过测试后方可上线。版本发布管理用于发布和管理业务版本。
3、端到端编排管理。本模块负责全局业务和资源编排管理。全局业务编排管理负责全网业务的编排管理,如家宽业务开通。物理资源编排管理负责传统物理资源的编排管理,如执行业务可用性检查。NFVO负责虚拟化网络的资源编排。SDNO负责软件定义网络的编排,自动匹配业务调整所带来的链路调整需求,提供灵活高速的网络连接。全局配置激活负责全网网络和业务的配置激活。全局存量管理统一管理资源和服务存量。
4、策略中心。作为 “智囊”,为全网提供自动化运营策略服务。策略引擎&执行负责策略任务调度管理和执行。以时间型策略的执行为例,到达某时间即触发该策略,并执行相应动作。策略仓库可对策略进行存储、停用、删除、修改、查询等操作。
5、保障模块。故障管理负责全网告警采集、处理、分析、定位、排除等,性能管理负责全网性能指标采集、处理、查询、监控、分析等。此模块可结合AI,实现告警关联、性能预测等功能。
6、分析中心。分析中心是全网的“大脑”,实现统一分析、决策。综合分析引擎通过分析保障模块提供的告警及性能数据,以及所需原始数据,首先判断当前任务或问题是否可由系统自动化处理。如判断无需人工介入,则输出决策至策略中心,策略引擎解析决策后,从策略仓库选择对应策略并执行。如某虚机发生故障,分析中心分析告警数据后发送自愈决策至策略中心,策略中心随后协同NFVO和VIM等完成虚机自愈,解决故障。如分析中心决策需人工介入,如光纤断了,则会发送外场维护决策至人工运维中心中的运维流程管理系统,解析该决策后,触发故障单管理流程,协同施工调度管理系统解决故障。决策仓库用于存储历史决策及其处理细节和结果,可用于相同情况复现时快速调用历史决策,或类似情况发生时查看类似历史决策的处理细节及结果,便于决策的提效和不断优化。
7、人工运维中心。运维流程管理系统负责各运维流程的统一管理,如网络故障单处理流程、投诉单处理流程、变更管理流程等。施工调度管理系统负责外线任务和工程师的调度分配,基于调度引擎和预设的调度规则,将工单分配给最匹配的外线工程师。
8、端到端监控。对全网进行端到端监控,可提供全局仪表盘、全局网络及业务拓扑,以及全局报表。
9、后续演进。受限于网络及相关技术演进,该模型仍存在很多扩展和演进的空间。首先,由于网络切片相关标准尚未完全成熟,业务也尚未大规模商用,该模型暂未包含网络切片编排管理能力。后续可增加“CSMF-NSMF-NSSMF”分层切片编排管理子系统。其次是需持续挖掘运营过程中有待进一步提升自动化、智能化的场景,设法融入AI等新技术进行改进,并驱动运营商向数据分析型运营管理转型。再如,当前策略设计基本基于经验,相对比较简单且不够灵活,后续应思考如何实现策略的自设计和自优化。
四、机会与挑战
自动化运营并非新话题,业界已在此领域探索多年。但虚拟化、5G、网络切片等新技术的爆发,为运营系统的变革演进带来了重大历史机遇。但运营系统的演进并非易事,至少在以下三方面存在挑战:(1)如何保护现有资产、权衡技术与投资效益。运营商现网的运营系统往往经过多年的深耕打磨,定制化程度非常高,高度匹配当前工作需要。但这也意味着系统往往不够灵活、开放。所以面对虚拟化等新需求,是设法改造现网系统,还是建新系统,新老系统谁管谁,这些都是权衡技术复杂度和投资效益的现实问题。(2)运营商、设备厂商、IT厂商之间的博弈。面对新的网络和运营系统,运营商、设备厂商、IT厂商之间既合作又竞争的关系正成为越来越明显、深入的新常态。一些大运营商不再满足于直接采购使用第三方系统,而是希望能更多地自研;设备厂商希望能更多地捆绑网络设备提供运营系统;IT厂商希望以专业IT厂商及第三方的身份进行更高层面的系统设计与建设。可以想见,随着运营系统功能和架构的不断细化,竞合会长期存在并不断加深。(3)运营商内部组织架构、文化演进方面的阻力。组织架构及文化上的演进往往最困难,需要全公司自上而下地完成,且从架构及运作流程,到员工的心态、技能,各方面都需要持续地调整优化。
当然,尽管面临重重挑战,运营系统的不断演进是不争的事实和必然趋势。业内人员应当不断思考如何提升演進目标、优化演进过程、提高运营系统完善度、提升相关人员的工作幸福度和成就感。
参 考 文 献
[1] https:// https://www.onap.org/ [EB/OL].
[2] https:// https://www.opendaylight.org/ [EB/OL].
[3] 柏楠, 唐静, 雷波. 虚拟化网络运营和测试实践探讨[J]. 移动通信, 2019(7): 36.
[4] 赵鹏, 段晓东. SDN/NFV 发展中的关键:编排器的发展与挑战[J]. 电信科学, 2017(4): 20-24.
[5] 肖子玉. 面向5G网络运营转型思路[J]. 电信工程技术与标准化, 2016, 29(3): 5.
[6] 毛东峰, 张强, 贾曼, 陈研, 孙琼. 面向SDN/NFV的新一代运营系统综述[J]. 电信技术, 2017(3): 8-9.
[7] 徐代刚, 孟照星, 刘学生. 面向未来网络运营的敏捷运维架构[J]. 中兴通讯技术, 2016, 22(6): 57.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!