当前位置:首页 期刊杂志

研究智能定位5G消息问题的新方法

时间:2024-05-04

摘要:5G消息业务基于终端原生短信入口,为用户提供文本、图片、音频、视频、位置、联系人等富媒体内容的发送和接收,还可直接在短信界面内通过聊天机器人(chatbot)与服务提供者进行交互,无需下载APP、无需注册账号登录即可享受到企业提供的服务。然而传统的5G消息运维方式存在效率低、无自动化定位工具的不足,为提高5G消息用户满意度、满足高效运维需求,本文提出了一种智能定位5G消息问题的新方案,基于日志和信令采集的大数据分析方式定位问题,可大幅提升5G消息运维效率,提高5G消息客户满意度。

关键词: 5G消息;RCS;大数据;智能运维

一、引言

运营商传统的短信因功能简单、体验受限,已无法满足用户多样化的需求。当5G时代来临时,全球运营商已达成了广泛共识:传统短信业务需要升级到富媒体消息业务—业界称之为5G消息,5G消息业务仍然包含传统短信,可分为消息业务+传统短信业务。5G行业消息是一种基于GSMA国际通信标准(RCS)的富媒体消息应用,通过提供直达、便捷、大容量、内容丰富的视频化富媒体信息服务,为客户带来全方位的内容服务和沟通价值。

国内外发展方面,2020年4月8日,中国移动与中国电信、中国联通一起,携手11家合作伙伴共同发布《5G消息白皮书》,明确了相关业务功能和技术要求,提出5G消息生态建设构想。5G消息时代由此到来。目前全球已有56个国家、77家运营商发布RCS服务;AT&T、Sprint、沃达丰、德国电信、NTT DoCoMo等运营商均已选择RCS作为行业短信的升级方向。

随着5G消息的不断普及,业务量不断增大,用户使用5G消息出现的问题也逐渐增多。例如,客户在5G消息业务的日常使用中,经常遇到终端收不到5G消息、5G消息延时、终端发不出5G消息、收到乱码等问题,而当前运维模式仍停留在逐个分析网元日志、跟踪抓包分析接口信令等人工分析处理海量数据定位问题的方式,该方式存在效率低、无自动化定位工具等不足,导致维护人员定位问题需要6小时以上,传统的定位方式已无法满足运营商侧5G消息的运维要求。急需研发一种快速定位5G消息问题的新方法。

二、5G消息业务特点

所谓“5G消息”,并不是5G的消息。它既不是5G特有的功能,也不是5G时代新开发出来的业务,而是以5G作为驱动的短消息。与传统行业短信仅支持文本相比,5G行业消息可发送更为丰富的多媒体内容,个人用户还可通过消息携带的按钮、菜单实现交互。

5G消息可发送的消息形态包括文本、图片、音视频、地理位置、富媒体卡片等。在单条消息中,可包含一张富媒体卡片,也可包含多张(可滑动)。富媒体卡片还可携带卡片按钮,为用户提供上行消息回复、链接跳转、拨打电话等能力。以上每一类消息形态还可携带悬浮菜单,该菜单随每条下行消息可变,可提供的功能与富媒体卡片按钮相同。从而使消息类产品由传统意义的业务终点(短信通知)演进为业务起点(用户可交互),提升消息价值。

5G消息具备四种子产品形态,满足行业客户和个人客户在信息发布、宣传推广、品牌经营、客户服务等多种场景下的差异化需求。一是个人客户的传统点对点短信交互。二是文本消息,行业客户主动下发文本消息,可视为传统短信的升级,典型应用为验证码、通知提醒等。三是多媒体消息,行业客户主动下发的图片、音视频与卡片消息,可视为视频短信和智能短信的融合升级,典型应用为账单推送、品牌宣传、旅游推介。四是会话消息,被个人用户上行消息所触发的多媒体消息,客户可根据业务场景和用户精准匹配服务,实现智能交互,典型应用为出行购票、充值查询、满意度调查、用户调研等。

三、5G消息运维现状

(一)5G消息系统架构

5G消息系统主要包括5G消息中心(短信中心模块、消息处理模块、接入处理模块)及MaaP平台两个网元四类VNF,承载全部2/4/5G人网短信,支持5G富媒体消息业务,并基于终端能力提供对應下发模式(文本短信或消息)。

(二)当前运维模式存在的不足

5G消息正式商用后,在5G消息业务量呈现增长趋势时,用户满意度却持续下降,进一步统计分析满意度情况发现,用户的意见主要集中在售后服务项中的问题定位时长满意度差,也就是运营商的运维效率低。

运营商运维模式仍停留在逐个分析网元日志、跟踪抓包分析接口信令等人工分析处理海量数据定位问题的方式,传统的定位时长平均耗时6小时,无法满足高效运维要求。

四、5G消息智能定位平台架构设计

(一)设计思路

根据行业内外厂商调研结果,研究华为基于智能故障决策树算法“深”度定位的智能运维解决方案,在2G和4G的语音运维中引入了大数据分析和机器学习,不断训练生成智能故障决策树,一方面使自动化效率更高,另一方面把复杂的人处理不了的运维交给机器,做到预防预测,语音端到端网络和投诉问题诊断时长从4小时下降到20分钟,定位定界效率提升92%,有效提升客户满意度。

因此,本文借鉴行业内外智能运维思路,通过设计5G消息问题智能定位方案,结合当前的IT系统,形成端到端的自动化分析手段,可大大降低5G消息问题定位的时长。

操作时可通过采集工具获取5G消息网元日志和接口信令话单,由系统进行多维度关联分析,结合大数据模型训练生成的5G消息业务质量问题迭代库,定位用户签约、终端、短信网关、5G消息中心、无线网等问题,最终给出诊断结论和自优化措施。

(二)基于日志和信令采集的大数据分析定位方案

本文创新采用基于日志和信令采集的大数据分析定位方案定位5G消息问题,平台架构主要考虑数据源、平台、采集方式、数据库、定位算法、部署方式六个方面。具体部署过程如下。

1.数据源

数据源方面,采用关键接口信令话单和关键网元业务话单。梳理5G消息业务流程中涉及的关键网元和关键接口。一是对接ISC、CD、Mc、S1-MME 四大接口,二是对接vSMSC、消息AS、MaaP、行业网关、融合网关五大网元,确保5G消息关键网元业务话单覆盖率100%,5G消息关键接口信令话单覆盖率100%。

2.信令平台部署

在信令平台部署方面,开发信令平台新模块,支持5G消息网元日志和信令数据处理功能,支持5G消息话单解析,包括HTTP、MSRP、SMPP、CMPP等5G消息协议,确保5G消息话单解析率>98%,5G消息协议支持度100%,接口数据关联率≥98%。

3.部署FTP GET文件采集程序

部署FTP GET文件采集程序方面,从数据采集组网设计,部署数据采集网络,搭建FTP服务,部署FTP数据采集程序以及开启采集数据程序的环节把控流程,实现FTP方式采集方式部署,确保数据误码率<0.1%,数据完整性>99%。

4.Hbase数据库

配置Hbase数据库方面,为了实现读写速度的最优化(最大),使用正交试验法寻找最佳参数组合。根据现场技术论证,影响Hbase数据库读写速度的关键因素包括响应IO请求线程数、数据块缓存内存占比和MemStore刷新上限值。在搭建好的Hbase数据库上配置最优数据库参数后,进行10次5G消息网元业务话单和信令接口话单文件的读写试验,读写速率均在10M/s以上>达标值3M/s。

Hbase数据库最优参数选择过程如下:

(1)挑因素,选水平,制定因素水平表

根据现场技术论证,影响Hbase数据库读写速度的关键因素包括响应IO请求线程数、数据块缓存内存占比和MemStore刷新上限值。因素之间的交互作用对实验结果的影响可以忽略,制定因素水平如下:

响应IO请求线程数为10、15、20;数据块缓存内存占比为20%、25%、30%;MemStore刷新上限值为128MB、192MB、256MB。

(2)设计试验方案和结果分析

因素数=3,水平数=3,自由度之和=6,正交表行数应满足n≥(6+1)=7,正交表列数应满足t≥3,所以选择三水平正交表L9(34)。直接对比(直接看):直接比较9个试验的数据库读写速率,发现试验条件为A3B1C2;直观分析(算一算),根据效用Ki计算结果,直观分析发现的试验好条件为A3B2C2(与直接看不一致)。

(3)设计二次试验方案和结果分析

根据极差Rj计算结果,各因素对试验结果的影响程度从重到轻是A>C>B。因素A为最重要因素,且随着线程数的增大,结果逐渐令人满意,继续增大线程数能否获得更好的结果,应在第二批试验中重点考查确认;因素C是较重要因素,选择试验结果较好的水平C2;因素B是次要因素,可以根据节约硬件计算资源的原则,选择水平B1。

根据因素水平效用趋势图分析,因素A呈单调递增趋势,无峰(谷)值拐点,说明还有调优可能。综上分析,我们初步得到的试验好条件为A3B1C2。

(4)调优实验

根据第一批试验结果分析:

①A.响应IO请求线程数是最重要因素,并存在调优可能,需确认继续增大能否获得更好试验结果;

②C.MemStore刷新上限值是较重要因素,为节省缓存空间,应探讨是否有进一步减少的可能;

③B.数据块缓存内存占比是次要因素,对试验结果影响小,不需要调优。

因此,我们选择响应IO请求线程数和C.MemStore刷新上限值重新制定因素水平表。响应IO请求线程数为20、25、30;MemStore刷新上限值为162MB、192MB、222MB。考虑二因素三水平(不考虑交互作用),因素数=2,水平数=3,自由度之和=4,正交表行数应满足n≥(4+1)=5,正交表列数应满足t≥2,所以选择三水平正交表L9(34)开展调优试验。

直接比较9个试验的数据库读写速率,直接对比发现的试验好条件为A1B1;根据效用Ki计算结果,直观分析发现的试验好条件为A1B1,说明因素A响应IO请求线程数20个为最优,继续增大无法提升试验效果,因素B在第一批得到的MemStore刷新上限值减少30MB后,效果更好。

最终,通过正交试验数据分析和小批跟踪试验验证,我们确定数据库参数配置的最佳方案为:响应IO请求线程数20个、数据块缓存内存占比20%、MemStore刷新上限值162MB。

6.采用智能故障树决策树算法进行问题分析定位

一是梳理5G消息存在问题的场景,如5G消息延时、MO成功率低、终端发不出5G消息等。二是借鉴专家经验库,穷举不同场景的问题查处网元、流程和结果等。三是采用大数据的模型进行训练;四是生成智能故障决策树并运用。最终,确保问题定位准确率>=90%。

6.部署基于B/S架构的应用系统

一是定义网络异常问题定位模块、故障树关联模块、单用户问题定位模块三个功能架构。其中,网络异常问题定位模块包含根据首拆接口过滤、根据拆线网元过滤、根據拆线状态码过滤及根据拆线消息类型过滤四个部分;故障树关联模块包括故障树学习生成、故障树迭代、故障树关联分析;单用户问题定位模块包括单用户网元话单详情、单用户接口话单详情、问题定界定位查询。

二是设计数据流向,从接口信令话单、网元业务话单采集解析,到计算框架(计算引擎),最后为前台WEB界面。

三是接口开发调用。四是页面设计和美化。部署应用上线后,检查话单正常查询,问题分析定位模块使用正常,并发查询调用成功率>98%。

五、结束语

应用5G消息智能定位方案后,有效缩短用户5G消息投诉问题的处理时长,用户满意度明显提高,有效地提升了客户感知。同时实现跨专业的高效协作,解放劳动力,高效提高各专业人员运维能力,是运维方式的大变革,也为5G消息的进一步商用奠定了运维基础。

作者单位:蔡璐宇 中国移动通信集团海南有限公司网络运营中心

参  考  文  献

[1]中国电信,中国移动,中国联通. 5G消息白皮书[EB/OL].(2020-04)[2021-1-20]

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!