当前位置:首页 期刊杂志

基于正态分布的10G GPON 规模预测模型研究

时间:2024-07-28

[徐正国 周明 金鑫 傅传家]

1 引言

随着4K、VR 等视频技术成熟和工信部“双千兆”行动计划中千兆宽带指标要求[1],千兆宽带等同5G,已纳入国家“新基建”,10G GPON 开始规模部署。如何精准预测10G GPON 建设规模,是10G GPON 网络规划建设的难题。目前,关于10G GPON 部署策略是根据GPON端口忙时带宽利用率或GPON 端口千兆用户数超过某个阈值[2],升级10G GPON COMBO 板,但带宽利用率和GPON 端口千兆用户数在规划时难以准确。本文通过对现有GPON 口承载的千兆用户分布分析,对不同千兆用户规模下,分布在GPON 口数进行正态模型验证和回归分析,给出10G GPON 建设规模预测模型,结合市场千兆用户发展规模,应用模型预测10G GPON 建设规模,实现精准投资。

2 正态分布理论基础

正态分布最早由德国数学家和天文学家棣莫弗于1733年在求二项分布的渐近公式时提出,后由德国数学家高斯将其应用于天文学研究误差测量,故正态分布又叫高斯分布,拉普拉斯和高斯研究了其性质。

若随机变量X 服从一个数学期望为μ、方差为σ2的正态分布,其概率密度函数为:

μ 是服从正态分布的随机变量的均值,σ2是此随机变量的方差,所以正态分布记作N(μ,σ2)。正态分布的期望值μ 决定了其位置,其标准差σ 决定了分布的幅度。对任意服从N(0,σ2)的随机变量,正态曲线下横轴上一定区间的面积,反映变量值落在该区间的概率,则横轴区间(μ-σ,μ+σ)面积为68.26%。

横轴区间(μ-2σ,μ+2σ)内的面积为95.45%。

横轴区间(μ-3σ,μ+3σ)内的面积为99.73%。

这说明,X 落在(μ-3σ,μ+3σ)以外的概率小于3‰或落在(μ-2σ,μ+2σ)以外的概率小于5%,基本符合正态分布。

3 基于正态分布的10G GPON 规模预测模型

建立基于正态分布的10G GPON 建设模型,需从如下两步研究:

(1)验证千兆用户数与GPON 口数是否符合正态分布:首先从家宽资管中提取所有用户的签约带宽、对应GPON 口;再从GPON 口维度统计承载用户数,分别统计分析不同签约带宽用户数;最后计算统计签约带宽为千兆对应的GPON 口数,验证GPON 口数是否落在(μ-2σ,μ+2σ)区间内,即是否符合正态分布。

(2)回归分析,然后反复输入数据,得出千兆用户与GPON 口分布模型公式。

3.1 当前不同签约带宽用户分布特征分析

从家宽资管中提取所有用户的签约带宽、对应GPON口,分别统计分析不同签约带宽用户数,如表1 所示。

表1 GPON 口承载不同签约带宽用户数

目前市场签约带宽以200 M 为主,300 M 为辅,300 M用户是下一步最先升级为千兆用户,所以下面以300 M 和千兆数据样本为例,分别统计承载1 个千兆用户的GPON口数,2 个千兆用户的GPON 口数……,同理统计300 M用户GPON 口数,如表2 所示。

将表2 数据通过Excel 散点图,分析出千兆和300 M用户的GPON 口数分布,如图1、2 所示。

表2 不同签约带宽用户对应GPON 口数统计表

如图1,千兆用户超4 个的GPON 口数,越来越少,本次取定单GPON 口超4 个千兆用户的GPON 口数进行直方图分析,具有正态分布性,如图3 所示。

图1 千兆用户GPON 分布

图2 300 M 用户GPON 分布

图3 超4 个千兆用户的GPON 口数直方图

3.2 结论模型

为进一步分析超4 户千兆用户数(X)对GPON 口数(Y)的关系,需对上述数据进行线性回归分析。线性回归分析是利用最小二乘函数对一个或多个自变量(X)和因变量(Y)之间关系进行建模的一种方法,涉及总体回归模型、总体回归方程等,计算复杂,而SPSSAU 是一款网页版数据科学算法平台工具,包括分类汇总、相关、回归等16 类算法,仅需把超4 户千兆用户数(X)和GPON 口数(Y)样本数据输入,可得出分析结果,本文使用SPSSAU工具线性回归分析方法[3],输入超4 户千兆用户数(X)和GPON 口数(Y)样本数据,具体计算结果如表3 所示。

表3 线性回归分析结果(n=5)

从表3 可知,将千兆用户数作为自变量,而将GPON口数作为因变量进行线性回归分析,预测线性模型公式为:

超4 户GPON 口数=2773.190+0.113×千兆用户数

模型R 方值为0.973,说明 GPON 口数的97.3%变化原因。对模型进行F 检验时发现模型通过F 检验(F=109.366,p=0.002<0.05),也即说明千兆用户数对超4 户的GPON 口数产生显著的正向影响关系。

4 模型应用

根据模型公式(1),取不同千兆用户发展规模,预测超4 户GPON 端口数,按照中国移动集团建设指导意见,当单GPON 口超某一个阈值(本案例取定4 户),将此GPON 口升级为10G GPON 口,测算10G GPON 口建设规模,如表4 所示,根据市场发展规模,取不同千兆用户数,测算10G GPON 口建设规模。当千兆用户发展10 万时,需建设配置约1.4 万10G GPON 口,当30 万时,需建设配置约3.7 万10G GPON 口,接近当前网络规模。

表4 不同千兆用户对应建设10G GPON 规模表

不同签约家宽用户服从正态分布或近似正态分布,如:承载22个300 M用户GPON口数、承载4个千兆用户数等,因此在千兆宽带建设中可使用正态分布,预测10G GPON建设规模。应用正态分布预测10G GPON 建设规模,需根据现网资料的分布特点,选用恰当步骤:

(1)散点图:将千兆用户分布GPON 数用散点图呈现,确定阈值。

(2)直方图:验证是否符合正态分布。

(3)回归验证分析:将千兆用户数作为自变量,GPON 口数作为因变量进行线性回归分析,确定模型公式。

(4)预测结果:输入不同千兆用户数,测算10G GPON 建设规模。

5 结束语

在降本增效背景下,落地实施国家“双千兆”网络的建设,如果盲目超前建设,给运营商带来资金压力。本文分析验证GPON 口承载的千兆用户数正态分布,给出预测模型和应用模型步骤,提高了10G GPON 部署演进的精准度,有效指导运营商千兆宽带建设,确保投资效益。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!