一种Femtocell网络中的负载预测方法

时间：2024-07-29

夏军，周朋光，谢小秋，李铮，徐浩，王纲

(重庆邮电大学通信与信息工程学院，重庆 400065)

0 引言

随着移动通信技术的快速发展，人们对高速数据传输和无盲区通信体验的需求日渐高涨[1]。在2020年即将商用的5G通信系统[2]，其愿景和目标可以完全满足目前人们对高速率的渴求。在5G的研发探索阶段，衍生出了众多新型技术对其做出相应理论和技术上的支撑，其中包含了超密集网络技术[3]，该技术的定义是通过大量部署低功率小基站实现提升系统吞吐量为目的。在超密集网络中，Femtocell[4]是不可或缺的技术之一，其定义是一类发射功率约为20 dBm、覆盖半径约为20 m的无线小基站。由于Femtocell具有灵活部署、吞吐量大和稳定性高等优点，因此，得到了众多运营商和通信设备商的关注[5]。

现阶段很少有专家学者对Femtocell的负载做相关的预测工作，大多集中在Femtocell的干扰消除、负载均衡、功率控制和资源分配等领域，而极少涉及到负载预测。文献[6]在LTE-A系统中的自组织网络下提出了一种基于虚拟小区呼吸的负载预测(load prediction based virtual cell breathing，LPVCB)方案，该方案通过对系统负载的预测来减小新负载接入和控制切换参数对系统的影响，从而更准确地实现负载均衡。但任何关于负载预测的相关介绍及其算法，同样的情况也发生在文献[7]中。

由于未查阅到相关Femtocell负载预测的文章，我们阅读了大量其他领域相关系统中关于负载预测的文章，包括云计算系统等。文献[8]中对传统云计算负载预测中存在的低预测精度和收敛速度较慢等缺点进行了分析解决，并提出了一种基于正余混沌双弦的鲸鱼优化(chaotic sine cosine operator whale optimization，CSCWO)算法，用于优化多层感知神经网络(multilayer perceptron neural network，MLP)的云计算系统负载预测。文献[9]为云计算服务提供商重新定义了一种在线调度器，该调度器可以实现对系统的忙、闲或者关机的控制，以达到最小化云计算平台能耗的目的。为了实现该目的，文中尝试去预测系统的负载以计算出网络的需求，然后通过修改服务器的设置来做出预测的工作，最后验证了在线调度器的性能。文献[10]中在异构服务器平台下提出基于负载预测的新型节能模型，为了实现精度较高的未来系统负载预测，文中研究和分析了神经网络可用性、负载趋势、周期性数据。

从文献[9-10]中就可以看出，若对系统的负载做出预测，可以预知其系统工作量，通过关闭相关服务器就可以实现减小能耗的目的。另外，通过关闭相关的服务器也可以节省系统的资源，尤其是在移动通信系统中，在当今频谱资源匮乏的情况下，资源的节省将有利于对未来技术的发展。在密集部署Femtocell后，必将导致小区间的干扰增加，如果Femtocell的负载得到预测，那么Femtocell就可以根据其预测的负载做出减小发射功率或关闭等策略，如此一来，小区间的干扰也自然会得到控制。当然，Femtocell的负载预测也可以实现对小区间的负载均衡和数据流量做相应的监控。

通过对5G超密集网络中Femtocell技术进行研究，提取运营商下真实的吞吐量数据进行相关分析和预测。首先确定了吞吐量的时间序列，然后通过算法的计算检验该时间序列具有混沌特性，在微观层面发现其发展态势的混沌特征；然后对吞吐量的时间序列进行相空间重构，在高维重构相空间中恢复系统的演化规律和特征；最后利用改进RBF模型对时间序列进行学习、预测，再采用粒子群算法[11]对预测参数进行优化。

1 Femtocell吞吐量的混沌特性分析

混沌科学系统[12]的主要特征包括：无规则性、无固定顺序、随机化等，其重要用途是探索理论的演进过程。未来5G通信系统的发展中，Femtocell吞吐量由接入的海量用户终端的高速传输数据量决定，接入Femtocell用户终端的数量及其业务类型和数据传输速率都是无法预测的，用户终端具有无规则和随机性,因此，导致Femtocell的吞吐量具有混沌特性, 采用混沌理论思想来对Femtocell吞吐量分析有利于对未来5G通信技术的发展趋势做出相应的预测。

1.1 Femtocell数据样本的来源

中国某通信运营商已在国内的一些地区开始部署一定数量的Femtocell，用来提升LTE中整体的网络吞吐量也为未来爆炸式增长的通信数据量做铺垫。已覆盖的Femtocell为大量的用户终端提供了高速并且稳定的通信体验，因此，选取其作为本文的数据平台，统计结果较客观和全面地体现了未来通信系统的特性。本文统计了某运营商在某地区部署的一座Femtocell吞吐量，提取了2017/7/1到2017/7/11共计11天的吞吐量数据，该数据由MR(measurement report)信令跟踪以小时为单位颗粒度提取，从每天的0点至23点共24个采样点，整体数据如图1所示。把某运营商现有的Femtocell吞吐量的时间序列数据作为对系统吞吐量的历史数据进行分析是比较可靠、合理和准确的。

图1 Femtocell吞吐量的分布图Fig.1 Distribution diagram of Femtocell

1.2 Femtocell吞吐量变化的混沌特性判断分析

要判定一个系统的混沌特性，可以从2个方面入手：①定性。其主要思想是凭借输入的时间序列数据的整体发展趋势粗略地概括系统的混沌特性，该方面判定出的混沌特性不具有说服力和客观性；②定量。该方法中包含的主要算法有Lyapunov指数和关联维度等[13]。在定量查验系统的混沌特性时，由于Lyapunov指数方法实现简单且能够在一定程度上反应系统的混沌特性，所以本文将采用Lyapunov指数的方法判定Femtocell吞吐量的时间序列数据是否具有混沌特性。Lyapunov指数λ值是用来表示混沌系统的敏感度，若λ>0那么说明系统就有混沌特性[14]，本文中将使用小数据量法求Lyapunov指数λ，具体步骤如下。

1)对Femtocell吞吐量的时间序列进行傅里叶变换(fast Fourier transformation，FFT)，计算出平均轨道周期P；

2)采用C-C(Catmall-Clark)方法和G-P(Grassberger-Procaccia)方法求得延迟时间τ和嵌入维数m，并进行相空间的重构得{Xj,j=1,2,…，M}，M=n-(m-1)τ；

(1)

4)对每个i，求出所有j的lndj(i)平均值x(i)为

(2)

(2)式中，q是非零dj(i)的个数，对于求得的x(i)用最小二乘法作出回归直线，该直线的斜率就是最大Lyapunov指数的λ值。

1.3 相空间重构理论

对给定的Femtocell吞吐量时间序列的数据集D={x(t),t=1,2,…,N},N表示时间序列长度，本文采用C-C和G-P算法求取的延迟时间τ和嵌入维数m，重构一个与其原动力系统在拓扑意义下等价的相空间，从而把握混沌时间序列的性质与规律[15]。对相空间重构后就能够求出矩阵X和Y，即

(3)

(4)

本文的Femtocell负载预测模型主要是通过相空间中的X(t)预测出Y(t)，并在其中探索出一条映射关系，如(5)式，从而预测出下一个Femtocell时间序列的数据集。

Y(t)=f[x(t)]

(5)

1.4 算法及其计算结论

具体算法如下。

算法1混沌理论算法。

//相空间重构: D

for Femtocell吞吐量时间序列的数据集Ddo

由小数据量算法计算最大Lyapunov指数λ；

Ifλ>0

continue do

由C-C算法计算τ值；

由G-P算法计算m值；

通过上述参数计算相空间重构：X、Y

end for

通过上述算法的计算，可以得到以下结论。

考虑到C-C方法在实际应用上有很好的实际效果，且计算简单的优点，利用 C-C方法求D的相空间重构的延迟时间。C-C方法是通过关联积分统计得到延迟时间，其延迟时间对应ΔS(t)的第一个极小值，如图2所示，不难求得时间序列D对应的延迟时间τ为5。

采用G-P算法求取输入时间序列在相空间中的维度，G-P算法具有适宜于实测数据、容易实现等优点从而受到广泛的应用，它主要是通过时间序列在重构相空间上关联积分C(r)与距离r的关系获得分形维数。Grassberger和Procacia证明，选取确定的嵌入维数m，存在半径r，使得关联维数d与累计分布函数满足线性关系，即d(m)=lnC(r)/lnr，所以，对图3进行线性拟合，求得关联维数d和嵌入维数m的关系曲线如图4所示。嵌入维数等于当关联维数随嵌入维数的增长而趋于稳定时对应的数值，由图4求得Femtocell吞吐量时间序列的数据集D嵌入维数为7。

图2 时间序列的延迟时间Fig.2 Delay time of time series

图3 时间序列的双对数Fig.3 Double logarithm of time series

通过上述C-C方法和G-P方法求得的延迟时间5和嵌入维数7对Femtocell吞吐量时间序列进行相空间重构，并利用小数据量法的原理，求各个变量的最大Lyapunov指数，用于混沌特性的判别，如图5所示。其中，曲线为最小二乘法拟合出的回归直线，直线的斜率即为所求最大Lyapunov指数。D时间序列对应的最大Lyapunov指数为0.005 5。

图4 时间序列的关联维数Fig.4 Correlation dimension of time series

图5 小数据法求Lyapunov指数Fig.5 Lyapunov index by small data method

2 改进的神经网络算法

RBF神经网络具有逼近任意非线性函数、学习收敛速度快、能解析复杂系统的规律性以及良好的泛化能力等优点，已广泛运用于时间序列分析、信息处理和系统建模等方面[16]。文献[10]中指出粒子群算法是当前流行的智能化参数优化方法，在学术和工业等研究领域得到了全面的青睐。本文将充分利用聚类算法和粒子群算法的优势，为RBF神经网络的Femtocell吞吐量预测参数进行优化和提升。

2.1 基于密度的聚类算法改进RBF

RBF神经网络[16]的架构可分为3层，如图6所示。主要包含了第1层(输入层)、第2层(隐含层)及第3层(输出层)。第1层的节点个数可以通过计算时间序列Y的维数得到；第2层与第1层节点连接，第2层主要由时间序列数据中用于训练的数据节点组成；第3层的节点数与输入节点的维数相等。

图6 RBF神经网络架构图Fig.6 Architecture diagram of RBF neural network

RBF神经网络的精度由多种参数决定，包括节点数目、阈值、权值等，如果想要提升预测的效果和精度，就可以采用一系列方式对上述参数进行优化。当RBF结合混沌理论预测时，其中，输入为重构后的数据的每个相点Xk=[xk,xk+τ,…,xk+(m-1)τ]，输出为每个相点对应的下一时刻的值Yk，其中，k=1,2,…,N-(m-1)τ。RBF的网络可以表示为

(6)

(6)式中：q是隐含层神经元个数；Xi和wi分别是第i个隐藏神经元所对应的中心和权重；ρ(X,Xi)是高斯径向基函数，形式如下

(7)

常见对RBF做出优化的聚类算法有 K-Means等，其原理是通过对神经网络的架构包括节点数和中心点数做出相应的优化从而实现精度提升，此类方法并未对神经网络的神经元宽度和径向函数做出改进，其改进也仅仅体现在了一些外在的特征[17]。文献[18]中提到的聚类算法是一种基于样本数据密度、实现简单、高效且对复杂数据(类别)、具有鲁棒性的聚类算法。可以快速有效地计算出样本数据的中心值及其方差。并且把结果直接应用到改进隐含层径向基函数ρ(X,Xi)中，减小了聚类迭代的次数和计算复杂度，具体效果如图7所示。

2.2 结合PSO进行参数优化

PSO算法是一种通过模仿昆虫或鸟群等捕食行为的智能随机优化算法，其算法的主要思想是每个粒子表示需优化问题的其中一个解, 粒子按照适应函数的结果相继进行位置和速度的迭代更新, 最后在空间运动过程中将优化问题的最优解计算出来[17]。PSO算法收敛速度快且实现较为简单，尤其是对RBF的优化效果极佳，也得到许多专家和学者的青睐。假设 RBF用来作为一个预测函数，那么PSO算法作为优化方法其核心是对RBF中的相关预测参数进行优化，而经过PSO优化的RBF的预测效果和性能也得到了很大的提升。

图7 时间序列映射至二维的聚类效果图Fig.7 Clustering results of time series

本文首先根据一种简单的聚类算法得出样本时间序列的聚类中心和聚类结果，即样本时间序列的中心值和方差。将计算得到的中心值和方差代入RBF高斯径向函数内，即可确定RBF的神经网络架构；其次，将需要得到优化的参数初始值例如中心值、方差和权值等进行整合；最后再运用RBF神经网络对时间序列数据进行学习、预测。

由于PSO的参数基本上是常数，在对某些函数做出优化后，其预测结果并未达到理想的性能和精度。所以为了提升传统PSO的性能和精度，本文中对PSO算法做出了相应的改进，结合惯性权重和收敛因子后，可以得到新的速度方程，即

(8)—(9)式中：vi表示空间中粒子的速度；Xi表示粒子在空间中的位置；pi表示个体极值；Pgb表示全局极值；m代表一个收敛因子以保证收敛性；而c1,c2,r1,r2为常数。

改进的PSO算法，既可以确保粒子群算法的收敛速度，也相对提升了参数预测的准确性，改善了优化问题的精度。整体算法如下。

算法2PSO优化的RBF算法。

1)确定RBF的时间序列数据集合，其中含有输入及输出的数据集；

2)通过密度聚类算法计算得出RBF中心值及其方差，从而得到高斯径向基函数；

3)对相关初始参数包括中心值、方差及权值进行整合成向量，生成粒子种群；

4)迭代更新粒子在空间中的速度和位置；

5)若已达到系统预设的群体极值或迭代次数，结束算法，若为达到条件，返回4)，直至结束，最后可以获得一组最优的预测参数；

6)采用 RBF算法对1)中数据进行训练、预测，即可获得预测的结果。

3 仿真验证

本文的仿真场景基于MATLAB2014a，电脑的操作系统为Windows7旗舰版，电脑品牌为微星，处理器为英特尔i5，内存为8 Gyte。本文时间序列数据来源于某运营商的实际部署的Femtocell下吞吐量的统计结果，通过编写文中的相关算法，对采样的数据进行预测试验，最后对预测结果做出了公平、客观的总结和定性。在对比实验时，引用了文献[17]中的方法作为参照并采取了绝对误差(absolute error,AER)、平均绝对误差(average absolute error,AAE)和均等系数(equal coefficient,EC)等概念[17]，具体定义如下。

AER：用来直观的检测预测值与真实值的差值。

(10)

AAE：用来评价预测值和真实值的偏离程度。

(11)

EC：表示代表评估时间序列数据的趋势，衡量拟合的准确程度。

(12)

将某运营商部署下Femtocell从2017/7/1到2017/7/11共计11天264个吞吐量时间序列数据分为2个部分：①190个数据用于神经网络的训练和预测；②74个数据用于对比预测。其预测结果对比图如图8所示。图8中显示了本文方法与对比方法的负载预测对比及绝对误差对比。图8a中可以在本文方法下预测的负载与实际负载的变化趋势，而图8b中就可以清晰地看到本文方法在预测结果上的绝对误差要小于对比方法，更好地控制在预测结果出现的一些较为极端的峰值。表1给出了在AAE和EC作为参考标准下，本文方法的负载预测性能。通过对比发现，本文方法在误差指标AAE上提升较为明显，说明其预测精度得到了很好的保证。其次，本文的方法在EC方面的数值达到了93%以上，说明了预测数值与真实数据的拟合程度较好。最后在预测的运行时间上，本文方法也超越了对比方法，可以证明其效率也是得到相对的提升。

表1 本文方法与对比方法的预测误差对比表Tab.1 Comparison of prediction error

4 结束语

Femtocell小基站将在未来5G移动通信系统中占据重要的地位，对其进行性能优化和预测控制也必然成为大趋势。Femtocell负载变化受用户接入量和其他干扰源的影响，其态势具有随机化、非线性的混沌特性。本文针对Femtocell负载的真实时间序列，分析其具有混沌特性，然后利用相空间重构为Femtocell负载的预测搭建模型，再采用了一种高效地聚类算法求取时间序列的中心值和方差，最后用改进的PSO算法对RBF神经网络做出优化、学习和预测。经过仿真验证，本文的方案可以在保证精度的情况下，更好地描述出Femtocell负载在未来的发展趋势。该预测结果可以用于关闭Femtocell或者减小Femtocell小基站的发射功率，从而实现绿色通信和消除干扰的目的，也可以为运营商和设备商对Femtocell的监控提供支持。

图8 预测结果对比图Fig.8 Comparison of prediction results

上一篇：基于用户簇分布模型的三维异构蜂窝网络覆盖概率分析
下一篇：MPSK/MQAM符号速率估计算法

免责声明

我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!

一种Femtocell网络中的负载预测方法

0 引言