一种基于PSO-DELM算法的比赛场馆内手机上网流量预测方法技术

技术编号:24716603 阅读:42 留言:0更新日期:2020-07-01 00:40
一种基于PSO‑DELM算法的比赛场馆内手机上网流量预测方法。本发明专利技术涉及一种基于粒子群算法优化深度极限学习机对比赛场馆的手机上网流量预测方法,其中包括数据的预处理,以及构建PSO‑DELM网络流量预测模型。首先根据流量数据的自身特性做出预处理,形成新的数据样本集。在极限学习机中引入自动编码器完成多隐含层的深度极限学习机的构建,并且使用粒子群优化算法对深度极限学习机的各个隐含层的网络节点数目进行优化,选取使模型误差最小的节点数,从而使模型的预测准确率得到提升,最后对算法模型的参数进行设置。本发明专利技术基于深度极限学习机理论,并构建经过优化的PSO‑DELM模型,不仅能够使模型的训练速度快、避免的局部最小值的出现,而且相对于其他预测模型的准确率有所提升。

【技术实现步骤摘要】
一种基于PSO-DELM算法的比赛场馆内手机上网流量预测方法
本专利技术涉及一种比赛场馆内手机上网流量的预测方法,涉及的是使用一种粒子群算法对深度极限学习机进行优化的网络流量预测方法。
技术介绍
随着互联网时代的快速发展和手机应用软件的多样化,以及4G网络正在向着5G网络时代的加速迈进,使全球的移动通信设备规模在近几年呈指数增长。移动通信设备在方便人们生活的同时也在移动网络中产生了海量的网络流量数据,这就使学者在针对网络流量的预测变得很有研究意义和研究价值。在赛事现场,为了防止观众使用手机上网产生的网络流量增多而导致网络的拥堵情况发生,影响观众的手机使用体验,所以当网络流量数值达到限定值后就要对场馆周围的基站进行扩容或者新建小型的移动基站。提前预测出流量的变化趋势,就可以提前做出部署,减少突发事件带来的危险。手机产生的上网流量属于网络流量中的一种,网络流量具有非线性、自相似性、长相关性和多分型等特性,现有的网络流量预测模型很难准确的预测出流量的数值。传统方法的模型简单、预测速度快,但是预测的精度低。目前,比较常见的是使用现代的智能化方法进行预测,如神经网络、深度学习、机器学习理论等等。本文构建的预测模型是以深度极限学习机为基础,采用粒子群算法优化深度极限学习机中多个隐含层的神经元节点数。粒子群优化算法是一种性能良好的全局随机搜索优化算法,本文采用它去优化深度极限学习机多个隐含层的神经元个数,减少模型的预测误差,提升模型的预测精度。
技术实现思路
本专利技术的目的是提供一种能够在短时间内实现对区域场所的手机上网流量的精准预测的方法。该专利技术为了解决现有的预测模型存在预测精度不高的问题,选用在2004年由南洋理工大学的黄广斌教授提出的极限学习机(ELM)作为基础,极限学习机是一种单隐含层的前馈神经网络,它的提出是为了对反向传播算法(BP)进行改进以提升学习效率低并简化学习参数的设定,具有训练速度快、拟合精度高和泛化性能好的优点。但是当面对比较庞大的数据时,单隐含层ELM对输入数据典型特征的学习能力有限,仅含有一层隐含层的单层极限学习机网络可能会导致部分的神经元成为无效神经元。为了使模型能够应对复杂的输入与输出关系,本专利技术采用了更加强大和复杂的深度极限学习机(DeepELM)来处理数据的映射关系,但由于DELM中的多个隐含层的节点数无法准确的设置,所以本专利技术采用粒子群优化算法对个隐含层的节点数进行选取,使得预测模型的准确率得到提升。本专利技术实现专利技术目的采用如下技术方案:一种基于PSO-DELM算法对比赛场馆手机上网流量预测方法,具体包括如下步骤:步骤1:把得到的数据(商场、小区、万达广场、汽车站的手机上网流量数据)进行整合,选取这几个地点的数据主要是为了增加样本的多样性,样本的时间粒度为每15分钟为一个节点,共11712个一维时间序列数据。步骤2:分析可知,根据网络流量自身的自相似性、长相关性、多分性和非线性等特点,采用基于时间序列的方式对数据进行预处理,选取合适的输入变量维度和输出变量维度。步骤3:根据网络流量的特性进行分解,分解方式是;用前1、2、3、4、5组数据作为输入和第6组数据作为输出,接下来是用第2、3、4、5、6组作为输入预测和第7组数据作为输出,以此类推。设n为第n组数据也是第n个数据(n≤11707,n∈N*),则5个输入变量分别为n、(n+1)、(n+2)、(n+3)、(n+4)和1个输出变量为(n+5),可以得到每组数据有5个输入变量和一个输出变量,一共11707组数据的新样本。步骤4:对数据进行步骤3的方式处理,确定新的输入样本数据和输出样本数据。步骤5:经过步骤4处理过的数据样本共11707组数据,其中选择前80%组数据作为训练数据,后20%组数据作为测试数据。步骤6:建立深度极限学习机模型,在自下而上的逐层无监督训练过程中,引入自动编码器(AE)算法和正则化系数,逐层的优化输入层与隐含层之间的权重矩阵,以提高模型的预测精度和泛化能力。而采用粒子群优化算法对各个隐含层的神经元个数进行优化,把隐含层神经元个数作为粒子,设定粒子群优化算法的搜索维度D、种群规模N、学习因子c1和c2、惯性因子w、正则化系数Lambda,随机初始化粒子群优化算法的粒子位置hj(1)及粒子速度初始值vj(1),迭代次数ger。6.1计算粒子适应,采用网络流量预测值与实际值得均方误差(MSE)作为适应度函数,公式如下所示:其中,dj为期望输出、yj为实际输出、m为样本个数。6.2求出每个粒子的个体最优,将粒子当前迭代下的最优位置设置为局部最优。6.3求出整个群体的全局最优,比较种群中每个粒子的均方根误差,得到全局最优。6.4更新粒子速度,其公式为:其中Vk、分别对应第i个粒子在第k次迭代中的速度、位置、最优位置;代表在第k次迭代过程时粒子群的全局最优位置,rand()属于[0,1],随机均匀分布。若V>Vmax,则V=Vmax;若V<-Vmax,则V=-Vmax,否则不变。6.5对于非最优粒子给与随机变异,更新粒子位置,计算公式为:Xk+1=Xk+Vk+16.6判断是否适应度值达到目标值,若是则进入步骤6.7,否者返回步骤6.1。6.7输出最优粒子,将达到要求的粒子对应到深度极限学习机的3个隐含层的神经元节点数。6.8输入训练数据,训练PSO-DELM网络。6.9输入测试数据;6.10输出预测结果,并与真实值作比较。本专利技术的有益效果是:本专利技术在使用神经网络进行预测,利用流量因素自身的特点实现预测,选用的深度极限学习机理论在开始对流量数据进行以时间序列的方式预处理,更好的分析了流量本身的特性。选取GA-BP算法作为预测方法,一方面是对于历史数据的训练能够更加的深入挖掘数据之间的关系,增强方法的鲁棒性。另外一方面是因为此方法的运算时间较快,反映迅速。并且本专利技术在以实际数据为基础,构建的模型能够解决预测速度慢、预测精确度不高的问题。附图说明图1为本专利技术中PSO-DELM方法的整体流程图。图2为本专利技术所使用的部分原始网络流量数据图。图3为本专利技术所使用的原始数据经过数据预处理的新样本部分数据图。图4为使用PSO-DELM方法的预测与其它预测模型对比曲线图。具体实施方式以下通过具体实施例和附图对本专利技术的原理和特征做进一步解释说明。所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。如图1所示,本专利技术实施所述的一种粒子群算法优化深度极限学习机算法对比赛场馆的手机上网流量预测方法,整体的流程包括以下步骤:步骤1:先对数据中的影响流量的因素进行分析,得出流量自身的特征性,部分原始的流量数据如图2所示。步骤2:针对流量数据的特殊性质做出预处理并找到最合适的时序序列,经过误差测试发现输入与输出维度为5和1,处理后的新样本部分数据如图3所示。并且隐含层的层数为3时的优化效果最好,具本文档来自技高网...

【技术保护点】
1.一种基于粒子群算法优化深度极限学习机对比赛场馆的手机上网流量预测方法,其特征在于:/nS1:针对网络流量数据,进行分析和预处理。/nS2:确定模型的拓扑结构,包括输入层节点数、输出层节点数、隐含层层数、激活函数。/nS3:确定粒子群优化算法的参数数值。/nS4:输入训练样本。/nS5:输出预测结果,并与实际值进行比较。/n

【技术特征摘要】
1.一种基于粒子群算法优化深度极限学习机对比赛场馆的手机上网流量预测方法,其特征在于:
S1:针对网络流量数据,进行分析和预处理。
S2:确定模型的拓扑结构,包括输入层节点数、输出层节点数、隐含层层数、激活函数。
S3:确定粒子群优化算法的参数数值。
S4:输入训练样本。
S5:输出预测结果,并与实际值进行比较。


2.根据权利要求1所述的种基于粒子群算法优化深度极限学习机对比赛场馆的手机上网流量预测方法,其特征在于:具体步骤为:
步骤1:先对数据中的影响流量的因素进行分析,得出流量自身的特征性。
步骤2:针对流量数据的特殊性质做出预处理并找到最合适的时序序列,经过误差测试发现输入与输出维度为5和1,并且隐含层的层数为3时的优化效果最好。选取这五个场所的手机上网流量数据进行训练模型,预测样本中部分的上网流量使用情况,共11712组数据。原始数据经过数据预处理,新的样本如下所示:



X2=[n6n7n8...n11707]
步骤3:把经过预处理好的新的样本数据进行归一化。
归一化的公式是:i=1,2,…11707。
式中:Lmax、Lmin分别为样本中的最大值和最小值;L为样本的归一化的值;i为时间点的值,其范围为[1,11697]。
步骤4:首先,确定极限学习机的网络结构。
步骤4.1假设输入数据样本集合X={xi/1≤i≤N}和输出样本T={ti/1≤i≤N}。假设H={hi/1≤i≤N}为隐含层特征向量集合,hi为第i个样本对应的特殊向量。将输入数据从输入空间映射到隐含层特征空间,则X与H的关系为:
H=sf(WX+B)
式中:W为输入层节点到隐含层神经元的权重矩阵,B为隐含层神经元的阈值矩阵,其中权重和阈值可随机生成,且对结果不会产生恶化影响。sf为激活函数,经...

【专利技术属性】
技术研发人员:刘东周莉郑晓亮张磊
申请(专利权)人:安徽理工大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1