当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质技术方案

技术编号:28849210 阅读:31 留言:0更新日期:2021-06-11 23:51
本发明专利技术涉及一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质,节假日无线流量预测方法包括:步骤1)依据日期的不同分别定义节假日权重;步骤2)依据节假日权重计算基站扇区的节假日系数;步骤3)依据节假日系数将所有基站扇区的流量模式进行分类;步骤4)构建混合算法模型;步骤5)得到不同流量模式对应的训练好的混合算法模型;步骤6)使用训练好的混合算法模型对基站扇区进行无线流量预测。本发明专利技术提出将基站扇区通过节假日系数分为不同流量模式,对各个模式训练一个公共的模型的架构可以有效解决过拟合的问题,使模型具有灵活性与捕捉流量变化特征的能力。

【技术实现步骤摘要】
一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质
本专利技术涉及一种基于相关性聚类混合算法模型的节假日无线流量预测方法、系统、设备及介质,属于无线流量预测

技术介绍
随着智能手机等设备的普及,无线蜂窝网络具有越来越重要的作用。准确预测基站扇区的流量对于基站资源部署、功率分配等具有重要的参考意义,是实现智能通信网络的重要前提。特别是在节假日期间,由于人口的大量流动,许多地区的流量使用情况会发生改变,比如在许多农村地区,许多外出工作者会在节假日期间集中回乡,而他们正是使用流量的主力,这将会导致这些地区在节假日期间的无线流量使用量激增。相反的,在很多学校或者办公区域,在节假日期间会因为人员放假而导致无线流量使用量锐减。如果可以准确预测到这些变化,那就可以针对这些变化提前做出部署,比如在无线流量使用增多的地区进行扩容或者加大功率以保证用户使用体验,在无线流量使用减少的地区减小功率以降低成本,使得基站可以低碳,低成本,高效率运行。总结目前使用人工智能进行无线流量预测的工作,大体上分为三种思路,一是改进模型,使模型更适合无线流量预测;二是将无线流量本身进行分为不同的部分,然后分别预测这些部分,最后将这些部分相加得到最终的预测结果;三是结合无线流量之外的其他相关信息共同进行预测,比如使用基站所在的空间特性以及天气情况等。但是,现有工作主要聚焦于数分钟、数小时等短期持续时间内的无线流量预测,且所使用的的数据一般为非节假日数据或未对节假日时期的预测做出特别处理。然而,在一些重要节假日,比如春节,由于放假时间很长,许多人会选择出行,加之对手机等需要消耗流量的智能终端的使用时间与平常相比也有较大变化,这些会导致某些地区的流量使用异于平常,有些极剧烈的变化会超出基站所能提供的最大服务范围。为了防止基站在节假日时期无法为用户提供优质的服务,运营商会选择提前对某些基站做出调整,对无线流量使用量增加的基站进行物理资源扩容。相似的,也会调低某些流量使用量降低的基站的功率等,避免资源的浪费。因此,精确预测基站在节假日期间的流量可以指导运营商进行提前的部署,提高服务质量。在流量预测领域,目前使用较多的思路是对每个基站单独进行处理,为每一个基站训练一个模型,当进行预测时,使用各个基站对应的模型进行预测。然而,当针对春节期间的流量值预测,由于春节期间的流量模式与平时变化很大,因此非节假日时期的流量对于春节时期的流量预测效果有限,甚至有时会造成错误干扰。在节假日无线流量预测的过程中,在可用数据较少的场景,所获得的每个基站的流量数据中只包含一次春节期间的数据,如果只使用该扇区对应的春节数据进行模型训练的话,会导致过拟合,使得预测的某一年春节期间的数据与上一年的数据十分相似。
技术实现思路
针对现有技术的不足,本专利技术提供了一种基于相关性聚类混合算法模型的节假日无线流量预测方法及预测系统,先依据日期的不同分别定义节假日权重,然后依据节假日权重计算节假日系数,再利用节假日系数将所有基站扇区的流量模式进行分类;使用各个流量模式下包含的所有基站扇区的数据构建训练集,对相应流量模式的预测模型进行训练;使用训练所得的混合算法模型进行基于基站扇区的无线流量预测。本专利技术提出将基站扇区通过节假日系数分为不同流量模式,对各个模式训练一个公共的模型的架构可以有效解决过拟合的问题,使模型具有灵活性与捕捉流量变化特征的能力;本专利技术还提供了一种计算机设备及存储介质。术语解释:1.长短时记忆算法:简称LSTM算法,LSTM算法可以用来预测时间序列的数值,是一种特殊的RNN算法,可以学习长期依赖信息。LSTM由Hochreiter&Schmidhuber(1997)提出,并在近期被AlexGraves进行了改良和推广。在很多问题,LSTM都取得相当巨大的成功,并得到了广泛的使用。LSTM通过特别的设计来避免长期记忆消失问题。记住长期的信息在实践中是LSTM的默认行为,而非需要付出很大代价才能获得的能力。所有RNN都具有一种重复神经网络模块的链式的形式。在标准的RNN中,这个重复的模块只有一个非常简单的结构,例如一个tanh层。LSTM同样是这样的结构,但是重复的模块拥有一个不同的结构。不同于单一神经网络层,这里是有四个,以一种非常特殊的方式进行交互。LSTM的核心是细胞状态,用贯穿细胞的水平线表示。细胞状态像传送带一样。它贯穿整个细胞却只有很少的分支,这样能保证信息不变的流过整个RNNs。LSTM网络能通过一种被称为门的结构对细胞状态进行删除或者添加信息。门能够有选择性的决定让哪些信息通过。LSTM由三个门来控制细胞状态,这三个门分别称为忘记门、输入门和输出门,通过这种机制可以使算法具有对信息的长期记忆能力,在时序信号处理中可同时利用近期信息和长期信息。2.随机森林回归算法:简称RFR算法,是一种数值预测算法,属于集成学习流派,是对Bagging算法进行了改进。随机森林回归算法构建若干弱学习器,使用弱学习器对同一输入进行预测,然后将各个弱学习器输出的结果进行集成融合,得到最终的输出。3.支持向量回归算法:简称SVR算法,支持向量回归可用来拟合曲线,起到预测数值的效果。支持向量回归通过计算模型输出与真实值之间的差别来计算损失,将难以在低纬度通过函数准确拟合的曲线映射到高纬度进行拟合,并且可以通过设置间隔带来提高模型的鲁棒性。4.线性回归算法:简称LR算法,线性回归是回归问题中的一种,线性回归假设目标值与特征之间线性相关,即满足一个多元一次方程。通过构建损失函数,来求解损失函数最小时的参数w和b。通常可以表达成如下公式:y=wx+b,其中x是输入,w和b是需要学习的参数,y是输出。线性回归的目标是找到w和b使得在输入x时,wx+b的值与y最接近。本专利技术的技术方案为:一种基于相关性聚类混合算法模型的节假日无线流量预测方法,用于对基站扇区的流量进行预测,具体步骤包括:步骤1)依据日期的不同分别定义节假日权重;通过节假日权重来表征每一天的重要性,节假日系数越高则说明该日期是一个重要的节假日;步骤2)依据节假日权重计算基站扇区的节假日系数;步骤3)依据节假日系数将所有基站扇区的流量模式进行分类;步骤4)使用线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法共同构建混合算法模型;选择多种算法来共同构建混合算法模型是为了同时学习同一个流量模式下的基站扇区的公共特征和独立特征,即通过线性回归算法学习基站扇区的公共特征,通过长短时记忆算法、随机森林回归和支持向量回归算法学习独立特征。步骤5)将不同流量模式下包含的所有基站扇区的流量数据分别构建训练集,并使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型;即每一种流量模式对应的训练集训练得到一种混合算法模型;步骤6)使用训练好的混合算法模型对基站扇区进行无线流量预测。根据本专利技术优选的,步骤1)中,依据日期的不同分别定义节假日权重,具体为:...

【技术保护点】
1.一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,用于对基站扇区的流量进行预测,其特征在于,具体步骤包括:/n步骤1)依据日期的不同分别定义节假日权重;/n步骤2)依据节假日权重计算基站扇区的节假日系数;/n步骤3)依据节假日系数将所有基站扇区的流量模式进行分类;/n步骤4)使用线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法共同构建混合算法模型;/n步骤5)将不同流量模式下包含的所有基站扇区的流量数据分别构建训练集,并使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型;即每一种流量模式对应的训练集训练得到一种混合算法模型;/n步骤6)使用训练好的混合算法模型对基站扇区进行无线流量预测。/n

【技术特征摘要】
1.一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,用于对基站扇区的流量进行预测,其特征在于,具体步骤包括:
步骤1)依据日期的不同分别定义节假日权重;
步骤2)依据节假日权重计算基站扇区的节假日系数;
步骤3)依据节假日系数将所有基站扇区的流量模式进行分类;
步骤4)使用线性回归算法、长短时记忆算法、随机森林回归算法、支持向量回归算法共同构建混合算法模型;
步骤5)将不同流量模式下包含的所有基站扇区的流量数据分别构建训练集,并使用不同流量模式对应的训练集分别训练混合算法模型,得到不同流量模式对应的训练好的混合算法模型;即每一种流量模式对应的训练集训练得到一种混合算法模型;
步骤6)使用训练好的混合算法模型对基站扇区进行无线流量预测。


2.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤1)中,依据日期的不同分别定义节假日权重,具体为:
(1)对除春节外的节假日进行流量预测时:工作日的节假日权重为0,非节假日周末和寒暑假的权重为1,节假日时长小于等于三天的日期的节假日权重为3,节假日时长大于三天的日期的节假日权重为5,将春节前七天的节假日权重赋值为3,春节后七天的节假日权重赋值为7;
(2)对春节进行流量预测时:截取春节前三周的日期定义为节假日权重Ws,定义如下:



式(II)中,D为春节日期,d为春节前三周内的任意一天,即距离春节大于8天的日期的春节权重都设置为0;距离春节八天内的日期,每天的权重从1到8依次增加,即在除夕当天权重达到8。


3.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤2)中,依据节假日权重计算基站扇区的节假日系数,具体操作步骤如下:
计算节假日权重序列与基站扇区的流量序列之间的皮尔逊相关性系数,将皮尔逊相关性系数作为基站扇区的节假日系数,皮尔逊相关性系数ρX,Y的计算公式为:



式(I)中,X是节假日权重序列,节假日权重序列为按照时间先后顺序由不同日期对应的节假日权重组成的一维序列;Y是基站扇区的流量序列,基站扇区的流量序列为按照时间先后顺序由基站扇区每天的无线流量组成的一维序列;E(·)表示数学期望,即平均值;σX表示节假日权重序列的方差,σY表示基站扇区的流量序列的方差,μX表示节假日权重序列的平均值,μY表示基站扇区的流量序列的平均值。


4.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤3)中,利用节假日系数将所有基站扇区的流量模式分为5类模式,具体为:0.4≤节假日系数<1,基站扇区的流量模式为强正相关模式;
当0.2≤节假日系数<0.4,基站扇区的流量模式为弱正相关模式;
当-0.1≤节假日系数<0.2,基站扇区的流量模式为不相关模式;
当-0.3≤节假日系数<-0.1,基站扇区的流量模式为弱负相关模式;
当1≤节假日系数<-0.3,基站扇区的流量模式为强负相关模式。


5.根据权利要求1提供的一种基于相关性聚类混合算法模型的节假日无线流量预测方法,其特征在于,步骤5)中,使用不同流量模式对应的训练集分别训练混合算法模...

【专利技术属性】
技术研发人员:张海霞康天宇袁东风梁聪梁道君
申请(专利权)人:山东大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1