基于ELM的网络信息热点预测系统和方法技术方案

技术编号:15792154 阅读:63 留言:0更新日期:2017-07-09 23:32
本发明专利技术公开了一种基于ELM的网络信息热点预测系统和方法,包括:采集待测网络信息热点的历史点击率数据,构成网络信息热点的学习样本;对网络信息热点数据的延迟时间τ和嵌入维m进行估计,并对网络信息热点数据进行变换,得到训练样本和测试样本;采用极限学习机器训练网络信息热点样本,训练过程中,采用Cholesky分解方法对极限学习机器的权值β

【技术实现步骤摘要】
基于ELM的网络信息热点预测系统和方法
本专利技术涉及网络信息热点的预测方法,具体涉及一种基于ELM的网络信息热点预测系统和方法。
技术介绍
当前网络信息热点的预测主要采用:传统统计模型和现代统计学模型,传统统计模型无法跟踪网络信息热点的变化态势,预测结果极不可靠。现代统计学模型以获得更高精度的网络信息热点预测结果,但无法满足大规模网络信息热点的数据预测要求。因此,为了提高网络信息热点预测的准确性,更好地描述网络信息热点的变化趋势,亟需一种预测实时性良好、且结果理想的网络信息热点预测系统和方法。
技术实现思路
本专利技术克服现有技术存在的不足,所要解决的技术问题为:提供一种预测实时性良好、且结果理想的基于ELM的网络信息热点预测系统和方法。为了解决上述技术问题,本专利技术采用的技术方案为:基于ELM的网络信息热点预测系统,包括:采集单元:用于采集待测网络信息热点的历史点击率数据,构成网络信息热点的学习样本;估计单元:用于对网络信息热点数据的延迟时间τ和嵌入维m进行估计,并对网络信息热点数据进行变换,得到训练样本和测试样本;训练单元:用于采用极限学习机器训练网络信息热点样本,训练过程中,采用Cholesky分解方法对极限学习机器的权值βL进行最优求解;模型建立单元:用于利用极限学习机器的权值βL,建立网络信息热点的预测模型;预测单元:用于利用预测模型,对网络信息热点的测试样本进行预测。优选地,所述估计单元对网络信息热点数据的延迟时间τ和嵌入维m进行估计时,具体是采用关联积分算法来确定最优的延迟时间τ和嵌入维m。相应地,基于ELM的网络信息热点预测方法,包括以下步骤:采集待测网络信息热点的历史点击率数据,构成网络信息热点的学习样本;对网络信息热点数据的延迟时间τ和嵌入维m进行估计,并对网络信息热点数据进行变换,得到训练样本和测试样本;采用极限学习机器训练网络信息热点样本,训练过程中,采用Cholesky分解方法对极限学习机器的权值βL进行最优求解;利用极限学习机器的权值βL,建立网络信息热点的预测模型;利用预测模型,对网络信息热点的测试样本进行预测。优选地,所述对网络信息热点数据的延迟时间τ和嵌入维m进行估计时,具体是采用关联积分算法来确定最优的延迟时间τ和嵌入维m。本专利技术与现有技术相比具有以下有益效果:本专利技术在对网络信息热点进行预测时,先采集待测网络信息热点的历史点击率数据,构成网络信息热点的学习样本,然后对网络信息热点数据的延迟时间τ和嵌入维m进行估计,并对网络信息热点数据进行变换,得到训练样本和测试样本,接着采用极限学习机器训练网络信息热点样本,再利用极限学习机器的权值βL,建立网络信息热点的预测模型,最后利用预测模型,对网络信息热点的测试样本进行预测;在极限学习机器的训练过程中,关键要找到权值βL的最优值,而对于现有的极限学习机器,在βL的求解过程中,有大量的矩阵求逆运算,导致计算复杂度高,对网络信息热点预测模型的训练过程产生不利影响;因此,本专利技术对现有的极限学习机器进行相应的改进,引入Cholesky分解方法对极限学习机器的权值βL进行最优求解,使得βL的求解仅通过四则运算就可以实现,没有矩阵求逆运算,计算更加简单,大幅度减少了求解的时间,使得对网络信息热点的预测实时性良好,结果也较理想。附图说明下面结合附图对本专利技术做进一步详细的说明;图1为本专利技术提供的基于ELM的网络信息热点预测系统的实施例的结构示意图;图2为本专利技术提供的基于ELM的网络信息热点预测方法的流程示意图;图3为采用本专利技术的实施例对某一网络信息热点进行预测时采集数据的样本示意图;图4为对图3中的网络信息热点数据的延迟时间τ进行估计后取得的最优值的示意图;图5为对图3中的网络信息热点数据的嵌入维m进行估计后取得的最优值的示意图;图6采用本专利技术对图3中的网络信息热点进行预测后的结果示意图;图中:101为采集单元,102为估计单元,103为训练单元,104为模型建立单元,105为预测单元。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例;基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术提供的基于ELM的网络信息热点预测系统的实施例的结构示意图,如图1所示,基于ELM的网络信息热点预测系统,包括:采集单元101:用于采集待测网络信息热点的历史点击率数据,构成网络信息热点的学习样本。估计单元102:用于对网络信息热点数据的延迟时间τ和嵌入维m进行估计,并对网络信息热点数据进行变换,得到训练样本和测试样本。训练单元103:用于采用极限学习机器训练网络信息热点样本,训练过程中,采用Cholesky分解方法对极限学习机器的权值βL进行最优求解。模型建立单元104:用于利用极限学习机器的权值βL,建立网络信息热点的预测模型。预测单元105:用于利用预测模型,对网络信息热点的测试样本进行预测。对一个具体的预测问题,首先要采集历史数据,设历史数据组成的样本集为:其中:n为数据的特征维数,k为样本数量,训练样本的回归误差为εi;那么,标准极限学习机的回归形式可以表示为:式中:L表示隐含层节点的数,ci表示第i个隐含层节点的误差,f表示隐含层节点的非线映射函数,αi和βi分别表示隐含层节点和输入节点的权值。对式(1)进行求解,效率相当低而且难以获得全局最优解,为此引入拉格朗日乘子建立如下优化函数:式中:HL表示节点矩阵,w表示权值,T表示输出结果。对变量的偏导进行计算,得到如下公式:对式(3)求解,极限学习机的权值计算公式为利用权值βL构建相应问题的预测模型,得到输出结果的表达式为在标准极限机器学习过程中,关键要找到βL的最优值,在βL求解过程,有大量的矩阵求逆运算,导致计算复杂度高,对网络信息热点预测模型的训练过程产生不利影响,因此本实施例对标准的极限机器进行相应的改进,引入Cholesky分解方法,再加上极限学习机器的训练过程,快速找到βL的最优求解。下面对采用Cholesky分解方法对极限学习机器的权值βL进行最优求解,来进行详细的说明:根据式(3)能够得到:利用式(6)对βL进行求解,可以得到相应的线性方程形式为:ALβL=bL(7)同时满足如下约束条件:综合式(6)和式(8)可以得到对于v、AL的二次型可以描述为:对式(10)进行详细分析可以发现,AL是一个对称正定矩阵,那么采用Cholesky对其进行分解,就可以得到:式中,SL是一个三角矩阵。sij表示三角矩阵SL中的非零元素,那么根据AL的元素αij可以得到式中,i=1,2,…,L,j=1,2,…,L。结合式(11)和式(7),同时乘上那么根据与SLFL=bL等价,可以得到FL的元素fi为:式中,i=1,2,…,L。根据SL和FL可以得到βL的计算公式为:对比标准ELM和本专利技术中改进的ELM的建模过程,本专利技术中改进的ELM中βL的求解仅通过四则运算就可以实现,没有矩阵求逆运算,计算更加简单,大幅度减少了求解的时间。尤其当隐含层的节点增多条件下,速度更加加快,可以得到:本文档来自技高网...
基于ELM的网络信息热点预测系统和方法

【技术保护点】
基于ELM的网络信息热点预测系统,其特征在于:包括:采集单元(101):用于采集待测网络信息热点的历史点击率数据,构成网络信息热点的学习样本;估计单元(102):用于对网络信息热点数据的延迟时间τ和嵌入维m进行估计,并对网络信息热点数据进行变换,得到训练样本和测试样本;训练单元(103):用于采用极限学习机器训练网络信息热点样本,训练过程中,采用Cholesky分解方法对极限学习机器的权值β

【技术特征摘要】
1.基于ELM的网络信息热点预测系统,其特征在于:包括:采集单元(101):用于采集待测网络信息热点的历史点击率数据,构成网络信息热点的学习样本;估计单元(102):用于对网络信息热点数据的延迟时间τ和嵌入维m进行估计,并对网络信息热点数据进行变换,得到训练样本和测试样本;训练单元(103):用于采用极限学习机器训练网络信息热点样本,训练过程中,采用Cholesky分解方法对极限学习机器的权值βL进行最优求解;模型建立单元(104):用于利用极限学习机器的权值βL,建立网络信息热点的预测模型;预测单元(105):用于利用预测模型,对网络信息热点的测试样本进行预测。2.根据权利要求1所述的基于ELM的网络信息热点预测系统,其特征在于:所述估计单元(102)对网络信息热点数据的延迟时间τ和嵌入维m进行估计时,具体是采用关联...

【专利技术属性】
技术研发人员:林荫张竹清朱莹莹
申请(专利权)人:常州大学怀德学院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1