一种网络流量峰值的预测方法及装置制造方法及图纸

技术编号:14349361 阅读:77 留言:0更新日期:2017-01-04 20:00
本发明专利技术实施例公开了一种网络流量峰值的预测方法及装置,所述方法包括:采集当前数据采集周期内的网络流量数据;确定所述网络流量数据服从的至少一个概率分布;针对所确定的概率分布中的每一概率分布,估计该概率分布的参数;根据该概率分布以及该概率分布的参数,确定针对所述网络流量数据的概率密度函数;确定和所述网络流量数据的拟合优度最高的概率密度函数;利用所述拟合优度最高的概率密度函数预测下一数据采集周期的网络流量峰值。应用本发明专利技术实施例,对下一数据采集周期的网络流量数据进行了概率上的描述,提高了网络流量峰值预测的准确度。

【技术实现步骤摘要】

本专利技术涉及数据预测
,特别涉及一种网络流量峰值的预测方法及装置
技术介绍
随着网络技术的发展,人们越来越多的利用网络观看电视剧或者综艺节目。当新电视剧剧集或者新一期综艺节目上线后,在一段时间内,针对新电视剧剧集或者新一期综艺节目的点击量会增加到一个峰值,对应的网络流量数据就达到了一个峰值,然后随着时间的推进,点击量逐渐下降。如果网络流量数据超出服务器的最大工作能力,会导致部分用户无法访问或者服务器超负荷运转,因此对网络流量数据的峰值进行预测是非常必要的。目前网络流量峰值预测的常用方法为时间序列分析法,这类方法是根据一段时间周期内的网络流量数据的历史数据随着时间的变化关系进行未来数据的计算和预测。而时间序列分析法只能对确定性的事件进行预测,即应用时间序列分析法的前提条件是网络流量数据的变化趋势必然会延续到未来数据采集周期内。而且在实际应用中,网络流量数据的变化过程不只是与时间相关,还有可能与时间之外的一些因素相关,比如影视内容等一些不规则因素,因此,网络流量数据的变化过程具有一定的概率学上的随机性。由于时间序列分析法只能对确定性的变化趋势进行预测,而无法对未来数据采集周期内网络流量数据的随机性变化进行概率上的描述,进而应用现有技术对未来网络流量数据的峰值预测的准确度较低。
技术实现思路
本专利技术实施例的目的在于提供一种网络流量峰值的预测方法及装置,以提高网络流量峰值预测的准确度。为达到上述目的,本专利技术实施例公开了一种网络流量峰值的预测方法,所述方法包括:采集当前数据采集周期内的网络流量数据;确定所述网络流量数据服从的至少一个概率分布;针对所确定的概率分布中的每一概率分布,估计该概率分布的参数;根据该概率分布以及该概率分布的参数,确定针对所述网络流量数据的概率密度函数;确定和所述网络流量数据的拟合优度最高的概率密度函数;利用所述拟合优度最高的概率密度函数预测下一数据采集周期的网络流量峰值。较佳的,在所述确定所述网络流量数据服从的至少一个概率分布之前,所述方法还包括:修正所述网络流量数据中的异常数据;所述确定所述网络流量数据服从的至少一个概率分布,包括:确定修正异常数据后的网络流量数据服从的至少一个概率分布。较佳的,所述确定所述网络流量数据服从的至少一个概率分布,包括:针对所述网络流量数据,利用至少一种连续性随机概率分布进行拟合,得到每一种连续性随机概率分布对应的拟合结果;确定每一拟合结果服从的概率分布。较佳的,所述针对所确定的概率分布中的每一概率分布,估计该概率分布的参数,包括:针对所确定的概率分布中的每一概率分布,利用马尔科夫蒙特卡洛方法估计该概率分布的参数。较佳的,所述针对所确定的概率分布中的每一概率分布,利用马尔科夫蒙特卡洛方法估计该概率分布的参数,包括:针对所确定的概率分布中的每一概率分布,根据该概率分布对应的先验共轭概率分布的参数,确定与所述先验共轭概率分布对应的似然函数表达式;根据所述似然函数表达式以及所述先验共轭概率分布的参数,利用贝叶斯公式计算该概率分布的后验概率分布的参数;判断所述后验概率分布的参数相对于所述先验共轭概率分布的参数的改变量是否小于预设阈值;若是,将所述后验概率分布的参数确定为所述概率分布的参数;若否,将所述先验共轭概率分布的参数更改为当前所述后验概率分布的参数,继续执行所述根据所述似然函数表达式以及所述先验共轭概率分布的参数,利用贝叶斯公式计算该概率分布的后验概率分布的参数的操作步骤。较佳的,所述确定和所述网络流量数据的拟合优度最高的概率密度函数,包括:利用卡方检测法,确定和所述网络流量数据的拟合优度最高的概率密度函数。为达到上述目的,本专利技术实施例还提供了一种网络流量峰值的预测装置,所述装置包括:采集模块、第一确定模块、估计模块、第二确定模块、第三确定模块和预测模块,其中,所述采集模块,用于采集当前数据采集周期内的网络流量数据;所述第一确定模块,用于确定所述网络流量数据服从的至少一个概率分布;所述估计模块,用于针对所确定的概率分布中的每一概率分布,估计该概率分布的参数;所述第二确定模块,用于根据该概率分布以及该概率分布的参数,确定针对所述网络流量数据的概率密度函数;所述第三确定模块,用于确定和所述网络流量数据的拟合优度最高的概率密度函数;所述预测模块,用于利用所述拟合优度最高的概率密度函数预测下一数据采集周期的网络流量峰值。较佳的,所述装置还包括修正模块,用于修正所述网络流量数据中的异常数据;所述第一确定模块,具体用于:确定修正异常数据后的网络流量数据服从的至少一个概率分布。较佳的,所述第一确定模块,具体用于:针对所述网络流量数据,利用至少一种连续性随机概率分布进行拟合,得到每一种连续性随机概率分布对应的拟合结果;确定每一拟合结果服从的概率分布。较佳的,所述估计模块,具体用于:针对所确定的概率分布中的每一概率分布,利用马尔科夫蒙特卡洛方法估计该概率分布的参数。较佳的,所述估计模块,具体用于:针对所确定的概率分布中的每一概率分布,根据该概率分布对应的先验共轭概率分布的参数,确定与所述先验共轭概率分布对应的似然函数表达式;根据所述似然函数表达式以及所述先验共轭概率分布的参数,利用贝叶斯公式计算该概率分布的后验概率分布的参数;判断所述后验概率分布的参数相对于所述先验共轭概率分布的参数的改变量是否小于预设阈值;若是,将所述后验概率分布的参数确定为所述概率分布的参数;若否,将所述先验共轭概率分布的参数更改为当前所述后验概率分布的参数,继续执行所述根据所述似然函数表达式以及所述先验共轭概率分布的参数,利用贝叶斯公式计算该概率分布的后验概率分布的参数的操作步骤。较佳的,所述第三确定模块,具体用于:利用卡方检测法,确定和所述网络流量数据的拟合优度最高的概率密度函数。本专利技术实施例提供了一种网络流量峰值的预测方法及装置,所述方法包括:采集当前数据采集周期内的网络流量数据;确定所述网络流量数据服从的至少一个概率分布;针对所确定的概率分布中的每一概率分布,估计该概率分布的参数;根据该概率分布以及该概率分布的参数,确定针对所述网络流量数据的概率密度函数;确定和所述网络流量数据的拟合优度最高的概率密度函数;利用所述拟合优度最高的概率密度函数预测下一数据采集周期的网络流量峰值。应用本专利技术实施例,对下一数据采集周期的网络流量数据进行了概率上的描述,相对于现有技术无法对未来数据采集周期内网络流量数据的变化进行概率上的描述,提高了网络流量峰值预测的准确度。当然,实施本专利技术的任一产品或方法必不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种网络流量峰值的预测方法的流程示意图;图2为本专利技术实施例提供的拟合占比序列中的数据的结果示意图;图3为本专利技术实施例提供的另一种网络流量峰值的预测方法的流程示意图;图4为本专利技术实施例提供的一种网络流量峰值的预测装置的结构示意图;图5为本专利技术实施例提供的另一种网络流量峰值的预测装置的结构本文档来自技高网...
一种网络流量峰值的预测方法及装置

【技术保护点】
一种网络流量峰值的预测方法,其特征在于,所述方法包括:采集当前数据采集周期内的网络流量数据;确定所述网络流量数据服从的至少一个概率分布;针对所确定的概率分布中的每一概率分布,估计该概率分布的参数;根据该概率分布以及该概率分布的参数,确定针对所述网络流量数据的概率密度函数;确定和所述网络流量数据的拟合优度最高的概率密度函数;利用所述拟合优度最高的概率密度函数预测下一数据采集周期的网络流量峰值。

【技术特征摘要】
1.一种网络流量峰值的预测方法,其特征在于,所述方法包括:采集当前数据采集周期内的网络流量数据;确定所述网络流量数据服从的至少一个概率分布;针对所确定的概率分布中的每一概率分布,估计该概率分布的参数;根据该概率分布以及该概率分布的参数,确定针对所述网络流量数据的概率密度函数;确定和所述网络流量数据的拟合优度最高的概率密度函数;利用所述拟合优度最高的概率密度函数预测下一数据采集周期的网络流量峰值。2.根据权利要求1所述的方法,其特征在于,在所述确定所述网络流量数据服从的至少一个概率分布之前,所述方法还包括:修正所述网络流量数据中的异常数据;所述确定所述网络流量数据服从的至少一个概率分布,包括:确定修正异常数据后的网络流量数据服从的至少一个概率分布。3.根据权利要求1所述的方法,其特征在于,所述确定所述网络流量数据服从的至少一个概率分布,包括:针对所述网络流量数据,利用至少一种连续性随机概率分布进行拟合,得到每一种连续性随机概率分布对应的拟合结果;确定每一拟合结果服从的概率分布。4.根据权利要求1所述的方法,其特征在于,所述针对所确定的概率分布中的每一概率分布,估计该概率分布的参数,包括:针对所确定的概率分布中的每一概率分布,利用马尔科夫蒙特卡洛方法估计该概率分布的参数。5.根据权利要求4所述的方法,其特征在于,所述针对所确定的概率分布中的每一概率分布,利用马尔科夫蒙特卡洛方法估计该概率分布的参数,包括:针对所确定的概率分布中的每一概率分布,根据该概率分布对应的先验共轭概率分布的参数,确定与所述先验共轭概率分布对应的似然函数表达式;根据所述似然函数表达式以及所述先验共轭概率分布的参数,利用贝叶斯公式计算该概率分布的后验概率分布的参数;判断所述后验概率分布的参数相对于所述先验共轭概率分布的参数的改变量是否小于预设阈值;若是,将所述后验概率分布的参数确定为所述概率分布的参数;若否,将所述先验共轭概率分布的参数更改为当前所述后验概率分布的参数,继续执行所述根据所述似然函数表达式以及所述先验共轭概率分布的参数,利用贝叶斯公式计算该概率分布的后验概率分布的参数的操作步骤。6.根据权利要求1所述的方法,其特征在于,所述确定和所述网络流量数据的拟合优度最高的概率密度函数,包括:利用卡方检测法,确定和所述网络流量数据的拟合优度...

【专利技术属性】
技术研发人员:丁希晨肖迪
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1