数据预测方法和系统以及报警方法和系统技术方案

技术编号:12021040 阅读:65 留言:0更新日期:2015-09-09 18:19
本发明专利技术提供一种网站指标的数据预测方法和系统以及报警方法和系统,该数据预测方法包括:采集一预设区域内的一指标的历史数据,按照时间周期对该些历史数据进行分类,且每一时间周期内的历史数据按照日期先后顺序分类;将每一时间周期内的历史数据划分为标准数据和待修正数据,根据标准数据对待修正数据进行修正,修正后的数据和标准数据构成历史优化数据;根据该些历史优化数据通过ARIMAX模型计算一预测日期该指标的预测数据。本发明专利技术能够准确预测出某一预测日期某一指标的预测数据,显著提高了预测的准确性,并且在衡量网站运营状况的多个指标同时满足一定条件时实现报警,使得用户及时地了解到网站运营状况。

【技术实现步骤摘要】

本专利技术涉及一种对网站多种指标的数据预测以及网站的运营状况的衡量,特别涉 及一种网站指标的数据预测方法和数据预测系统以及报警方法和报警系统。
技术介绍
目前很多网站监控只针对个别指标,且只能发现较为明显的异常,使用的方法也 比较单一,比如聚类、箱线图等。现有技术中,针对网站指标例如浏览量的数据预测这一块, 许多学者提出众多预测方法,比如利用一般的ARIMA模型(AutoregressiveIntegrated MovingAverageModel,差分自回归移动平均模型),但这一类模型很少考虑季节、节假日等 因素对数据预测的影响,所以较为简单的ARIMA模型预测出的数据相对不准确。并且其他 很多数据预测模型仅仅停留在理论讨论阶段,由于没有考虑到真实数据的杂乱性,这些数 据预测模型很少应用于实际应用中。另外还有类似卡尔曼滤波算法,但此类算法适用于实 时数据以及变化比较稳定的数据预测,并不适用于旅游网站(周末数据明显较低)等网站流 量的数据预测及监控。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中对网站指标的数据进行预测的 方法有些算法简单,预测出的数据不准确,有些算法无法应用至实际场合中的缺陷,提供一 种具有准确预测出网站指标的数据及多种指标出现异常时及时报警的功能的网站指标的 数据预测方法和系统以及报警方法和系统。 本专利技术是通过下述技术方案来解决上述技术问题的: 本专利技术提供一种网站指标的数据预测方法,其特点在于,其包括以下步骤: Si、采集一预设区域内的一指标的历史数据,按照时间周期对该些历史数据进行 分类,且每一时间周期内的历史数据按照日期先后顺序分类; S2、将每一时间周期内的历史数据划分为标准数据和待修正数据,根据标准数据 对待修正数据进行修正,修正后的数据和标准数据构成历史优化数据; S3、根据该些历史优化数据通过ARIMAX模型(带有输入序列的一般ARIMA模型被 称为ARIMAX模型)计算一预测日期该指标的预测数据。 历史数据是某一预测日期的数据预测的基础,例如网站的浏览量历史数据,由于 周末或国家法定节假日时浏览网页的用户明显减少,即这些时间的浏览量历史数据明显偏 低,这些明显偏低的数据的出现是不可避免的。若是通过未修正的浏览量历史数据进行预 测日期的数据预测,则会使得预测出的数据相对不准确,无法精确的反映出预测日期的浏 览量,影响预测体系的预测精度。因此在步骤S2中,对历史数据进行了修正。 将修正后的历史优化数据带入ARIMAX模型进而预测出一预测日期某一指标例如 浏览量的预测数据,且预测出的该预测数据较为准确,能够相对真实的反映出该预测日期 的浏览量情况。 较佳地,在步骤s2中,对于任一时间周期内的任一待修正数据,修正操作包括: 利用公式计算该待修正数据的修正参数,其中r为该时间周期内 标准数据的个数,R为该待修正数据,Rk为该时间周期内第k个标准数据,r为正整数且 1 ^k^r; 修正后的数据为该待修正数据与该修正参数的乘积; 在步骤s3之后,包括以下步骤: S4、判断该预测数据是否需要修正,若是则进入步骤S5,若否则结束流程; S5、利用公式计算该预测数据的预测修正参数,其中S为该预测日期对 应的时间周期内标准数据的个数,F为该预测数据,Fm为该预测日期对应的时间周期内第m个标准数据,s为正整数且1 <m<s; s6、该预测日期该指标的实际预测数据为该预测数据与该预测修正参数的商。 较佳地,在步骤s2之后包括以下步骤,设定Xi为该预测日期之前的第i天的历史 优化数据,i为遍历1至n的整数,针对任一i: 通过公式计算该第i天对应的平均数,其中,yij表示该第i天所处时 间周期之前的第j个时间周期对应日期的历史优化数据,J为正整数且1彡j彡J; 将历史优化数据yn至按照从小到大或从大到小顺序进行排序以形成一数据序 列; 当J为奇数时,该第i天对应的中位数乂为该数据序列中处于中间位置的历史优 化数据,当J为偶数时,Mi为该数据序列中处于中间位置的两个历史优化数据的平均值; 计算第一平均值 计算第一相关性、第二相关性'并取A和r2中的较大值作为先验指标xt ; 在步骤S3 中,利用模型 (B)C>s(Bs)yt =ii而+? (B) ?S(BS)eV(〇.of)计 算该预测数据,其中,〇(B)为自回归算子且〇(B) =l-chB-小忑2-…-ctpBp,p为自回归项 数,〇s(Bs)为季节性自回归算子且〇s(Bs) = --小PBPS,?⑶为移动平均 算子且?⑶=1-e0 2B2-- 0qB%q为移动平均项数,?s (Bs)为季节性移动平均算子 且?S(BS) = 1- 0 0 2B2s-0qB9S,yt为该预测数据,y和@ :为预设参数。 其中,预设参数U和^均是一种经验值,通过R(R是一套完整的数据处理、计 算和制图软件系统)程序不断地训练可以实现对U和的预测。 模型 〇 ⑶ 〇s (Bs)yt =ii+ 3 lXt+ ? ⑶ ?s (Bs)et 是对ARIMAX模型的优化,在 ARIMAX模型中加入了影响因子PlXt,将根据平均数计算出的第一相关性和根据中位数计 算出的第二相关性进行比较,并将比较出的较大值作为xt带入上述模型。 较佳地,在步骤S2之后包括以下步骤,设定每年被划分为V个时间段,该预测日期 所处的时间段为第a个时间段,V为正整数且1彡a彡V: 计算该预测日期所处时间段对应的时间段指数 其中, U为正整数且1彡u彡U,1彡v彡V; f Fau为该预测日期所处年份之前的第u年第a个时间段的历史优化数据,Uj该预 测日期所处年份之前的U年中各年第a个时间段的历史优化数据的平均值,Fvu为该预测日 期所处年份之前的第u年第v个时间段的历史优化数据,万为该预测日期所处年份之前的 U年中各年各时间段的历史优化数据的总平均值; 在步骤S3中,利用模型①⑶①s (Bs)yt =ii+ @而+ @ 2ft+ ?⑶?s (Bs)et计算该 预测数据,其中,为预设参数,通过R程序预测出。 模型①⑶ 〇s (Bs)yt =ii+ 3 lXt+ 3 2ft+ ? ⑶ ?s (Bs)et 是对ARIMAX模型的进一 步优化,在ARIMAX模型中又加入了影响因子P2ft。 较佳地,在步骤S2之后包括以下步骤: 判断该预测日期是否为一设定日期,若是则设定日期因子的信号指标gt为1,若否 则该信号指标gt为〇 ; 在步骤S3中,利用模型①⑶①s(Bs)yt =ii+3而+3 2ft+3 3gt+?⑶?S(BS)et计 算该预测数据,其中,0 3为预设参数,通过R程序预测出。 模型 〇 ⑶ 〇s (Bs)yt =ii+ 3 lXt+ 3 2ft+ 3 3gt+ ? ⑶ ?s (Bs)et 是对ARIMAX模型的 进一步优化,在ARIMAX模型中又加入了影响因子P3gt。 较佳地,在步骤S3之后包括以下步骤: 计算该预测日期对应的标准误差 则该预测数据的置信区间 f 为[F- 0Se,F+ 0SJ,其中W为正整数且1彡w彡W,Xw为该预测日期之前的第w天的历史优 化数据,FWS该预测日期之前的第w天的预测数据,F为该预测数据,0为标准正态分布的分本文档来自技高网...

【技术保护点】
一种网站指标的数据预测方法,其特征在于,其包括以下步骤:S1、采集一预设区域内的一指标的历史数据,按照时间周期对该些历史数据进行分类,且每一时间周期内的历史数据按照日期先后顺序分类;S2、将每一时间周期内的历史数据划分为标准数据和待修正数据,根据标准数据对待修正数据进行修正,修正后的数据和标准数据构成历史优化数据;S3、根据该些历史优化数据通过ARIMAX模型计算一预测日期该指标的预测数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:卢孔敏周秀凤聂强强康伟华
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1