流量异常检测的方法、模型训练方法和装置制造方法及图纸

技术编号:27438649 阅读:35 留言:0更新日期:2021-02-25 03:36
本申请提供了一种流量异常检测的方法,该方法包括:获取包括N个元素的目标时间序列;根据目标时间序列,获取目标时间序列的目标参数,目标参数包括周期因子和/或抖动密度,周期因子表示目标时间序列中呈现出来的围绕长期趋势的一种波浪形变动,抖动密度表示目标时间序列在目标时间内实际值与目标值的偏差;根据目标参数,从多个类型中确定目标时间序列所属于的第一类型,其中,多个类型中的每个类型对应一个参数集合,目标参数属于第一类型对应的参数集合;根据第一类型对应的第一类的判定模型,检测目标时间序列的异常情况,其中,多个类型中的每个类型对应一个类型的判定模型。通过上述技术方案,可以提高流量异常检测的精度。可以提高流量异常检测的精度。可以提高流量异常检测的精度。

【技术实现步骤摘要】
流量异常检测的方法、模型训练方法和装置


[0001]本申请涉及机器学习领域,并且更具体地,涉及一种流量异常检测的方法、模型训练方法和装置。

技术介绍

[0002]在机器学习领域中,异常检测指对不符合预测的模型、数据或时间进行检测。通常异常检测是由专业人员对历史数据的学习,然后找出异常点。数据来源包括应用、进程、操作系统、设备或者网络,随着计算系统复杂度的提升,人工已经不能胜任现在的异常检测难度。
[0003]在现有技术中,基于统计与数据分布的算法对网络流量数据进行异常检测,前提条件是假设在短时间内,流量数据服从正态分布,但是,网络流量数据分布在短时间内并不服从正态分布,因此,基于统计与数据分布的算法对网络流量数据进行异常检测的精度不高。

技术实现思路

[0004]本申请提供一种流量异常检测的方法、模型训练方法和装置,能够提高模型对网络流量数据的异常检测的精度。
[0005]第一方面,提供了一种流量异常检测的方法,获取目标时间序列,所述目标时间序列包括N个元素,所述N个元素与N个时刻对应,其中,所述N个元素中的每个元素为所对应的时刻接收到的流量数据;根据所述目标时间序列,获取所述目标时间序列的目标参数,所述目标参数包括周期因子和/或抖动密度,其中,所述周期因子用于表示所述目标时间序列中呈现出来的围绕长期趋势的一种波浪形变动,所述抖动密度用于表示所述目标时间序列在目标时间内实际值与目标值的偏差;根据所述目标参数,从多个类型中确定所述目标时间序列所属于的第一类型,其中,所述多个类型中的每个类型对应一个参数集合,所述目标参数属于所述第一类型对应的参数集合;根据所述第一类型对应的第一类的判定模型,检测所述目标时间序列的异常情况,其中,所述多个类型中的每个类型对应一个类型的判定模型,所述判定模型用于流量异常检测。
[0006]首先,根据获取到的目标时间序列,确定目标时间序列的目标参数;其次,根据目标参数,确定目标时间序列所属于的第一类型;最后,根据第一类型对应的第一类的判定模型,对目标时间序列进行流量异常检测,因此,可以提高流量异常检测的精度。
[0007]结合第一方面,在一种可能的实现方式中,所述根据所述目标时间序列,获取所述目标时间序列的目标参数包括:将所述目标时间序列中的所述N个元素中的每个元素分解为趋势分量、周期分量和残余分量;确定包括N个所述周期分量的第一子时间序列和包括N个所述残余分量的第二子时间序列;根据所述第一子时间序列或所述第二子时间序列,获取所述目标时间序列的目标参数。
[0008]结合第一方面,在一种可能的实现方式中,所述根据所述第一子时间序列或所述
第二子时间序列,获取所述目标时间序列的目标参数包括:根据所述第一子时间序列,确定所述目标时间序列是否存在所述周期因子。
[0009]结合第一方面,在一种可能的实现方式中,所述根据所述第一子时间序列,确定所述目标时间序列是否存在所述周期因子包括:在所述第一子时间序列中的N个周期分量存在的情况下,确定所述目标时间序列存在所述周期因子;在所述第一子时间序列中的N个周期分量不存在的情况下,确定所述目标时间序列不存在所述周期因子。
[0010]结合第一方面,在一种可能的实现方式中,所述方法还包括:根据第一映射关系和所述目标时间序列所属于的第一类型,确定所述第一类型对应的第二类的判定模型,所述第一映射关系包括所述多个类型和多个所述第二类的判定模型的对应关系;根据所述第二子时间序列和所述第一类型对应的第二类的判定模型,检测所述目标时间序列的异常情况,所述第二类的判定模型是N-sigma模型。
[0011]结合第一方面,在一种可能的实现方式中,所述根据所述第一子时间序列或所述第二子时间序列,获取所述目标时间序列的目标参数包括:根据所述第二子时间序列,确定所述目标时间序列的抖动密度。
[0012]结合第一方面,在一种可能的实现方式中,所述根据所述第二子时间序列,确定所述目标时间序列的抖动密度包括:根据以下公式确定所述目标时间序列的R:
[0013][0014]其中,所述R是抖动密度,所述r
n
可以根据以下公式确定:
[0015][0016]其中,所述C
n
为所述第二子时间序列中的第n个元素,所述x
n
为所述目标时间序列中的第n个元素;
[0017]所述N根据以下公式确定:
[0018][0019]所述T为所述目标时间序列的长度,所述W为加入窗口的窗长,所述α是第一预设值。
[0020]结合第一方面,在一种可能的实现方式中,所述根据目标参数,从多个类型中确定所述目标时间序列所属于的第一类型包括:根据所述目标参数,从所述多个参数集合中确定所述目标参数属于的第一参数集合;根据第三映射关系和所述第一参数集合,从多个类型中确定所述目标时间序列所属于的第一类型,所述第三映射关系包括多个参数集合和多
个所述类型的对应关系。
[0021]其中,上述所述类型可以包括:周期型、非周期型、稳定型、毛刺型、周期稳定型、周期毛刺型、非周期稳定型或非周期毛刺型。
[0022]其中,周期型和非周期型可以根据周期因子确定。具体地,在所述周期因子存在的情况下,所述类型为周期型;在所述周期因子不存在的情况下,所述类型为非周期型。
[0023]其中,稳定型和毛刺型可以根据抖动密度确定。具体地,在所述抖动密度大于第二预设值的情况下,所述类型为毛刺型;在所述抖动密度小于或等于所述第二预设值的情况下,所述类型为平稳型。
[0024]根据目标参数,从多个参数集合中确定目标参数属于的第一参数集合,再根据第三映射关系和第一参数集合,从多个类型中确定目标时间序列所属于的第一类型,从而可以获取目标时间序列所属于的类型,完成对目标时间序列的分类。
[0025]结合第一方面,在一种可能的实现方式中,所述根据所述第一类型对应的第一类的判定模型,检测所述目标时间序列的异常情况包括:确定包括N个所述趋势分量的第三子时间序列;将第二时间序列分成M个目标长度的子序列,所述M为正整数,所述第二时间序列是所述第三子时间序列或所述第二时间序列是根据所述第三子时间序列和线性分段算法PLR形成的;计算M个目标长度的子序列的矩阵轮廓MP值,所述M个目标长度的子序列的矩阵轮廓MP值组成MP时间序列;根据所述MP时间序列和N-sigma算法,检测所述目标时间序列的异常情况。
[0026]首先,将第二时间序列分成M个目标长度的子序列,其中,第二时间序列是所述第三子时间序列或所述第二时间序列是根据所述第三子时间序列和线性分段算法PLR形成的,其次,计算M个目标长度的子序列的矩阵轮廓MP值;最后,根据MP时间序列和N-sigma算法,检测目标时间序列的异常情况,从而提高了流量异常检测的精度。
[0027]结合第一方面,在一种可能的实现方式中,所述方法还包括:根据第二映射关系和所述目标时间序列所属于的第一类型,确定所述第一类型对应的第一类的判定模型,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流量异常检测的方法,其特征在于,包括:获取目标时间序列,所述目标时间序列包括N个元素,所述N个元素与N个时刻对应,其中,所述N个元素中的每个元素为所对应的时刻接收到的流量数据;根据所述目标时间序列,获取所述目标时间序列的目标参数,所述目标参数包括周期因子和/或抖动密度,其中,所述周期因子用于表示所述目标时间序列中呈现出来的围绕长期趋势的一种波浪形变动,所述抖动密度用于表示所述目标时间序列在目标时间内实际值与目标值的偏差;根据所述目标参数,从多个类型中确定所述目标时间序列所属于的第一类型,其中,所述多个类型中的每个类型对应一个参数集合,所述目标参数属于所述第一类型对应的参数集合;根据所述第一类型对应的第一类的判定模型,检测所述目标时间序列的异常情况,其中,所述多个类型中的每个类型对应一个类型的判定模型,所述判定模型用于流量异常检测。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标时间序列,获取所述目标时间序列的目标参数包括:将所述目标时间序列中的所述N个元素中的每个元素分解为趋势分量、周期分量和残余分量;确定包括N个所述周期分量的第一子时间序列和包括N个所述残余分量的第二子时间序列;根据所述第一子时间序列或所述第二子时间序列,获取所述目标时间序列的目标参数。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一子时间序列或所述第二子时间序列,获取所述目标时间序列的目标参数包括:根据所述第一子时间序列,确定所述目标时间序列是否存在所述周期因子。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一子时间序列,确定所述目标时间序列是否存在所述周期因子包括:在所述第一子时间序列中的N个周期分量存在的情况下,确定所述目标时间序列存在所述周期因子;在所述第一子时间序列中的N个周期分量不存在的情况下,确定所述目标时间序列不存在所述周期因子。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据第一映射关系和所述目标时间序列所属于的第一类型,确定所述第一类型对应的第二类的判定模型,所述第一映射关系包括所述多个类型和多个所述第二类的判定模型的对应关系;根据所述第二子时间序列和所述第一类型对应的第二类的判定模型,检测所述目标时间序列的异常情况,其中,所述第二类的判定模型是N-sigma模型。6.根据权利要求2所述的方法,其特征在于,所述根据所述第一子时间序列或所述第二子时间序列,获取所述目标时间序列的目标参数包括:根据所述第二子时间序列,确定所述目标时间序列的抖动密度。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第二子时间序列,确定所述目标时间序列的抖动密度包括:根据以下公式确定所述目标时间序列的抖动密度:其中,所述R是抖动密度,所述r
n
可以根据以下公式确定:其中,所述C
n
为所述第二子时间序列中的第n个元素,所述x
n
为所述目标时间序列中的第n个元素;所述N根据以下公式确定:所述T为所述目标时间序列的长度,所述W为加入窗口的窗长,所述α是第一预设值。8.根据权利要求1所述的方法,其特征在于,所述根据目标参数,从多个类型中确定所述目标时间序列所属于的第一类型包括:根据所述目标参数,从所述多个参数集合中确定所述目标参数属于的第一参数集合;根据第三映射关系和所述第一参数集合,从多个类型中确定所述目标时间序列所属于的第一类型,所述第三映射关系包括多个参数集合和多个所述类型的对应关系。9.根据权利要求2所述的方法,其特征在于,所述根据所述第一类型对应的第一类的判定模型,检测所述目标时间序列的异常情况包括:确定包括N个所述趋势分量的第三子时间序列;将第二时间序列分成M个目标长度的子序列,所述M为正整数,所述第二时间序列是所述第三子时间序列或所述第二时间序列是根据所述第三...

【专利技术属性】
技术研发人员:张彦芳李刚薛莉林玮唐宏朱永庆
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1