一种时间序列异常数据检测方法及相关设备技术

技术编号:28871949 阅读:35 留言:0更新日期:2021-06-15 23:04
本申请提供了一种时间序列异常数据检测方法及相关设备,可以不需要大量的特征工程和人工标注,也无需大量内存用于存储向量描述,减少工作量及内存成本,同时降低人力成本。该方法包括:获取预设时长内的时间序列数据;对所述时间序列数据进行预处理,得到目标时间序列;对所述目标时间序列进行周期判断,得到所述目标时间序列对应的目标周期;基于所述目标周期对所述目标时间序列进行分解,得到所述目标时间序列对应的目标输出结果,所述目标输出结果包括残差项以及其余项;根据所述目标输出结果的残差项以及其余项确定所述目标时间序列中的异常数据。

【技术实现步骤摘要】
一种时间序列异常数据检测方法及相关设备
本申请涉及通信领域,尤其涉及一种时间序列异常数据检测方法及相关设备。
技术介绍
在民航业务信息系统中,时间序列异常检测是保证服务质量的重要手段。随着服务的规模和复杂度不断增加,监测系统的各种关键性能指标(KPI)及时发现异常并处理异常,可以防止由异常未及时处理导致的服务器瘫痪,避免损害业务和影响客户体验的情况发生。在运维管理系统中,由于异常检测需要具有实时性,人工检测的方法会耗费大量的人力,一般设法实现自动异常检测。现有的时间序列异常检测的方法是将时序异常检测作为一个二分类问题,通过两种方法来进行异常检测:一种是传统的机器学习方法,另外一种是基于深度神经网络的方法。传统的机器学习方法需要使用统计分析或者其他方法提取大量的特征,然后将这些特征输入强大的分类器中,比如一类支持向量机(OneClass-Supportvectormachine,OC-SVM),随机森林(RandomForest,RF),支持向量数据描述(SupportVectorDataDescription,SVDD)等,这类本文档来自技高网...

【技术保护点】
1.一种时间序列异常数据检测方法,其特征在于,包括:/n获取预设时长内的时间序列数据;/n对所述时间序列数据进行预处理,得到目标时间序列;/n对所述目标时间序列进行周期判断,得到所述目标时间序列对应的目标周期;/n基于所述目标周期对所述目标时间序列进行分解,得到所述目标时间序列对应的目标输出结果,所述目标输出结果包括残差项以及其余项;/n根据所述目标输出结果的残差项以及其余项确定所述目标时间序列中的异常数据。/n

【技术特征摘要】
1.一种时间序列异常数据检测方法,其特征在于,包括:
获取预设时长内的时间序列数据;
对所述时间序列数据进行预处理,得到目标时间序列;
对所述目标时间序列进行周期判断,得到所述目标时间序列对应的目标周期;
基于所述目标周期对所述目标时间序列进行分解,得到所述目标时间序列对应的目标输出结果,所述目标输出结果包括残差项以及其余项;
根据所述目标输出结果的残差项以及其余项确定所述目标时间序列中的异常数据。


2.根据权利要求1所述的方法,其特征在于,所述对所述目标时间序列进行周期判断,得到所述目标时间序列对应的目标周期包括:
通过如下公式计算所述目标时间序列对应的目标周期:



其中,T为所述目标周期,ACF(l)为所述目标时间序列对应的不同的时间延迟l的自相关系数/序列相关函数,通过如下公式计算ACF(l):



其中,n为所述目标时间序列中数据点的数量,Yi为所述目标时间序列中的第i个序列。


3.根据权利要求1所述的方法,其特征在于,所述其余项包括季节项以及趋势项,所述根据所述目标输出结果的残差项以及其余项确定所述目标时间序列中的异常数据包括:
根据所述目标周期计算第一目标数据点的平均值,所述第一目标数据点为所述目标输出结果的残差项中任意一个数据;
计算第一数据点与第二数据点的目标和值,所述第一数据点为所述目标输出结果的季节项与所述第一目标数据点对应的数据点,所述第二数据点为所述目标输出结果的趋势项中与所述第一目标数据点对应的数据点;
根据所述第一目标数据点的平均值以及所述目标和值确定第一基线点、第一上界线点以及第一下界线点,其中,所述第一动态基线点为第一动态基线中与所述第一目标数据点对应的基线点,所述第一上界线点为第一上界线中与所述第一目标数据点对应的上界线点,所述第一下界线点为第一下界线中与所述第一目标数据点对应的下界线点;
将所述目标时间序列中不处于所述第一上界线与所述第一下界线之间的数据点确定为所述目标时间序列的异常数据。


4.根据权利要求3所述的方法,其特征在于,所述根据所述目标周期计算第一目标数据点的平均值包括:
通过如下公式计算所述第一目标数据点的平均值:



其中,Mi为所述第一目标数据点的平均值,Ri为所述第一目标数据点,T为所述目标周期;
所述根据所述第一目标数据点的平均值以及所述目标和值确定第一基线点、第一上界线点以及第一下界线点包括:
通过如下公式计算所述第一基线点:
Bi=Mi+Ai;
其中,Bi为所述第一基线点,Ai为所述目标和值,Ai=Ti+Si,Ti为所述第二数据点,Si为所述第一数据点;
通过如下公式计算所述第一上界线点:



其中,为所述第一上界线点,σi为所述第一目标数据点对应的标准差,
通过如下公式计算所述第一下界线点:



其中,为所述第一下界线点。


5.根据权利要求1所述的方法,其特征在于,所述根据所述目标输出结果的残差项以及其余项确定所述目标时间序列中的异常数据包括:
确定第二目标数据点的第一四分位数、中位数以及第三四分位数,所述第二目标数据点为所述目标输出结果的残差项中的任意一个数据点;
确定所述其余项中与所述第一目标数据点对应的第三数据点的值;
根据所述中位数以及所述第三数据点确定第二基线点,所述第二基线点为第二动态基线中与所述目标数据点对应的基线点;
根据所述第一四分位数、所述第三四分位数以及所述第三数据点计算第二上界线点以及第二下界线点,...

【专利技术属性】
技术研发人员:郭东丹刘晓辉周子站周凯洋李婷
申请(专利权)人:中国民航信息网络股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1