System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请属于计算机,具体涉及一种时间序列数据的异常识别方法、时间序列数据的异常识别装置、计算机可读介质、电子设备以及计算机程序产品。
技术介绍
1、在通过计算机设备执行的业务流程中,存在大量的可监控指标数据(例如:零售场景中的订单量),其异常变化可能为重要的业务问题的预兆,因此有必要对这些指标进行常态化监控。
2、现有方案主要依赖于人工阈值配置进行指标监控,包括以固定参数作为异常标准的常数阈值法、以区间范围作为异常标准的相对阈值法。通过人工配置或者通过人工智能模型预测等方式,可以获取指标参考值(或者区间范围)作为异常检测的阈值。
3、由于指标数据存在波动性,为了避免阈值配置不合理的问题,需要不断更新异常检测标准。然而,异常检测标准的更新存在一定的滞后性,导致异常识别准确性差的问题。
技术实现思路
1、本申请提供一种时间序列数据的异常识别方法、时间序列数据的异常识别装置、计算机可读介质、电子设备以及计算机程序产品,目的在于提高时间序列数据的异常识别准确性。
2、本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
3、根据本申请实施例的一个方面,提供一种时间序列数据的异常识别方法,该方法包括:根据预设的检测长度从时间序列数据中提取得到多个数据点序列,所述检测长度是用于对所述时间序列数据进行异常检测的最小序列长度;对所述数据点序列按照至少两种不同的差分距离分别计算一阶差分值,得到多个差分值序列;分别对所述数据
4、根据本申请实施例的一个方面,提供一种时间序列数据的异常识别装置,该装置包括:
5、提取模块,被配置为根据预设的检测长度从时间序列数据中提取得到多个数据点序列,所述检测长度是用于对所述时间序列数据进行异常检测的最小序列长度;
6、计算模块,被配置为对所述数据点序列按照至少两种不同的差分距离分别计算一阶差分值,得到多个差分值序列;
7、聚类模块,被配置为分别对所述数据点序列和所述差分值序列进行聚类处理,得到多个聚类结果,所述聚类结果用于指示各个所述数据点序列和各个所述差分值序列是否为孤立序列;
8、识别模块,被配置为根据多个所述聚类结果识别当前时间节点所在的数据点序列是否为异常数据。
9、在本申请的一些实施例中,基于以上技术方案,所述提取模块包括:
10、周期获取模块,被配置为获取时间序列数据的时序周期,所述时序周期是用于描述所述时间序列数据的数值变化规律的最小时间周期;
11、长度确定模块,被配置为根据所述时序周期和预设的提取比例确定用于进行异常检测的检测长度;
12、序列提取模块,被配置为根据所述检测长度从所述时间序列数据中提取得到多个数据点序列,各个所述数据点序列的序列长度为所述检测长度,并且各个所述数据点序列处于所述时序周期中的相同周期节点。
13、在本申请的一些实施例中,基于以上技术方案,所述周期获取模块包括:
14、数据聚合模块,被配置为按照预设的滑动窗口和滑动步长对所述时间序列数据进行聚合处理,得到聚合后的时间序列数据;
15、周期性检测模块,被配置为对所述聚合后的时间序列数据进行周期性检测,得到与所述滑动窗口相对应的候选周期;
16、周期确定模块,被配置为当所述滑动窗口与所述候选周期相匹配时,将所述候选周期确定为所述时间序列数据的时序周期。
17、在本申请的一些实施例中,基于以上技术方案,所述周期性检测模块进一步被配置为:将所述聚合后的时间序列数据由时域空间映射至频域空间,得到所述聚合后的时间序列数据在频域空间中的分布频率;若所述分布频率与所述滑动窗口匹配成功,则根据所述分布频率确定与所述滑动窗口相对应的候选周期;若所述分布频率与所述滑动窗口匹配失败,则根据自相关函数计算所述聚合后的时间序列数据的基音频率和自相关分数,并在所述自相关分数大于预设的分数阈值时,根据所述基音频率确定与所述滑动窗口相对应的候选周期。
18、在本申请的一些实施例中,基于以上技术方案,所述装置还包括:
19、聚合模块,被配置为以所述时序周期作为滑动窗口,按照预设的滑动步长对所述时间序列数据进行聚合处理,得到聚合后的时间序列数据。
20、在本申请的一些实施例中,基于以上技术方案,所述装置还包括:
21、平滑处理模块,被配置为根据预设的平滑处理窗口对所述数据点序列进行多项式拟合,得到平滑处理后的数据点序列,所述平滑处理窗口的窗口尺寸大于所述差分距离。
22、在本申请的一些实施例中,基于以上技术方案,所述装置还包括:
23、序列选取模块,被配置为分别计算各个数据点序列与当前时间节点所在的数据点序列之间的序列相似度;
24、根据所述序列相似度选取用于进行聚类处理的多个数据点序列以及与所述数据点序列相对应的差分值序列。
25、在本申请的一些实施例中,基于以上技术方案,所述聚类模块进一步被配置为:根据预设的聚类簇数量对所述数据点序列进行聚类处理,得到与所述当前时间节点所在的数据点序列相对应的目标聚类簇;若所述目标聚类簇的元素数量等于一,则确定所述当前时间节点所在的数据点序列为孤立序列;若所述目标聚类簇的元素数量大于一,则增大所述聚类簇数量并继续对所述数据点序列进行聚类处理,直至达到预设的聚类簇数量上限。
26、在本申请的一些实施例中,基于以上技术方案,所述识别模块进一步被配置为:获取多个所述聚类结果中的孤立结果数量,孤立结果表示所述当前时间节点对应的数据点序列或者差分值序列在聚类结果中被识别为孤立序列;若所述孤立结果数量大于聚类结果总数量的二分之一,则确定所述当前时间节点所在的数据点序列为异常数据;若所述孤立结果数量大于零且小于所述聚类结果总数量的二分之一,则根据与所述孤立结果相对应的聚类簇数量识别当前时间节点所在的数据点序列是否为异常数据。
27、在本申请的一些实施例中,基于以上技术方案,所述识别模块进一步被配置为:根据预设的聚类簇数量上限和预设的数量比例确定数量阈值;若与所述孤立结果相对应的聚类簇数量小于所述数量阈值,则确定所述当前时间节点所在的数据点序列为异常数据。
28、根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的时间序列数据的异常识别方法。
29、根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为执行所述可执行指令来实现如以上技术方案中的时间序列数据的异常识别方法。
30本文档来自技高网...
【技术保护点】
1.一种时间序列数据的异常识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据预设的检测长度从时间序列数据中提取得到多个数据点序列,包括:
3.根据权利要求2所述的方法,其特征在于,获取时间序列数据的时序周期,包括:
4.根据权利要求3所述的方法,其特征在于,对所述聚合后的时间序列数据进行周期性检测,包括:
5.根据权利要求2所述的方法,其特征在于,在根据所述检测长度从所述时间序列数据中提取得到多个数据点序列之前,所述方法还包括:
6.根据权利要求1至5中任意一项所述的方法,其特征在于,在对所述数据点序列按照至少两种不同的差分距离分别计算一阶差分值之前,所述方法还包括:
7.根据权利要求1至5中任意一项所述的方法,其特征在于,在分别对所述数据点序列和所述差分值序列进行聚类处理之前,所述方法还包括:
8.根据权利要求1至5中任意一项所述的方法,其特征在于,对所述数据点序列进行聚类处理,包括:
9.根据权利要求1至5中任意一项所述的方法,其特征在于,根据多个所述聚类
10.根据权利要求9所述的方法,其特征在于,根据与所述孤立结果相对应的聚类簇数量识别当前时间节点所在的数据点序列是否为异常数据,包括:
...【技术特征摘要】
1.一种时间序列数据的异常识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据预设的检测长度从时间序列数据中提取得到多个数据点序列,包括:
3.根据权利要求2所述的方法,其特征在于,获取时间序列数据的时序周期,包括:
4.根据权利要求3所述的方法,其特征在于,对所述聚合后的时间序列数据进行周期性检测,包括:
5.根据权利要求2所述的方法,其特征在于,在根据所述检测长度从所述时间序列数据中提取得到多个数据点序列之前,所述方法还包括:
6.根据权利要求1至5中任意一项所述的方法,其特征在于,在对所述数据点序列按照至...
【专利技术属性】
技术研发人员:蔡远航,王子泰,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。