识别项目异常的方法和装置制造方法及图纸

技术编号:30413837 阅读:25 留言:0更新日期:2021-10-24 16:15
本申请提供识别项目异常的方法以及相关装置。本申请提供的技术方案中,获取第一目标项目的第一时间序列,第一时间序列中包括T1个时间点的数据,T1为正整数;使用马科夫转换自回归模型对第一时间序列进行拟合,以确定所述马科夫转换自回归模型中的参数的第一目标值;使用所述马科夫转换自回归模型,确定所述T1个时间点中的第一目标时间点的第一预测数据,其中,确定第一预测数据时,所述马科夫转换自回归模型中参数的值为第一目标值;基于第一预测数据和第一实际数据,对第一目标项目进行异常识别,第一实际数据包括所述第一时间序列中位于所述第一目标时间点的数据。本申请提供的技术方案,能够对项目进行异常识别。能够对项目进行异常识别。能够对项目进行异常识别。

【技术实现步骤摘要】
识别项目异常的方法和装置


[0001]本申请涉及信息处理领域,并且,更具体地,涉及异常识别方法和异常识别装置。

技术介绍

[0002]按照时间的先后顺序排列的数据称为时间序列数据。时间序列数据广泛存在于金融、交通、气象和财经等领域,与我们的生活息息相关。例如,从股票交易市场采集的交易流数据,网站监控指标数据等等,都可构成时间序列数据。
[0003]如何处理和分析这些形态各异的时间序列数据,并从中学习出一些有用的价值信息,已引起研究者的广泛关注。近年来许多学者在时间序列数据的挖掘方面做了很多工作,相关的研究主要集中在时间序列数据分割,时间序列数据的聚类和时间序列数据的分类,时间序列数据的模式发现等方向。
[0004]最初,在时间序列数据的挖掘中,大部分挖掘任务的目的是为了发现那些频繁出现的模式,期望发现某种规律,异常数据通常被作为噪声而忽略。然而,尽管异常数据是不经常发生的事件,但异常数据背后可能隐藏着一些重要信息,也就是说,异常数据的发现往往能提供更有价值的知识。例如,在金融领域,跟踪信用卡顾客的使用情况之后,当顾客在某段时期内本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种识别项目异常的方法,其特征在于,包括:获取第一目标项目的第一时间序列,所述第一时间序列中包括T1个时间点的数据,T1为正整数;使用马科夫转换自回归模型对所述第一时间序列进行拟合,以确定所述马科夫转换自回归模型中的参数的第一目标值;使用所述马科夫转换自回归模型,确定所述T1个时间点中的第一目标时间点的第一预测数据,其中,确定所述第一预测数据时,所述马科夫转换自回归模型中参数的值为所述第一目标值;基于所述第一预测数据和第一实际数据,对所述第一目标项目进行异常识别,所述第一实际数据包括所述第一时间序列中位于所述第一目标时间点的数据。2.根据权利要求1所述的方法,其特征在于,所述第一实际数据和所述第一预测数据均包括M个维度的数据,M为正整数;其中,所述基于所述第一预测数据和第一实际数据,对所述第一目标项目进行异常识别,包括:根据所述第一预测数据和所述第一实际数据,确定第一实际偏差率信息,所述第一实际偏差率信息用于表示M个第一实际偏差率的概率分布,所述M个第一实际偏差率中的第k个第一实际偏差率为所述第一实际数据中的第k维数据相对于所述第一预测数据中的第k维数据的偏差率,k为正整数且从1取至M;根据所述第一实际偏差率信息和第一基准偏差率信息,对所述第一目标项目进行异常识别,所述第一基准偏差率信息用于表示M个第一基准偏差率的概率分布,所述M个第一基准偏差率中的第k个第一基准偏差率为第一基准项目的时间序列中位于所述第一目标时间点的第k维数据相对于所述第一基准项目位于所述第一目标时间点的第k维预测数据的偏差率,所述第一基准项目与所述第一目标项目为类型相同的不同项目。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一实际偏差率信息和第一基准偏差率信息,对所述第一目标项目进行异常识别,包括:根据所述第一实际偏差率信息和所述第一基准偏差率信息,确定所述第一实际偏差率信息和所述第一基准偏差率信息之间的第一相对熵;根据所述第一相对熵,确定所述第一目标项目在所述第一目标时间点的第一异常风险分值;根据所述第一异常风险分值对所述第一目标项目进行异常识别。4.根据权利要求3所述的方法,其特征在于,所述第一目标项目为N个目标项目中的一个,所述第一异常风险分值为N个异常风险分值中的一个,所述N个异常风险分值与所述N个目标项目一一对应,所述N个异常分析分值中除所述第一异常风险分值以外的任意异常风险分值的获取方式与所述第一异常风险分值的获取方式相同,N为大于1的整数,所述N个目标项目的类型相同;其中,所述根据所述第一异常风险分值对所述第一目标项目进行异常识别,包括:所述第一异常风险分值大于所述N个异常风险分值中的S个异常风险分值时,确定所述第一目标项目存在异常,S为预设的正整数。5.根据权利要求4所述的方法,其特征在于,所述N个异常风险分值的第二异常风险值
为所述N个目标项目中的第二目标项目在第二目标时间点的异常风险分值,所述第二时间点与所述第一时间点为不同的时间点。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取所述第一基准项目的时间序列,所述第一基准项目的时间序列包括多个时间点的数据,所述多个时间点中每个时间点的数据包括M个维度的数据;使用所述马科夫转换回归模型对所述第一基准项目的时间序列进行拟合,以确定所述马科夫转换自回归模型的参数的第一基准值;使用所述马科夫转换自回归模型,确定所述第一基准项目的时间序列中每个时间点的M维预测数据,其中,确定所述每个时间点的M维预测数据时,所述马科夫转换自回归模型的参数的值为所述第一基准值;基于所述每个时间点的第k维预测数据和所述每个时间点的第k维实际基准数据,确定所述每个时间点的第k维实际基准数据的偏差率,所述每个时间点的第k维实际基准数据为所述第一基准项目的时间序列中位于所述每个时间点的第k维数据;基于所述每个时间点的M维实际基准数据的偏差率,确定所述每个时间点的基准偏差率信息,所述每个时间点的基准偏差率信息用于表示所述每个时间点的M维实际基准数据的偏差率的概率分布。7.一种识别项目异常的装置,其特征在于,包括:获取模块,用于:获取第一目标项目的第一时间序列,所述第一时间序列中包括T1个时间点的数据,T1为正整数;拟合模块,用于:使...

【专利技术属性】
技术研发人员:唐明鉴段戎
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1