为多变量时序数据异常检测提供解释性制造技术

技术编号:37298676 阅读:19 留言:0更新日期:2023-04-21 22:45
本公开提供了用于为多变量时序数据异常检测提供解释性的方法、装置和计算机程序产品。多变量时序数据异常检测可以是通过多变量时序数据异常检测模型、针对由多个时序数据所形成的多变量时序数据来执行的。可以从多变量时序数据异常检测模型处获得至少指示了异常时段的异常检测结果。可以确定多个时序数据在异常时段内的异常时段相关性度量。可以确定多个时序数据在异常时段之前的回溯时段内的回溯时段相关性度量。可以基于异常时段相关性度量与回溯时段相关性度量之间的差异,从多个时序数据中识别在异常时段内具有异常相关性的至少一个时序数据对。可以提供针对异常检测结果的解释性内容,所述解释性内容至少指示所述至少一个时序数据对。至少一个时序数据对。至少一个时序数据对。

【技术实现步骤摘要】
为多变量时序数据异常检测提供解释性

技术介绍

[0001]异常检测可以发现时序(time series)数据中的异常的或不期望的事件。在本文中,时序数据指按时间顺序记录的数据序列,该数据序列中的数据点反映了特定现象、指标、事物等随时间变化的状态或程度。对于一个特定的观测实体或对象,可能同时获得多个时序数据。例如,对于观测实体“汽车”,可能获得分别对应于车速、发动机转速、油量等的多个时序数据。例如,对于观测实体“网站”,可能获得分别对应于网页点击率、下行数据传输速率、上行数据传输速率等的多个时序数据。来自同一观测实体的多个时序数据可以被视为关联于该观测实体的多个单变量时序数据,并且这些单变量时序数据可以形成一个多变量时序数据。与在单个的单变量时序数据的级别上执行异常检测相比,多变量时序数据异常检测可以直接使用多变量时序数据而在实体级别上执行异常检测,由此,异常检测结果将能够更准确地反映观测实体的整体状态。

技术实现思路

[0002]提供本
技术实现思路
以便介绍一组概念,这组概念将在以下的具体实施方式中做进一步描述。本
技术实现思路
并非旨在标识所保护主题的关键特征或必要特征,也不旨在用于限制所保护主题的范围。
[0003]本公开的实施例提出了用于为多变量时序数据异常检测提供解释性的方法、装置和计算机程序产品。所述多变量时序数据异常检测可以是通过多变量时序数据异常检测模型、针对由多个时序数据所形成的多变量时序数据来执行的。可以从所述多变量时序数据异常检测模型处获得至少指示了异常时段的异常检测结果。可以确定所述多个时序数据在所述异常时段内的异常时段相关性度量。可以确定所述多个时序数据在所述异常时段之前的回溯时段内的回溯时段相关性度量。可以基于所述异常时段相关性度量与所述回溯时段相关性度量之间的差异,从所述多个时序数据中识别在所述异常时段内具有异常相关性的至少一个时序数据对。可以提供针对所述异常检测结果的解释性内容,所述解释性内容至少指示所述至少一个时序数据对。
[0004]应当注意,以上一个或多个方面包括以下详细描述以及权利要求中具体指出的特征。下面的说明书及附图详细提出了所述一个或多个方面的某些说明性特征。这些特征仅仅指示可以实施各个方面的原理的多种方式,并且本公开旨在包括所有这些方面和其等同变换。
附图说明
[0005]以下将结合附图描述所公开的多个方面,这些附图被提供用以说明而非限制所公开的多个方面。
[0006]图1示出了示例性的多变量时序数据异常检测模型的架构。
[0007]图2至图4示出了根据实施例的为多变量时序数据异常检测提供解释性的示例性过程。
[0008]图5至图6示出了根据实施例的解释性内容的实例。
[0009]图7示出了根据实施例的用于为多变量时序数据异常检测提供解释性的示例性方法的流程图。
[0010]图8示出了根据实施例的用于为多变量时序数据异常检测提供解释性的示例性装置。
[0011]图9示出了根据实施例的用于为多变量时序数据异常检测提供解释性的示例性装置。
具体实施方式
[0012]现在将参考多种示例性实施方式来讨论本公开。应当理解,这些实施方式的讨论仅仅用于使得本领域技术人员能够更好地理解并从而实施本公开的实施例,而并非教导对本公开的范围的任何限制。
[0013]存在一些已有的多变量时序数据异常检测技术,例如,经由图注意力网络的多变量时序异常检测(MTAD

GAT:Multivariate Time

series Anomaly Detection via Graph Attention Network)。MTAD

GAT将每个单变量时序数据考虑作为单个特征,对不同特征之间的相关性进行建模,并同时对每个时序数据内的时间依存性进行建模。MTAD

GAT所采用的多变量时序数据异常检测模型包括两个并行的图注意力层,以动态地学习在不同时序数据之间以及在不同时间戳或时间点之间的关系。该多变量时序数据异常检测模型还包括联合优化的基于预测的模型和基于重构的模型,以通过单个时间戳预测和整个时序数据重构的组合来获得更好的时序数据表示。
[0014]本公开的实施例可以为多变量时序数据异常检测提供解释性(interpretability)。由例如MTAD

GAT所采用的多变量时序数据异常检测模型可以针对特定观测实体的多变量时序数据执行异常检测,并且在异常检测结果中至少指示在其中检测到了异常的异常时段。对于该多变量时序数据异常检测模型所输出的异常检测结果,本公开的实施例可以至少利用从该多变量时序数据异常检测模型处获得的多个时序数据之间的相关性(correlation)信息来提供多种解释性内容。所述解释性内容包括对异常检测结果的直观的和量化的分析,从而可以有效地帮助用户理解引起异常的根本原因、采取针对性措施以消除异常带来的影响、等等。示例性的,本公开的实施例所提供的解释性内容可以分为基于相关性的分析和基于值的分析。基于相关性的分析可以指解释性内容呈现与时序数据之间的相关性有关的分析。基于值的分析可以指解释性内容呈现与时序数据的值有关的分析。
[0015]在一个方面,本公开的实施例可以检测时序数据之间的相关性是否随时间发生了显著改变,并且可以在解释性内容中指示在异常时段内具有异常相关性的时序数据对,以作为基于相关性的分析。在一些实现方式中,本公开的实施例可以通过确定时序数据对的异常时段相关性度量和回溯(trace

back)时段相关性度量之间的差异,来识别在异常时段内具有异常相关性的时序数据对。所述解释性内容可以显式地呈现哪些时序数据之间的相关性改变与所检测到的异常有关。
[0016]在一个方面,对于所识别的在异常时段内具有异常相关性的特定时序数据对,解释性内容可以进而指示该时序数据对的异常时段平均相关性度量与回溯时段平均相关性
度量之间的差异,以作为基于相关性的分析。从而,所述解释性内容可以有效地提供时序数据对的相关性改变的量化信息。
[0017]在一个方面,本公开的实施例可以至少利用时序数据之间的相关性来提供每个时序数据在每个时间点处的异常贡献分数,并且可以在解释性内容中指示时序数据在不同时间点处的异常贡献分数,以作为基于值的分析。一个时序数据在一个时间点处的异常贡献分数可以表明在该时间点处、该时序数据对于异常的贡献度,异常贡献分数越高则对异常的贡献度越大。从而,所述解释性内容可以帮助用户理解特定时序数据在不同时间点处与异常的关联程度。
[0018]在一个方面,本公开的实施例可以至少利用一个时序数据在不同时间点处的异常贡献分数来动态地确定该时序数据的正常边界,并且可以在解释性内容中指示该时序数据的正常边界,以作为基于值的分析。从而,所述解释性内容可以帮助用户容易地找到该时序数据在哪些时间点处的实际数据值超出了正常范围。
[0019]根据本公开的实施例,从多变量时序数据异常检测模型处获得的时序数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于为多变量时序数据异常检测提供解释性的方法,所述多变量时序数据异常检测是通过多变量时序数据异常检测模型、针对由多个时序数据所形成的多变量时序数据来执行的,所述方法包括:从所述多变量时序数据异常检测模型处获得至少指示了异常时段的异常检测结果;确定所述多个时序数据在所述异常时段内的异常时段相关性度量;确定所述多个时序数据在所述异常时段之前的回溯时段内的回溯时段相关性度量;基于所述异常时段相关性度量与所述回溯时段相关性度量之间的差异,从所述多个时序数据中识别在所述异常时段内具有异常相关性的至少一个时序数据对;以及提供针对所述异常检测结果的解释性内容,所述解释性内容至少指示所述至少一个时序数据对。2.如权利要求1所述的方法,其中,所述确定异常时段相关性度量包括:计算每个时序数据对在所述异常时段内的异常时段平均相关性度量。3.如权利要求2所述的方法,其中,所述计算异常时段平均相关性度量包括:从所述多变量时序数据异常检测模型中的面向特征的图注意力层处,获得所述时序数据对在所述异常时段所包含的至少一个时间点处的至少一个相关性注意力分数;以及利用所述至少一个相关性注意力分数,计算所述时序数据对在所述异常时段内的平均相关性注意力分数。4.如权利要求2所述的方法,其中,所述确定回溯时段相关性度量包括:计算每个时序数据对在所述回溯时段内的回溯时段平均相关性度量。5.如权利要求4所述的方法,其中,所述计算回溯时段平均相关性度量包括:从所述多变量时序数据异常检测模型中的面向特征的图注意力层处,获得所述时序数据对在所述回溯时段所包含的至少一个时间点处的至少一个相关性注意力分数;以及利用所述至少一个相关性注意力分数,计算所述时序数据对在所述回溯时段内的平均相关性注意力分数。6.如权利要求5所述的方法,其中,所述至少一个时间点是未检测到异常的时间点。7.如权利要求4所述的方法,其中,所述至少一个时序数据对的异常时段平均相关性度量与回溯时段平均相关性度量之间的差异大于相关性差异阈值。8.如权利要求7所述的方法,其中,所述解释性内容还指示所述差异。9.如权利要求1所述的方法,还包括,对于每个时序数据:从所述多变量时序数据异常检测模型中的预测模型处,获得所述时序数据在每个时间点处的预测值,所述预测值是由所述预测模型至少基于所述多个时序数据之间的相关性来生成的;以及至少利用所述时序数据在每个时间点处的预测值和数据值,计算所述时序数据在所述时间点处的异常贡献分数。10.如权利要求9所述的方法,其中,所述解释性内容还指示所述时序数据在多个时间点处的多个异常贡献分数。
11.如权利要求9所述的方法,还包括,对于每个时间点:基于所述时序数据在所述时间点之前的预测滑动窗口内的至少一个异常贡献分数,计算对应于所述时间点的异常贡献分数阈值;基于所述异常贡献分数阈值,计算对应于所述时间点的余量;以及基于所述时序数据在所述时间点处的预测值和对应于所述时间点的所述余量,计算所述时序数据在所述时间点处的正常上边界值和正常下边界值。12.如权利要求11所述的方法,其中,所述解释性内容还指示所述时序数据在多个时间点处的多个正常上边界值和多个正常下边界值。13.如权利要求...

【专利技术属性】
技术研发人员:黄丛蕊赵航端隽永朱霞赵明王春雷汪瑜婧许必雄秦莉娟童杰张祺
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1