时间序列异常预测和警报制造技术

技术编号:35283890 阅读:18 留言:0更新日期:2022-10-22 12:27
提供了一种系统和方法,其可以基于另一个时间序列信号中协同出现且在先的异常来识别时间序列信号中异常的因果关系。在一个示例中,该方法可以包括识别第一数据值的时间序列信号内的重复出现的异常;基于第二数据值的时间序列信号中在先且协同出现的异常来确定第二数据值的时间序列信号,该第二数据值的时间序列信号是第一数据值的时间序列信号中的重复出现的异常的原因;以及存储第二数据值的时间序列信号中在先且协同出现的异常与第一数据值的时间序列信号中的重复出现的异常之间的相关性。的相关性。的相关性。

【技术实现步骤摘要】
时间序列异常预测和警报


[0001]本专利技术涉及时间序列异常预测和警报。

技术介绍

[0002]时间序列(time

series)数据包含在连续持续时间(例如,每小时、每天、每周、每月、每年等)观察到的顺序数据点(例如,数据值)。例如,月降雨量、日股价、年销售收入等是时间序列数据的示例。预报是一种机器学习过程,其可以用来观察时间序列数据的历史值,并预测时间序列数据的未来值。预测的时间序列值可以被绘制为随时间变化的多个数据点,并显示在用户界面上,以供分析师或其他用户可视化并根据预测可能采取措施。
[0003]在时间序列数据中,异常(anomaly)(也被称为离群值(outlier))是其值与数据的正常模式的值显著不同的数据点(单个实例或几个实例)。异常的原因通常包括数据或数据周围条件的意外改变。例如,机器故障、温度意外上升、意外的天气事件等。但是,由于异常通常是意外的,因此很难确定“何时”可能出现异常。

技术实现思路

[0004]根据本专利技术的一个方面,提供一种计算系统,包括:硬件处理器,被配置为识别第一数据值的时间序列信号内的重复出现的异常,并且基于第二数据值的时间序列信号中在先且协同出现的异常来确定第二数据值的时间序列信号,所述第二数据值的时间序列信号是第一数据值的时间序列信号中的重复出现的异常的原因;以及存储器,被配置为存储第二数据值的时间序列信号中在先且协同出现的异常与第一数据值的时间序列信号中的重复出现的异常之间的相关性。
[0005]根据本专利技术的一个方面,提供一种方法,包括:识别第一数据值的时间序列信号内的重复出现的异常;基于第二数据值的时间序列信号中在先且协同出现的异常来确定第二数据值的时间序列信号,所述第二数据值的时间序列信号是第一数据值的时间序列信号中的重复出现的异常的原因;以及存储第二数据值的时间序列信号中在先且协同出现的异常与第一数据值的时间序列信号中的重复出现的异常之间的相关性。
[0006]根据本专利技术的一个方面,提供一种方法,包括:识别第一时间序列信号内的重复出现的离群值;基于第一时间序列信号中的重复出现的离群值在预定距离内跟随第二时间序列值中的重复出现的信号改变而出现的频率,确定第二时间序列信号中的重复信号改变和第一时间序列信号中的重复出现的离群值之间的相关性;以及存储第二时间序列信号中的重复出现的信号改变和第一时间序列信号中的重复出现的离群值之间的相关性。
附图说明
[0007]参考以下结合附图的详细描述,示例实施例的特征和优点以及实现这些特征和优点的方式将变得更加清楚。
[0008]图1是示出根据示例实施例的异常警报系统的架构的图。
[0009]图2是示出根据示例实施例的具有异常警报的预报的时间序列信号的输出的图。
[0010]图3A是示出根据示例实施例的多个时间序列信号的曲线图的图。
[0011]图3B是示出根据示例实施例的、其中多个时间序列信号的异常数据相互比较的数据结构的图。
[0012]图3C是示出根据示例实施例的确定时间序列信号是否是另一个时间序列信号中异常的原因的过程的图。
[0013]图4是示出根据示例实施例的识别时间序列信号之间异常关系的因果模型的图。
[0014]图5是示出根据示例实施例的确定时间序列信号是另一个时间序列信号中异常的原因的方法的图。
[0015]图6是示出根据示例实施例的在本文的示例中使用的计算系统的图。
[0016]在整个附图和详细描述中,除非另有说明,相同的附图标记将被理解为指代相同的元件、特征和结构。为了清楚、说明和/或方便,可以放大或调整这些元件的相对尺寸和对这些元件的描绘。
具体实施方式
[0017]在以下描述中,阐述了具体细节,以便提供对各种示例实施例的透彻理解。应当理解,对于本领域技术人员来说,对实施例的各种修改是显而易见的,并且在不脱离本公开的精神和范围的情况下,本文所定义的一般原理可以被应用于其他实施例和应用。此外,在以下描述中,出于解释的目的,阐述了多个细节。然而,本领域普通技术人员应该理解,可以在不使用这些具体细节的情况下实践实施例。在其他实例中,没有示出或描述公知的结构和过程,以免不必要的细节模糊描述。因此,本公开不旨在限于所示的实施例,而是符合与本文所公开的原理和特征一致的最宽范围。
[0018]时间序列预报模型是用于预测在相等的时间增量(例如,分钟、天、小时、周、年等)上记录的项目(例如,成本、数量、金额、强度等)的值的单个集合。这些模型可以支持商业应用中常见的数据属性,诸如趋势、季节性、波动、剩余和时间相关性。可以基于可用的历史数据来训练模型特征。然后,训练好的模型可以用于预报数据的未来值。时间序列预报模型的一些示例包括指数平滑(exponential smoothing,ETS)和自回归积分移动平均(autoregressive integrated moving average,ARIMA),仅举几例。
[0019]大多数时间序列预报模型都是单变量的,并且试图学习随时间动态变化的时间序列信号。为了训练模型,对训练数据(历史上测量的数据值)执行模型的一系列模拟(机器学习算法)。结果得到可以预测未来数据模式的正常输出的模型。训练数据中经常会遇到异常。异常是其值与时间序列信号的正常模式或趋势显著不同的不规律的数据点。异常可能是不可预测和意想不到的外部因素的结果。当在训练数据中遇到异常时,通常阻止这些不规律部分被用于训练模型,以防止模型被异常和意外的行为扭曲。
[0020]示例实施例针对一种新的系统,该系统能够确定未来何时可能出现异常,并在异常出现之前向屏幕、应用等输出警告。预测性系统充当针对异常的早期预警系统,使观察者/分析者能够在异常出现之前采取缓解措施,以防止异常或在异常出现时更好地处理异常。在示例实施例中,(多个)预测性模型可以用于识别其他时间序列信号中的事件的模式(pattern),该其他时间序列信号促成或以其他方式引起目标时间序列信号中的异常。举个
简单的示例,由于天气温暖,因此7月份冰淇淋的销售额通常会很高。当一年中的该时间的某个时间段(例如,3天或更多天)异常地冷时,可能会出现异常(销售额急剧下降)。因此,温度的时间序列信号中的异常可以与冰淇淋销售收入的时间序列信号中的异常具有因果关系。
[0021]本文所描述的预测性系统通过交叉检查在其他时间序列信号中协同出现(co

occurring)的异常(或其他事件)来识别目标时间序列信号的因果关系。例如,表示随时间变化的装运延迟的第一时间序列信号可以被确定为表示随时间变化的天然气价格的第二时间序列信号中异常的原因。在这个示例中,天然气价格中的异常(诸如价格的急剧上涨)可能是由装运延迟中协同出现且在先(preceding)的异常(例如,海上损失的时间等)引起的。也就是说,第二时间序列信号中的异常(至少部分地)是由第一时间序列信号中在先且协同出现的异常引起的。
[0022]本文所描本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算系统,包括:硬件处理器,被配置为识别第一数据值的时间序列信号内的重复出现的异常,并且基于第二数据值的时间序列信号中在先且协同出现的异常来确定第二数据值的时间序列信号,所述第二数据值的时间序列信号是第一数据值的时间序列信号中的重复出现的异常的原因;以及存储器,被配置为存储第二数据值的时间序列信号中在先且协同出现的异常与第一数据值的时间序列信号中的重复出现的异常之间的相关性。2.根据权利要求1所述的计算系统,其中,所述处理器还被配置为经由机器学习模型来确定包括第一数据值随时间的未来值的第一数据值的未来时间序列信号,并且经由所存储的相关性,基于在第二数据值的新的时间序列信号中检测到的在先且协同出现的事件,来检测第一数据值的未来信号中的未来异常。3.根据权利要求2所述的计算系统,其中,所述处理器还被配置为输出警告检测到未来异常的警报。4.根据权利要求1所述的计算系统,其中,所述处理器还被配置为将第一数据值的时间序列信号中的异常与第二数据值的时间序列信号中的异常进行配对,并将配对的异常的映射存储在存储器的数据结构中。5.根据权利要求4所述的计算系统,其中,所述处理器被配置为当所述配对的异常多于预定阈值时,确定第二数据值的时间序列信号是第一数据值的时间序列信号中的重复出现的异常的原因。6.根据权利要求4所述的计算系统,其中,所述处理器还被配置为对于异常的每次配对,识别第二数据值的时间序列信号中的相应异常和第一数据值的时间序列信号中的配对的异常之间的延迟,以生成多个所识别的延迟,并且将多个所识别的延迟与配对的异常的相应的映射相关联地存储在数据结构中。7.根据权利要求6所述的计算系统,其中,所述处理器还被配置为基于所识别的延迟来确定第二数据值的时间序列信号是第一数据值的时间序列信号中的重复出现的异常的原因。8.根据权利要求1所述的计算系统,其中,所述处理器还被配置为基于第三数据值的时间序列信号中不同的在先且协同出现的异常来确定第三数据值的时间序列信号,所述第三数据值的时间序列信号也是第一数据值的时间序列信号中的重复出现的异常的原因,并且所述存储器还被配置为存储第三数据值的时间序列信号中不同的在先且协同出现的异常与第一数据值的时间序列信号中的重复出现的异常之间的第二相关性。9.一种方法,包括:识别第一数据值的时间序列信号内的重复出现的异常;基于第二数据值的时间序列信号中在先且协同出现的异常来确定第二数据值的时间序列信号,所述第二数据值的时间序列信号是第一数据值的时间序列信号中的重复出现的异常的原因;以及存储第二数据值的时间序列信号中在先且协同出现的异常与第一数据值的时间序列信号中的重复出现的异常之间的相关性。10.根据权利要求9所述...

【专利技术属性】
技术研发人员:J多恩胡
申请(专利权)人:商业对象软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1