方差变点检测方法和系统及计算机可读存储介质技术方案

技术编号:30344879 阅读:40 留言:0更新日期:2021-10-12 23:29
本公开提供一种方差变点检测方法和系统及计算机可读存储介质。本公开提供了基于统计平稳性的基线假设来检测目标时间序列的方差变点。目标时间序列信号被建模为包括趋势分量信号和残余分量信号。针对目标信号,优化至少包括差罚函数和至少一个正则化项的信号代价函数,以输出该目标信号的趋势分量信号。针对残余分量信号,优化至少包括差罚函数和至少一个正则化项的信号代价函数,以输出该残余分量信号的估计方差。可以通过应用增广拉格朗日算子来优化这两个代价函数。基于估计方差的累计和来计算中心化的累积和。对中心化的累积和进行分段,以产生该中心化的累积和的方差变点。相比于现有方法,这样的方法可以提供改善的性能。能。能。

【技术实现步骤摘要】
方差变点检测方法和系统及计算机可读存储介质


[0001]本公开涉及一种方差变点检测方法和系统,以及一种计算机可读存储介质。

技术介绍

[0002]变点检测是时间序列数据统计分析的一个方面。可以在时间上观察与事件、现象、测量等有关的时间序列数据。从时间序列数据中观察到的变量的值可以在时间上变化;然而,这种变化可以指示在时间上的趋势变化,或者可以仅指示异常值。本领域技术人员已知的各种概率分布描述了时间序列数据中的变量值预期(expect)如何随着时间的流逝而分布。通过观察这些概率分布的变化,可以更容易地识别时间序列数据中的变点。
[0003]在变点检测的方法中,也可以在时间上计算和观察统计置信度的度量(诸如标准偏差)。方差变点检测是一种变点检测方法,其中,在时间上观察基于标准偏差计算的方差。这样的方法试图观察方差(统计置信度的度量)在时间上的变化作为在时间上观察到发生趋势变点的指示。给定具有随机值(预期该随机值将沿着特定概率分布(这种分布通常称为“先验”)下降)的时间序列数据的趋势,可以通过建立的统计分析方法,基于概率分布来根据标准偏差计算变量在时间上的方差。例如,先验可以是高斯分布(“高斯先验”)。
[0004]越来越多地从生成大量数据的上下文(诸如分布式计算、云计算、机器学习、数据中心、金融系统、电子商务交易等)中观察到时间序列数据及其趋势。此外,时间序列数据及其趋势可能是时间敏感的,这意味着对时间敏感趋势的统计分析可能需要足够快才能迅速生成动作或可采取行动的输出。因此,需要提供改善的变点检测,使得在时间上出现变点时可以迅速地对该变点进行检测,从而能够针对变点采取迅速的动作和响应。

技术实现思路

[0005]本公开提供一种方差变点检测方法,所述方差变点检测方法包括以下步骤:针对时间序列的目标信号的残余分量信号,优化方差过滤信号代价函数,以输出所述残余分量信号的估计方差;计算所述残余分量信号的所述估计方差在时间上的集中(center)累计和;以及对所述中心化的累积和进行分段,以产生所述目标信号的一个或更多个方差变点。
[0006]本公开还提供一种方差变点检测系统,所述方差变点检测系统包括:一个或更多个处理器;以及储存器(memory),所述储存器以通信的方式联接至所述一个或更多个处理器,所述储存器存储能够由所述一个或更多个处理器执行的计算机可执行模块,在由所述一个或更多个处理器执行时,所述计算机可执行模块执行关联操作,所述计算机可执行模块包括:方差过滤模块,所述方差过滤模块进一步包括方差过滤代价函数优化模块,所述方差过滤代价函数优化模块被配置为针对时间序列的目标信号的残余分量信号,优化方差过滤信号代价函数,以输出所述残余分量信号的估计方差;以及变点定位模块,所述变点定位模块进一步包括:中心化的累积和计算子模块,所述中心化的累积和计算子模块被配置为计算所述残余分量信号的所述估计方差在时间上的中心化的累积和;以及分段子模块,所述分段子模块被配置为对所述中心化的累积和进行分段,以产生所述目标信号的一个或更
多个方差变点。
[0007]本公开还提供一种计算机可读存储介质,所述计算机可读存储介质存储有能够由一个或更多个处理器执行的计算机可读指令,在由所述一个或更多个处理器执行时,所述计算机可读指令使所述一个或更多个处理器执行操作,所述操作包括:针对时间序列的目标信号的残余分量信号,优化方差过滤信号代价函数,以输出所述残余分量信号的估计方差;计算所述残余分量信号的所述估计方差在时间上的中心化的累积和;以及对所述中心化的累积和进行分段,以产生所述目标信号的一个或更多个方差变点。
附图说明
[0008]参照附图阐述详细描述。在附图中,附图标记的最左边的数字标识该附图标记首次出现的附图。在不同附图中使用相同的附图标记表示相似或相同的项或特征。
[0009]图1例示了根据本公开的示例实施方式的方差变点检测方法的流程图。
[0010]图2例示了根据本公开的示例实施方式的趋势分量去除子方法的流程图。
[0011]图3例示了根据本公开的示例实施方式的方差过滤子方法的流程图。
[0012]图4例示了根据本公开的示例实施方式的变点定位子方法的流程图。
[0013]图5A和图5B例示了根据本公开的示例实施方式的被配置为计算方差变点检测的系统的系统架构。
[0014]图6例示了根据本公开的示例实施方式的用于计算资源和时间序列趋势模型的服务器主机和计算主机的架构图。
[0015]图7例示了用于实现本文所述的用于实现方差变点检测的处理和方法的示例计算系统。
[0016]图8A至图8D例示了利用随机生成的噪音、多个随机生成的异常以及表现出非平稳性的趋势生成的合成时间序列数据集的示例。
具体实施方式
[0017]本文讨论的系统和方法涉及实现时间序列趋势模型,并且更具体地,涉及实现时间序列模型的数据清理和数据的稀疏正则化(regularization),以及用于时间序列模型的方差变点检测算法。
[0018]根据本公开的示例实施方式,时间序列趋势模型可以包括与变量值的观察相适应的一组方程式,诸如例如是回归模型。可以基于目标时间序列中的所观察的数据在时间上的趋势来计算时间序列趋势模型的方程式,将时间作为自变量(随后将目标时间序列在时间上的值称为“目标信号”)。将目标信号建模为一组方程式可以假设前提是可以将目标信号建模为至少两个分量时间序列(趋势分量时间序列和残余(residual)分量时间序列)的和。趋势分量时间序列和残余分量时间序列中的每一者可以是与目标时间序列相同长度的时间序列。趋势分量时间序列和残余分量时间序列中的每一者可以分别进一步建模为一个或更多个方程式。
[0019]例如,回归模型可以是线性模型,其中,基于变量值将沿着高斯分布(“高斯先验”)下降的预期,将变量建模为时间的线性函数。另选地,回归模型可以例如是非线性模型(诸如对数模型、指数模型等,但不限于此)。可以基于目标时间序列的变量的先验来选择回归
模型,所述先验不应限于高斯先验并且可以包括例如二项式分布、伯努利(Bernoulli)分布、拉普拉斯(Laplacian)分布等,因此,回归模型可以例如是基于给定先验的广义线性模型。
[0020]例如,根据本公开的示例实施方式,目标信号y可以包括在一系列N个时间段{0,1,...,N

1}上观察到的值,其中持续时间基本上相等的任何时间段在本文中通常可以称为“时段”。因此,这些值可以写成y=[y0,y1,...,y
N
‑1]T
。因此,可以将目标信号y建模为时间t的函数,其中t是任意时段。
[0021]根据本公开的示例实施方式,目标信号y可以被建模为另外的分量时间序列的函数,各个另外的分量时间序列被建模为时间t的函数。建模函数可以例如是分量时间序列上的和或加权和函数。像目标信号一样,分量时间序列可以包括在一系列N个时间段上观察到的值。
[0022]分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方差变点检测方法,所述方差变点检测方法包括以下步骤:针对时间序列的目标信号的残余分量信号,优化方差过滤信号代价函数,以输出所述残余分量信号的估计方差;计算所述残余分量信号的所述估计方差在时间上的中心化的累积和;以及对所述中心化的累积和进行分段,以产生所述目标信号的一个或更多个方差变点。2.根据权利要求1所述的方差变点检测方法,所述方差变点检测方法进一步包括以下步骤:针对所述目标信号,优化趋势去除信号代价函数,以输出所述目标信号的趋势分量信号;其中,所述残余分量信号是通过从所述目标信号减去所述趋势分量信号的差获得的。3.根据权利要求2所述的方差变点检测方法,其中,所述残余分量信号是通过进一步对从所述目标信号减去所述趋势分量信号的所述差进行平方来获得的。4.根据权利要求2所述的方差变点检测方法,其中,所述趋势去除信号代价函数和所述方差过滤信号代价函数中的每一个分别至少包括差罚函数和至少一个正则化项。5.根据权利要求4所述的方差变点检测方法,其中,各自的差罚函数包括Huber损失函数。6.根据权利要求4所述的方差变点检测方法,其中,各自的至少一个正则化项包括稀疏正则化项。7.根据权利要求2所述的方差变点检测方法,其中,优化趋势去除信号代价函数的步骤和优化方差过滤信号代价函数的步骤中分别包括优化增广拉格朗日算子。8.一种方差变点检测系统,所述方差变点检测系统包括:一个或更多个处理器;以及储存器,所述储存器以通信的方式联接至所述一个或更多个处理器,所述储存器存储能够由所述一个或更多个处理器执行的计算机可执行模块,在由所述一个或更多个处理器执行时,所述计算机可执行模块执行关联操作,所述计算机可执行模块包括:方差过滤模块,所述方差过滤模块进一步包括方差过滤代价函数优化模块,所述方差过滤代价函数优化模块被配置为针对时间序列的目标信号的残余分量信号,优化方差过滤信号代价函数,以输出所述残余分量信号的估计方差;以及变点定位模块,所述变点定位模块进一步包括:中心化的累积和计算子模块,所述中心化的累积和计算子模块被配置为计算所述残余分量信号的所述估计方差在时间上的中心化的累积和;以及分段子模块,所述分段子模块被配置为对所述中心化的累积和进行分段,以产生所述目标信号的一个或更多个方差变点。9.根据权利要求8所述的方差变点检测系统,所述方差变点检测系统进一步包括趋势分量去除模块,所述趋势分量去除模块进一步包括:趋势去除代价函数优化子模块,所述趋势去除代价函数优化...

【专利技术属性】
技术研发人员:文青松孙亮许欢
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1