一种时间序列相关性检测方法、设备及存储介质技术

技术编号:26170950 阅读:29 留言:0更新日期:2020-10-31 13:40
本公开提供了一种时间序列相关性检测方法、设备及存储介质,该方法使用滑动窗口对两个时间序列进行滑动平均处理,得到两个平滑时间序列,然后针对两个平滑时间序列分别循环迭代执行交错平移相关性计算处理步骤,然后将交错平移相关性计算处理步骤计算得到的交错相关系数中的最大值确定为两个时间序列相关系数,从而确定两个序列的相关性。本公开使用滑动窗口方法配合交错平移相关性计算处理步骤中获得的最大交错相关系数,能够检测出具有错峰关联的时间序列间的关联性。使用滑动平均的方法大幅减少时间序列的噪声对交叉最大互信息系数造成的影响。

【技术实现步骤摘要】
一种时间序列相关性检测方法、设备及存储介质
本公开涉及通信领域,尤其涉及一种时间序列相关性检测方法、设备及存储介质。
技术介绍
时间序列(timeseries)是一组按照时间发生先后顺序进行排列的数据点序列。时间序列广泛应用于信号处理、模式识别、天气预报、地震预测、脑电图、控制工程、航空学、通信工程以及绝大多数涉及到时间数据测量的应用科学与工程学。在网络智能运维系统中,常见的指标,比如设备CPU使用率,设备温度,接入控制(AccessControl,AC)节点上的上下行数据流量、设备丢包率等等随时间先后顺序排列的指标数据都属于时间序列,对时间序列建立分析模型进行分析可以掌握这些指标的变化规律,以实现对指标的未来变化趋势进行预测的目的;时间序列关联分析,就是分析时间序列间的相似程度,关联性越强,说明两个时间序列相似程度越高;在智能运维中,假设A,B两个网络或设备指标关联性强,如果A指标在某一时刻出现了异常,那么B指标就有很大可能也出现异常,通过两个指标间的关联性就可以提前“预知”可能的异常,及时进行处理。在根因分析中,关联分析也可以帮助定位可能的因果关系。计算两个时间序列之间的相关系数并判断这两条时间序列是否存在强关联性的步骤通常包括:S1、获得两个原始时间序列X,Y。S2、截取t至t+a时刻的时间序列x,y,目的是为了统一时间序列长度。S3、计算x,y之间的最大互信息,计算方式为先对两个时间序列x,y作散点图,然后对散点图作i行j列的网格化,使散点落在不同的网格内;预设指定的i,j值后,可能有多种网格化方案,分别计算这些网格化方案的互信息值,并取最大值作为最大互信息。实际过程中可以调用python的minepy包进行运算。S4、根据MIC(MaximalInformationCoefficient,最大互信息系数)的值判断原始时间序列是否相关。一般认为,若MIC大于等于0.8,则说明这两个时间序列强相关,若MIC大于等于0.5小于0.8,则两个时间序列弱相关,若MIC小于0.5,则两个时间序列不相关。实际场景下,原始时间序列里具有大量的噪声,不进行处理的话,会很难发现噪声下隐藏的规律,会导致MIC的值偏低,影响对相关性的判断。假设两个完全相关的时间序列y和z,z是由时间序列y乘3倍再加上一个标准正态随机噪声得到,但y与z的MIC值可能为0.769,只能确认y与z存在弱相关,如果排除这个随机噪声,y与z的MIC值为变为1。实际场景中,时间序列的相关性可能出现滞后现象,即可能出现时间序列X的t至t+a时刻部分与时间序列Y的t至t+a时刻部分不相关/弱相关,但是和Y的t+b至t+b+a时刻部分却是强相关,现有的检测方法不能很准确地检测出此类时间序列的相关性。
技术实现思路
有鉴于此,为了提高时间序列的检测准确度,基于本公开实施例的一方面,提供了一种时间序列相关性检测方法,所述方法包括:步骤A.使用滑动窗口分别对第一时间序列和第二时间序列进行滑动平均处理,得到第一平滑时间序列和第二平滑时间序列;步骤B.将第一平滑时间序列和第二平滑时间序列作为第一初始时间序列和第二初始时间序列,对第一初始时间序列和第二初始时间序列执行交错平移相关性计算处理步骤;所述交错平移相关性计算处理步骤包括:步骤a.计算并记录第一初始时间序列和第二初始时间序列的交错相关系数;步骤b.以预设步长将第一初始时间序列和第二初始时间序列反方向平移,剔除两个序列非相交位置上的序列元素后分别形成第一中间时间序列和第二中间时间序列;步骤c.判断所述第一中间时间序列或第二中间时间序列的序列元素个数是否小于第一平滑时间序列的序列元素个数的一半;若是,则结束所述交错平移相关性计算处理步骤,然后执行步骤C;若否,则将第一中间时间序列和第二中间时间序列分别再次作为第一初始时间序列和第二初始时间序列,然后执行步骤a;步骤C.将交错平移相关性计算处理步骤计算得到的交错相关系数中的最大值确定为所述第一时间序列和第二时间序列的相关系数。进一步地,所述交错平移相关性计算处理步骤中,计算并记录第一初始时间序列和第二初始时间序列的最大互信息系数MIC作为所述交错相关系数。进一步地,所述使用滑动窗口分别对第一时间序列和第二时间序列进行滑动平均处理,从而得到第一平滑时间序列和第二平滑时间序列的步骤为:用采样时刻t之前位于滑动窗口内的时间序列元素的平均值,即(t-h,t]时间范围内的平均值作为经滑动平均处理后的平滑时间序列的t时刻的元素值。进一步地,为滑动窗口内的每一个序列元素赋予不同的权重,离目标t时刻越近的序列元素的权重越大,基于加权平均的方式计算平滑时间序列中t时刻的元素值。进一步地,所述交错平移相关性计算处理步骤中,计算并记录第一初始时间序列和第二初始时间序列的皮尔逊相关系数作为所述交错相关系数。基于本公开实施例,本公开还提供了一种时间序列相关性检测设备,该设备包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述处理器执行所述计算机可读存储介质中的计算机程序以实施前述时间序列相关性检测方法的步骤。基于本公开实施例,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序当被处理器执行时实现前述时间序列相关性检测方法的步骤。由以上技术方案可见,本公开实施例中,使用滑动窗口方法配合交错平移相关性计算处理步骤中获得的最大交错相关系数,能够检测出具有错峰关联的时间序列间的关联性。使用滑动平均的方法大幅减少时间序列的噪声对交叉最大互信息系数造成的影响。附图说明为了更加清楚地说明本公开实施例或者现有技术中的技术方案,下面将对本公开实施例或者现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据本公开实施例的这些附图获得其他的附图。图1为本公开提供的时间序列相关性检测方法步骤流程图;图2A-图2B为本公开一实施例提供的使用滑动窗口对时间序列进行平滑平均处理的效果示意图;图3A-图3D为本公开一实施例提供的使用交错平移相关性计算处理步骤发现时间序列间错峰关联的效果示意图;图4为本公开提供的时间序列相关性检测设备的结构示意图。具体实施方式在本公开实施例使用的术语仅仅是出于描述特定实施例的目的,而非限制本公开实施例。本公开实施例和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其它含义。本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本公开实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开实施例范围的情况下本文档来自技高网
...

【技术保护点】
1.一种时间序列相关性检测方法,其特征在于,所述方法包括:/n步骤A.使用滑动窗口分别对第一时间序列和第二时间序列进行滑动平均处理,得到第一平滑时间序列和第二平滑时间序列;/n步骤B.将第一平滑时间序列和第二平滑时间序列作为第一初始时间序列和第二初始时间序列,对第一初始时间序列和第二初始时间序列执行交错平移相关性计算处理步骤;/n所述交错平移相关性计算处理步骤包括:/n步骤a.计算并记录第一初始时间序列和第二初始时间序列的交错相关系数;/n步骤b.以预设步长将第一初始时间序列和第二初始时间序列反方向平移,剔除两个序列非相交位置上的序列元素后分别形成第一中间时间序列和第二中间时间序列;/n步骤c.判断所述第一中间时间序列或第二中间时间序列的序列元素个数是否小于第一平滑时间序列的序列元素个数的一半;若是,则结束所述交错平移相关性计算处理步骤,然后执行步骤C;若否,则将第一中间时间序列和第二中间时间序列分别再次作为第一初始时间序列和第二初始时间序列,然后执行步骤a;/n步骤C.将交错平移相关性计算处理步骤计算得到的交错相关系数中的最大值确定为所述第一时间序列和第二时间序列的相关系数。/n

【技术特征摘要】
1.一种时间序列相关性检测方法,其特征在于,所述方法包括:
步骤A.使用滑动窗口分别对第一时间序列和第二时间序列进行滑动平均处理,得到第一平滑时间序列和第二平滑时间序列;
步骤B.将第一平滑时间序列和第二平滑时间序列作为第一初始时间序列和第二初始时间序列,对第一初始时间序列和第二初始时间序列执行交错平移相关性计算处理步骤;
所述交错平移相关性计算处理步骤包括:
步骤a.计算并记录第一初始时间序列和第二初始时间序列的交错相关系数;
步骤b.以预设步长将第一初始时间序列和第二初始时间序列反方向平移,剔除两个序列非相交位置上的序列元素后分别形成第一中间时间序列和第二中间时间序列;
步骤c.判断所述第一中间时间序列或第二中间时间序列的序列元素个数是否小于第一平滑时间序列的序列元素个数的一半;若是,则结束所述交错平移相关性计算处理步骤,然后执行步骤C;若否,则将第一中间时间序列和第二中间时间序列分别再次作为第一初始时间序列和第二初始时间序列,然后执行步骤a;
步骤C.将交错平移相关性计算处理步骤计算得到的交错相关系数中的最大值确定为所述第一时间序列和第二时间序列的相关系数。


2.根据权利要求1所述的方法,其特征在于,所述交错平移相关性计算处理步骤中,计算并记录第一初始时间序列和第二初始时间序列的...

【专利技术属性】
技术研发人员:谢江轩
申请(专利权)人:新华三技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1