一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法技术

技术编号:38152644 阅读:9 留言:0更新日期:2023-07-13 09:18
本申请涉及一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法,包括对数据中心时间序列进行在线分割;分别计算设备性能时间子序列的标准差以及关联积分函数统计量;计算最优的嵌入滞时和嵌入维数;计算第i台交换机重构后三种性能序列的相空间;在重构多维性能序列对应的相空间中采用时滞法进行时间尺度上的演化;以每种性能时间序列分割后的子序列的最大Lyapunov系数作为描述不同时间演化规律的局部时域特征;计算三维性能最大Lyapunov系数空间坐标之间的距离;输出聚类集合。本申请有助于分析数据中心同质网络设备群内各器件在时间尺度上的运行状态相似性,进而为数据中心实时业务自由调度、潜在故障预测、突发故障溯源等业务的实现奠定基础。突发故障溯源等业务的实现奠定基础。突发故障溯源等业务的实现奠定基础。

【技术实现步骤摘要】
一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法


[0001]本申请涉及数据挖掘领域,具体涉及一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法。

技术介绍

[0002]随着新型电力系统向高度数字化、智能化、智慧化的深入推进,亟需一个更加高效、智能的数据中心网络设备管理系统,以此来实现精准实时的信息交互监测的和高度自由的业务调度。面向电力信息系统监控的海量性能数据,需要及时发现系统中可能存在的非线性变换,即突发性的、大幅偏离预期值的无序状态变化,因此我们期望设计一种基于时间演化特征的聚类方式,以此来发现不同时间尺度上同质设备多维性能状态序列的潜在相似性,从而为系统调度、维护、管理等提供智能化的决策方案,为数据中心实时业务自由调度、潜在故障预测、突发故障溯源等业务的实现奠定基础。
[0003]考虑到传统的聚类算法不适应于多维度的时变状态序列,并且现在大部分对于多变量时间序列的聚类方法仍旧停留在对于序列本身形状特征、结构特征等呈现一定规律的、可预测的特征来进行建模,忽略了可能存在的时域混沌现象,即整个网络系统可能存在突发性的、非线性的、大幅偏移预测结果的无序现象。

技术实现思路

[0004]本申请实施例的目的在于提供一种基于局部时域特征的设备级多维运行状态序列的时间关联聚类方法,有效规避了突发值可能会对聚类结果产生较大影响这一弊端,有助于时间维度设备运行规律的挖掘。
[0005]为实现上述目的,本申请提供如下技术方案:
[0006]本申请实施例提供一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法,包括以下具体步骤:
[0007]步骤1:对数据中心同一机房内的所有三层交换机的CPU利用率、内存利用率、Ping时延的时间序列进行在线分割,分割方法按照最大似然方法对相邻时间间隔上的序列进行分割合并,使得分割后的相邻时间上的子序列相似度较低;
[0008]步骤2:分别计算第i台设备性能时间子序列的标准差步骤2:分别计算第i台设备性能时间子序列的标准差以及关联积分函数统计量S
cor
(t);
[0009]步骤3:根据关联积分函数法计算最优的嵌入滞时τ
i
和嵌入维数m=(m1,m2,m3);
[0010]步骤4:根据嵌入滞时和嵌入维数,计算第i台交换机重构后三种性能序列的相空间
[0011]步骤5:在重构多维性能序列对应的相空间中采用时滞法进行时间尺度上的演化,
通过不断计算演化后数据点与其邻近点间距离k表示滞后了k={k1,k2,k3}个时间单元,表示对于第i台三层交换机取同一时间段内的CPU利用率曲线进行分割后的第t个子段的第i1个嵌入维数;
[0012]步骤6:对于每个k1,k2,k3,计算所有关于的均值y(k1),y(k2),y(k3);并且对y(k1),y(k2),y(k3)进行最小二乘回归,求出其斜率即为第p子段的最大Lyapunov系数;完成了对所有三层交换机,在一段时间内的CPU利用率、内存利用率、Ping时延三种性能维数的时间演化特征提取,以每种性能时间序列分割后的子序列的最大Lyapunov系数作为描述不同时间演化规律的局部时域特征;
[0013]步骤7:计算任意两台三层交换机之间的三维性能最大Lyapunov系数空间坐标之间的距离;以此作为同质设备间的关联系数。
[0014]步骤8:采用手肘法确定最优的簇数K,而后依据KMedoids算法的聚类原理,对步骤7中所提到的关联系数进行聚类,选取中位数作为簇中心,依据最小准则函数来确定簇中心的更新与否,直至停止迭代,输出聚类集合。
[0015]所述步骤1中的实时分割算法步骤如下:为多元时间序列数据建立似然函数模型,将每一时间段内数据的经验均值和经验协方差代入似然函数模型,使得似然函数只与分割点的位置有关;使用模拟退火算法迭代求解当前最优分割点的位置使得似然函数最大;计算相邻两段数据的差距,若满足合并条件,则将两段数据合并,并根据现存分段数计算分割点数,若两个差值不满足均小于设定阈值的条件,则继续往下运行;合并条件为均值和协方差的差值均小于预先设定的阈值:
[0016][0017]其中||μ
(i)

μ
(i+1)
||2为相邻两段数据的均值向量差值的二范数,||∑
(i)


(i+1)
||
F
为相邻两段数据的协方差矩阵差值的F范数,μ
thre
为均值向量差值阈值,∑
thre
为协方差矩阵差值阈值,通过所述两项指标与设定阈值的比较衡量时间相邻两段数据的相似程度。
[0018]步骤3应用了关联积分法计算嵌入滞时τ
i
和嵌入维数m=(m1,m2,m3),并且应用这两个参数对多维性能指标进行相空间的重构,令此时对应的最小的t即为嵌入滞时τ
i
;令求出此时极小值对应的t即为滞时窗宽τ
W
;根据下式计算嵌入维数m=(m1,m2,m3):
[0019][0020]式中的int为取整函数。
[0021]步骤4对多维性能指标进行相空间的重构,过程如下:设第i台三层交换机混沌的三维性能时间序列分别为三维性能时间序列分别为,MUseg(t
mu
,i)={MUseg(t1,i),MUseg(t2,i),...MUseg(t
seg_num
,i)},Delayseg(t
delay
,i)={Delayseg(t1,i),Delayseg(t2,i),...{Delayseg(t
seg_num
,i)},以CPU利用率时变序列为例,设其对应的嵌入滞时为τ1,嵌入维数为m1,则对应的第p个CPU利用率时变子序列的重构相空间如下表示:
[0022][0023]其余的内存利用率、Ping时延时变状态序列也按照上述的方式重构相空间为CPUset(t
reset_cpu
,i),MUseg(t
rest_mu
,i),Delayseg(t
reset_delay
,i)。
[0024]步骤7中通过下式计算任意两台三层交换机不同子段之间的三维性能最大Lyapunov系数空间坐标之间的距离;以此作为同质设备间的关联系数,
[0025][0026]式中i
k
表示第i个设备的第k个子段,j
l
表示第j个设备的第l个子段,代表CPU利用率第i个设备的第k个子段的最大Lyapunov系数,代表内存利用率第i个设备的第k个子段的最大Lyapunov系数,代表Ping时延第i个设备的第k个子段的最大Lyapunov系数,以此来作为该子段的时变演化特征。
[0027]与现有技术相比,本专利技术的有益效果是:
[0028]通过建立似然函数模型,并且利用数据的经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法,其特征在于,包括以下具体步骤:步骤1:对数据中心同一机房内的所有三层交换机的CPU利用率、内存利用率、Ping时延的时间序列进行在线分割,分割方法按照最大似然方法对相邻时间间隔上的序列进行分割合并,使得分割后的相邻时间上的子序列相似度较低;步骤2:分别计算第i台设备性能时间子序列的标准差以及关联积分函数统计量步骤3:根据关联积分函数法计算最优的嵌入滞时τ
i
和嵌入维数m=(m1,m2,m3);步骤4:根据嵌入滞时和嵌入维数,计算第i台交换机重构后三种性能序列的相空间步骤5:在重构多维性能序列对应的相空间中采用时滞法进行时间尺度上的演化,通过不断计算演化后数据点与其邻近点间距离不断计算演化后数据点与其邻近点间距离k表示滞后了k={k1,k2,k3}个时间单元,表示对于第i台三层交换机取同一时间段内的CPU利用率曲线进行分割后的第t个子段的第i1个嵌入维数;步骤6:对于每个k1,k2,k3,计算所有关于的均值y(k1),y(k2),y(k3);并且对y(k1),y(k2),y(k3)进行最小二乘回归,求出其斜率即为第p子段的最大Lyapunov系数;完成了对所有三层交换机,在一段时间内的CPU利用率、内存利用率、Ping时延三种性能维数的时间演化特征提取,以每种性能时间序列分割后的子序列的最大Lyapunov系数作为描述不同时间演化规律的局部时域特征;步骤7:计算任意两台三层交换机之间的三维性能最大Lyapunov系数空间坐标之间的距离;以此作为同质设备间的关联系数。步骤8:采用手肘法确定最优的簇数K,而后依据KMedoids算法的聚类原理,对步骤7中所提到的关联系数进行聚类,选取中位数作为簇中心,依据最小准则函数来确定簇中心的更新与否,直至停止迭代,输出聚类集合。2.根据权利要求1所述的一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法,其特征在于,所述步骤1中的实时分割算法步骤如下:为多元时间序列数据建立似然函数模型,将每一时间段内数据的经验均值和经验协方差代入似然函数模型,使得似然函数只与分割点的位置有关;使用模拟退火算法迭代求解当前最优分割点的位置使得似然函数最大;计算相邻两段数据的差距,若满足合并条件,则将两段数据合并,并根据现存分段数计算分割点数,若两个差值不满足均小于设定阈值的条件,则继续往下运行;合并条件为均值和协方差的差值均小于预先设定的阈值:
i=1,2,...,K其中||μ
(i)

μ
(i+1)
||2为相邻两段数据的均值向量差值的二范数,||Σ
(i)

Σ
(i+1)
||
...

【专利技术属性】
技术研发人员:董亮李想李德识庄严郭岳梁源黄超廖荣涛郭兆丰周正朱兆宇胡耀东柯旺松周蕾贺亮王婕王逸兮李磊罗弦王晟玮胡欢君
申请(专利权)人:武汉大学国网湖北送变电工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1