【技术实现步骤摘要】
一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法
[0001]本申请涉及数据挖掘领域,具体涉及一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法。
技术介绍
[0002]随着新型电力系统向高度数字化、智能化、智慧化的深入推进,亟需一个更加高效、智能的数据中心网络设备管理系统,以此来实现精准实时的信息交互监测的和高度自由的业务调度。面向电力信息系统监控的海量性能数据,需要及时发现系统中可能存在的非线性变换,即突发性的、大幅偏离预期值的无序状态变化,因此我们期望设计一种基于时间演化特征的聚类方式,以此来发现不同时间尺度上同质设备多维性能状态序列的潜在相似性,从而为系统调度、维护、管理等提供智能化的决策方案,为数据中心实时业务自由调度、潜在故障预测、突发故障溯源等业务的实现奠定基础。
[0003]考虑到传统的聚类算法不适应于多维度的时变状态序列,并且现在大部分对于多变量时间序列的聚类方法仍旧停留在对于序列本身形状特征、结构特征等呈现一定规律的、可预测的特征来进行建模,忽略了可能存在的时域混沌现象,即整个网络系统可能存在突发性的、非线性的、大幅偏移预测结果的无序现象。
技术实现思路
[0004]本申请实施例的目的在于提供一种基于局部时域特征的设备级多维运行状态序列的时间关联聚类方法,有效规避了突发值可能会对聚类结果产生较大影响这一弊端,有助于时间维度设备运行规律的挖掘。
[0005]为实现上述目的,本申请提供如下技术方案:
[0006]本申请实施例提供一种基于局部时域 ...
【技术保护点】
【技术特征摘要】
1.一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法,其特征在于,包括以下具体步骤:步骤1:对数据中心同一机房内的所有三层交换机的CPU利用率、内存利用率、Ping时延的时间序列进行在线分割,分割方法按照最大似然方法对相邻时间间隔上的序列进行分割合并,使得分割后的相邻时间上的子序列相似度较低;步骤2:分别计算第i台设备性能时间子序列的标准差以及关联积分函数统计量步骤3:根据关联积分函数法计算最优的嵌入滞时τ
i
和嵌入维数m=(m1,m2,m3);步骤4:根据嵌入滞时和嵌入维数,计算第i台交换机重构后三种性能序列的相空间步骤5:在重构多维性能序列对应的相空间中采用时滞法进行时间尺度上的演化,通过不断计算演化后数据点与其邻近点间距离不断计算演化后数据点与其邻近点间距离k表示滞后了k={k1,k2,k3}个时间单元,表示对于第i台三层交换机取同一时间段内的CPU利用率曲线进行分割后的第t个子段的第i1个嵌入维数;步骤6:对于每个k1,k2,k3,计算所有关于的均值y(k1),y(k2),y(k3);并且对y(k1),y(k2),y(k3)进行最小二乘回归,求出其斜率即为第p子段的最大Lyapunov系数;完成了对所有三层交换机,在一段时间内的CPU利用率、内存利用率、Ping时延三种性能维数的时间演化特征提取,以每种性能时间序列分割后的子序列的最大Lyapunov系数作为描述不同时间演化规律的局部时域特征;步骤7:计算任意两台三层交换机之间的三维性能最大Lyapunov系数空间坐标之间的距离;以此作为同质设备间的关联系数。步骤8:采用手肘法确定最优的簇数K,而后依据KMedoids算法的聚类原理,对步骤7中所提到的关联系数进行聚类,选取中位数作为簇中心,依据最小准则函数来确定簇中心的更新与否,直至停止迭代,输出聚类集合。2.根据权利要求1所述的一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法,其特征在于,所述步骤1中的实时分割算法步骤如下:为多元时间序列数据建立似然函数模型,将每一时间段内数据的经验均值和经验协方差代入似然函数模型,使得似然函数只与分割点的位置有关;使用模拟退火算法迭代求解当前最优分割点的位置使得似然函数最大;计算相邻两段数据的差距,若满足合并条件,则将两段数据合并,并根据现存分段数计算分割点数,若两个差值不满足均小于设定阈值的条件,则继续往下运行;合并条件为均值和协方差的差值均小于预先设定的阈值:
i=1,2,...,K其中||μ
(i)
‑
μ
(i+1)
||2为相邻两段数据的均值向量差值的二范数,||Σ
(i)
‑
Σ
(i+1)
||
...
【专利技术属性】
技术研发人员:董亮,李想,李德识,庄严,郭岳,梁源,黄超,廖荣涛,郭兆丰,周正,朱兆宇,胡耀东,柯旺松,周蕾,贺亮,王婕,王逸兮,李磊,罗弦,王晟玮,胡欢君,
申请(专利权)人:武汉大学国网湖北送变电工程有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。