一种异常检测方法、装置以及计算机存储介质制造方法及图纸

技术编号:38329946 阅读:23 留言:0更新日期:2023-07-29 09:12
本发明专利技术涉及一种异常检测方法、装置以及计算机存储介质,该方法包括:获取设备的状态检测数据,该状态检测数据构成历史数据;对所述历史数据进行数据处理,得到训练数据样本集;利用遗传算法对K均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述待设备为故障设备时,对所述设备进行标记。本发明专利技术解决了由于现有技术中采用常规的K均值聚类算法收敛速度慢、计算效率低的技术问题。算效率低的技术问题。算效率低的技术问题。

【技术实现步骤摘要】
一种异常检测方法、装置以及计算机存储介质


[0001]本专利技术涉及一种异常检测
,特别涉及一种故障检测方法、装置以及计算机存储介质。

技术介绍

[0002]智能电子设备可能会在使用过程中出现各种各样的故障,比如软件方面的代码bug、硬件方面的元件损坏、环境引起的网络故障等。故障诊断需要专家来进行,但排查之前往往需要复现问题,这需要花费很多时间,为此,希望通过一些指标的预测,可以帮专家排除一些故障原因。且也希望在设备出现故障之前能获得一些预警,这样就能提前采取一些措施。
[0003]异常检测,是对某个事务活动中产生的大量数据进行检测以确定其中的异常数据,所述异常数据被称为异常点。异常点具有不符合正常数据的分布特征或表现模式,通过分析异常点可以获知事务活动的安全状态。目前常采用的异常检测技术包括监督的、半监督的和无监督的异常检测方法。
[0004]基于监督的异常检测技术通过给出带标签的正常数据集和异常数据集来构成整个训练集,而标签需要事先通过人工定义进行手工定义。
[0005]基于k均值聚类的异常检测方法为广泛使用的无监督异常检测方法,然而,常规的k均值聚类由于采用均值计算方法来确定聚类中心,收敛较慢,特别是对于样本规模大的收据,异常检测效率低下。

技术实现思路

[0006]本专利技术的目的是为了克服现有技术的不足,引入了遗传算法对常规的k均值聚类进行改进,以加快收敛速度,提高异常检测效率。
[0007]本专利技术是通过以下技术方案实现:
[0008]一种异常检测方法,该方法包括:获取设备的状态检测数据,该状态检测数据构成历史数据;
[0009]对所述历史数据进行数据处理,得到训练数据样本集X={X1,X2,X3,...,X
n
},其中X
i
=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本且1≤i≤n,n表示训练数据样本集的样本个数,m表示每个样本的维数;
[0010]利用遗传算法对K均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;
[0011]获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;
[0012]将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述待设备为故障设备时,对所述设备进行标记,所述利用遗传算法对K均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:
[0013]步骤一:从样本集X中随机选择k个样本X
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集
[0014]步骤二:依次计算并比较每一个样本X
i
到每一个聚类中心C
p
的距离dis(X
i
,C
p
),1≤p≤k,将样本X
i
分配到距离最近的聚类中心的类簇中,得到k个类簇{S1,S2,S3,...,S
k
},其中x
id
表示X
i
的第d维数据,c
pd
表示聚类中C
p
的第d维数据,1≤d≤m;
[0015]步骤三:构造每个类簇S
p
的最小值向量和最大值向量根据所述最小值向量和最大值向量进行二进制编码构造染色体,重复多次编码构造多个染色体,多个染色体构造成初始种群;其中所述遗传算法的适应度函数其中,q表示类簇S
p
中的样本数量,表示类簇S
p
中第j个样本的第d维数据,1≤j≤q;根据所述适应度函数,获取出最优解并将该最优解更新为类簇S
p
的聚类中心C
p

[0016]步骤四:重复步骤三,完成k个类簇{S1,S2,S3,...,S
k
}的聚类中心的更新;
[0017]步骤五:比较更新前后的每个类簇的聚类中心是否一致,若不一致,则返回步骤二后继续执行;若一致,则得到最终的k个类簇{S1,S2,S3,...,S
k
}的聚类中心,聚类分析完成,得到设备异常检测模型。
[0018]更进一步地,所述设备为家庭多媒体自由终端。
[0019]更进一步地,所述状态检测数据包括cpu温度、cpu使用率、ram占用率、网速。
[0020]更进一步地,所述构造每个类簇S
p
的最小值向量和最大值向量包括:获取类簇S
p
的q个样本X
q
的每个维度的最小值和最大值其中,
[0021]根据所述每个维度的最小值和最大值构成出最小值向量以及最大值向量根据所述最小值向量和最大值向量确定m个约束条件根据所述m个约束条件,进行二进制编码构造染色体。
[0022]更进一步地,所述步骤三还包括:对初始种群中的每个染色体,利用适应度函数进行选择后,进行交叉、变异操作完成一轮染色体更新,得到新的种群;重复多轮染色体更新,检查是否满足终止条件,当满足终止条件时,则终止染色体更新,获取出最优解
[0023]在另一实施例中,本专利技术还涉及一种用于风险设备故障检测装置,包括:
[0024]第一获取模块,用于获取设备的状态检测数据,该状态检测数据构成历史数据;
[0025]处理模块,用于对所述历史数据进行数据处理,得到训练数据样本集X={X1,X2,X3,...,X
n
},其中X
i
=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本,1≤i≤n,n表示训练数据样本集
的样本个数,m表示每个样本的维数;
[0026]分析模块,用于利用遗传算法对K均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;
[0027]第二获取模块,用于获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述设备为故障设备时,对所述设备进行标记;所述利用遗传算法对K均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:
[0028]步骤一:从样本集X中随机选择k个样本X
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集
[0029]步骤二:依次计算并比较每一个样本X
i
到每一个聚类中心C<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常检测方法,其特征在于:该方法包括:获取设备的状态检测数据,该状态检测数据构成历史数据;对所述历史数据进行数据处理,得到训练数据样本集X={X1,X2,X3,...,X
n
},其中X
i
=[x
i1
,x
i2
,x
i3
,...,x
im
]表示第i个样本,1≤i≤n,n表示训练数据样本集的样本个数,m表示每个样本的维数;利用遗传算法对K均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型;获取设备的最新状态检测数据,该最新状态检测数据构成实时数据;将所述实时数据导入到所述非监督学习模型进行预测以得到预测结果,当所述预测结果确定所述设备为故障设备时,对所述设备进行标记;所述利用遗传算法对K均值聚类算法进行改进,得到非监督学习模型,通过所述非监督学习模型对所述训练数据进行聚类分析,得到设备异常检测模型,具体包括:步骤一:从样本集X中随机选择k个样本X
radom
作为每个聚类结果的聚类中心,其中radom表示在[1,n]之间随机选择的整数,构造初始聚类中心集步骤二:依次计算并比较每一个样本X
i
到每一个聚类中心C
p
的距离dis(X
i
,C
p
),1≤p≤k,将样本X
i
分配到距离最近的聚类中心的类簇中,得到k个类簇{S1,S2,S3,...,S
k
},其中x
id
表示X
i
的第d维数据,c
pd
表示聚类中心C
p
的第d维数据,1≤d≤m;步骤三:构造每个类簇S
p
的最小值向量和最大值向量根据所述最小值向量和最大值向量进行二进制编码构造染色体,重复多次编码构造多个染色体,多个染色体构造成初始种群;其中所述遗传算法的适应度函数其中,q表示类簇S
p
中的样本数量,表示类簇S
p
中第j个样本的第d维数据,1≤j≤q;根据所述适应度函数,获取出最优解并将该最优解更新为类簇S
p
的聚类中心C
p
;步骤四:重复步骤三,完成k个类簇{S1,S2,S3,...,S
k
}的聚类中心的更新;步骤五:比较更新前后的每个类簇的聚类中心是否一致,若不一致,则返回步骤二后继续执行;若一致,则得到最终的k个类簇{S1,S2,S3,...,S
k
}的聚类中心,聚类分析完成,得到设备异常检测模型。2.根据权利要求1所述的异常检测方法,其特征在于,所述设备包括家庭多媒体自由终端。3.根据权利要求1所述的异常检测方法,其特征在于,所述状态检测数据包括cpu温度、cpu使用率、ram占用率、网速。4.根据权利要求1所述的异常检测方法,其特征在于,所述构造每个类簇S
p
的最小值向
量和最大值向量包括:获取类簇S
p
的q个样本X
q
的每个维度的最小值和最大值其中,根据所述每个维度的最小值和最大值构成出最小值向量以及最大值向量根据所述最小值向量和最大值向量确定m个约束条件根据所述m个约束条件,进行二进制编码构造染色体。5.根据权利要要求1所述的异常检测方法,所述步骤三还包括:对初始种群中的每个染色体,利用适应度函数进行选择后,进行交叉、变异操作完成一轮染色体更新,得到新的种群;重复多轮染色体更新,检查是否满足终止条件,当满足终止条件时,则终止染色体更新,获取出最优解...

【专利技术属性】
技术研发人员:尹继圣刘大照黄文曦李航朱正伟
申请(专利权)人:深圳感臻智能股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1