基于不平衡数据的故障诊断方法和系统技术方案

技术编号：30147115 阅读：9 留言：0更新日期：2021-09-25 14:52

本发明专利技术提供一种基于不平衡数据的故障诊断方法和系统；其中，所述方法包括：采用聚类分析方法对样本数据集进行聚类处理，以获取各样本数据子集，和各聚类中心点的特征信息；基于各所述样本数据子集，训练生成对应的各分类器模型；基于各测试数据特征点与各所述聚类中心点的位置关系，划分各所述测试数据特征点至对应的测试数据子集中；将各测试数据子集输入至对应的所述分类器模型中，以获取各测试数据子集对应的故障诊断结果。该方法可以降低不均衡数据内间距过大对分类结果的影响，从而可提升了工业故障诊断的准确性。了工业故障诊断的准确性。了工业故障诊断的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于不平衡数据的故障诊断方法和系统

[0001]本专利技术属于故障检测
，涉及一种基于不平衡数据的故障诊断方法和系统。

技术介绍

[0002]随着计算机技术的高速发展，通过获取设备的运行数据并对数据进行分析，可以实现设备的故障识别和诊断，以便于在故障发生时能够及时诊断并给出解决方案。于故障诊断的过程中，通常需要对设备的运行数据进行分类。然而，绝大部多数的设备运行数据为不均衡数据，即设备正常数据远远多于故障数据，而对于不均衡数据，目前常用的分类方法效果由于主要基于均衡数据进行设计的，所以对于不均衡数据的分类效果往往较差；这是由于，基于均衡数据设计的传统方法以提高分类准确度为目标，对所有样本“一视同仁”，因此会造成部分类别的样本分类精度高，而其他类别的样本分类精度过低的问题。例如，朴素随机欠采样、过采样易存在欠拟合和过拟合的风险；SMOTE算法改善了过拟合问题，但是在近邻选择时，存在一定的盲目性，无法克服不均衡数据集的数据分布问题,容易产生分布边缘化问题，且上述算法都易忽视故障数据类之间的间距问题。而当故障数据的类内间距较大时，则对数据分类结果产生较大的影响，导致分类准确率降低，进而导致故障诊断精度不足，对故障数据的诊断率低、对正常数据的误判率高等问题。
[0003]因此，如何提高不均衡数据的分类准确率，以提升故障诊断结果的准确性，已成为本领域所需要解决的技术问题。

技术实现思路

[0004]鉴于以上现有技术中存在的缺点，本专利技术的目的在于提供一种基于不平衡数据的故...

【技术保护点】

【技术特征摘要】
1.一种基于不平衡数据的故障诊断方法，其特征在于，适用于设备状态的故障诊断，所述方法包括：基于设备状态样本数据的样本数据集，采用聚类分析方法对所述样本数据集进行聚类处理，以获取各样本数据子集，和各所述样本数据子集的聚类中心点特征信息；基于各所述样本数据子集，训练生成对应的各分类器模型；基于设备状态测试数据集中的各测试数据特征点与各所述聚类中心点的位置关系，划分各所述测试数据特征点至对应的测试数据子集中；将各测试数据子集输入至对应的所述分类器模型中，分别获取各测试数据子集对应的故障诊断结果。2.根据权利要求1所述的基于不平衡数据的故障诊断方法，其特征在于，所述采用聚类分析方法对所述样本数据集进行聚类处理，包括：采用K
‑
means聚类分析方法对所述样本数据集进行聚类处理。3.根据权利要求2所述的基于不平衡数据的故障诊断方法，其特征在于，所述确定聚类数量K，包括：于所述采用K
‑
means聚类分析方法对所述样本数据集进行聚类处理过程中，采用试探法确定聚类数量K的数值。4.根据权利要求1所述的基于不平衡数据的故障诊断方法，其特征在于，于所述采用聚类分析方法对所述样本数据集进行聚类处理之前，所述方法还包括：对所述样本数据集中的各样本特征点，采用Zscore函数进行标准化处理。5.根据权利要求4所述的基于不平衡数据的故障诊断方法，其特征在于，于所述基于设备状态测试数据集中的各测试数据特征点与各所述聚类中心点的位置关系，划分各所述测试数据特征点至对应的测试数据子集中之前，所述方法还包括：对所述各测试数据特征点，采用...

【专利技术属性】
技术研发人员：康琦，徐其慧，
申请(专利权)人：同济大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人