当前位置: 首页 > 专利查询>同济大学专利>正文

基于不平衡数据的故障诊断方法和系统技术方案

技术编号:30147115 阅读:9 留言:0更新日期:2021-09-25 14:52
本发明专利技术提供一种基于不平衡数据的故障诊断方法和系统;其中,所述方法包括:采用聚类分析方法对样本数据集进行聚类处理,以获取各样本数据子集,和各聚类中心点的特征信息;基于各所述样本数据子集,训练生成对应的各分类器模型;基于各测试数据特征点与各所述聚类中心点的位置关系,划分各所述测试数据特征点至对应的测试数据子集中;将各测试数据子集输入至对应的所述分类器模型中,以获取各测试数据子集对应的故障诊断结果。该方法可以降低不均衡数据内间距过大对分类结果的影响,从而可提升了工业故障诊断的准确性。了工业故障诊断的准确性。了工业故障诊断的准确性。

【技术实现步骤摘要】
基于不平衡数据的故障诊断方法和系统


[0001]本专利技术属于故障检测
,涉及一种基于不平衡数据的故障诊断方法和系统。

技术介绍

[0002]随着计算机技术的高速发展,通过获取设备的运行数据并对数据进行分析,可以实现设 备的故障识别和诊断,以便于在故障发生时能够及时诊断并给出解决方案。于故障诊断的过 程中,通常需要对设备的运行数据进行分类。然而,绝大部多数的设备运行数据为不均衡数 据,即设备正常数据远远多于故障数据,而对于不均衡数据,目前常用的分类方法效果由于 主要基于均衡数据进行设计的,所以对于不均衡数据的分类效果往往较差;这是由于,基于 均衡数据设计的传统方法以提高分类准确度为目标,对所有样本“一视同仁”,因此会造成部 分类别的样本分类精度高,而其他类别的样本分类精度过低的问题。例如,朴素随机欠采 样、过采样易存在欠拟合和过拟合的风险;SMOTE算法改善了过拟合问题,但是在近邻选 择时,存在一定的盲目性,无法克服不均衡数据集的数据分布问题,容易产生分布边缘化问 题,且上述算法都易忽视故障数据类之间的间距问题。而当故障数据的类内间距较大时,则 对数据分类结果产生较大的影响,导致分类准确率降低,进而导致故障诊断精度不足,对故 障数据的诊断率低、对正常数据的误判率高等问题。
[0003]因此,如何提高不均衡数据的分类准确率,以提升故障诊断结果的准确性,已成为本领 域所需要解决的技术问题。

技术实现思路

[0004]鉴于以上现有技术中存在的缺点,本专利技术的目的在于提供一种基于不平衡数据的故障诊 断方法和系统,用于解决采用现有的数据分析方法处理不均衡数据,存在分类准确率较低, 进而导致诊断结果不准确等问题。
[0005]为实现上述目的及其他相关目的,本专利技术首先提供一种基于不平衡数据的故障诊断方法, 适用于设备状态的故障诊断,所述方法包括:基于设备状态样本数据的样本数据集,和所述 样本数据集中的类别数,采用聚类分析方法对所述样本数据集进行聚类处理,以获取各样本 数据子集,和各所述样本数据子集的聚类中心点特征信息;基于各所述样本数据子集,训练 生成对应的各分类器模型;基于设备状态测试数据集中的各测试数据特征点与各所述聚类中 心点的位置关系,划分各所述测试数据特征点至对应的测试数据子集中;将各测试数据子集 输入至对应的所述分类器模型中,分别获取各测试数据子集对应的故障诊断结果。
[0006]于本专利技术一实施例中,所述采用聚类分析方法对所述样本数据集进行聚类处理,包括: 采用K

means聚类分析方法对所述样本数据集进行聚类处理,包括:确定聚类数量K;随机 选取K个样本数据特征点作为各聚类中心点的初始位置;根据各所述样本数据特征点与所述 聚类中心点的位置关系,更新各所述聚类中心点位置至新的位置,并重复执行该步
骤,直至 各所述聚类中心点的新位置和原位置均相同,则将各所述聚类中心点的新位置信息,作为各 聚类中心点的最终位置信息。
[0007]于本专利技术一实施例中,所述确定聚类数量K,包括:于所述采用K

means聚类分析方法 对所述样本数据集进行聚类处理过程中,采用试探法确定聚类数量K的数值。
[0008]于本专利技术一实施例中,所述方法还包括:对所述样本数据集中的各样本特征点,采用 Zscore函数进行标准化处理。
[0009]本专利技术又提供了基于不平衡数据的故障诊断系统,所述系统包括:样本数据处理模块, 用于对输入的设备状态样本数据的样本数据集,采用聚类分析方法对所述样本数据集进行聚 类处理,以获取各样本数据子集,和各所述样本数据子集的聚类中心点特征信息;样本训练 模块,用于基于各所述样本数据子集,训练生成对应的各分类器模型;测试数据处理模块, 用于基于设备状态测试数据集中的各测试数据特征点与各所述聚类中心点的位置关系,划分 各所述测试数据特征点至对应的测试数据子集中,以获得各所述测试数据子集;故障诊断结 果获取模块,用于将各测试数据子集输入至对应的所述分类器模型中,以分别获取各测试数 据子集对应的故障诊断结果。
[0010]于本专利技术一实施例中,所述采用聚类分析方法对所述样本数据集进行聚类处理,包括: 采用K

means聚类分析方法对所述样本数据集进行聚类处理。
[0011]于本专利技术一实施例中,所述系统还包括:第一预处理模块,用于在所述采用聚类分析方 法对所述样本数据集进行聚类处理之前,对所述样本数据集中的各样本特征点,采用Zscore 函数进行标准化处理。
[0012]于本专利技术一实施例中,所述系统还包括:第二预处理模块,用于在所述基于设备状态测 试数据集中的各测试数据特征点与各所述聚类中心点的位置关系,划分各所述测试数据特征 点至对应的测试数据子集中之前,对所述各测试数据特征点,采用Zscore函数进行标准化处 理。
[0013]如上所述,本专利技术提供的所述基于不平衡数据的故障诊断方法和系统,于训练各分类器 模型前,采用K

means聚类分析方法及Zscore函数对不均衡的样本数据进行预处理,可以改 善因样本数据的类内间距过大所导致的分类精度降低问题;以及基于预处理后的样本数据训 练生成对应的各分类器模型,可以提高分类器模型的分类性能,从而提升了基于设备状态数 据的故障诊断结果的准确性。
附图说明
[0014]图1显示为本专利技术所述基于不平衡数据的故障诊断方法于一实施例中的流程 示意图;
[0015]图2显示为一实施例中所述采用K

means聚类分析方法对样本数据集进行聚 类的流程示意图;
[0016]图3显示为一实施例中所述K

means聚类分析过程的示意图
[0017]图4显示为本专利技术所述基于不平衡数据的故障诊断系统于一实施例中的结构 示意图
[0018]元件标号说明
[0019]S100~S600
ꢀꢀꢀꢀꢀꢀꢀꢀ
步骤
[0020]S201~S205
ꢀꢀꢀꢀꢀꢀꢀꢀ
步骤
具体实施方式
[0021]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露 的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加 以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精 神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征 可以相互组合。
[0022]需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图 式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实 际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复 杂。
[0023]实施例1
[0024]请参阅图1,显示为本专利技术提供的基于不平衡数据的故障诊断方法于一实施中的流程示 意图。于本实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于不平衡数据的故障诊断方法,其特征在于,适用于设备状态的故障诊断,所述方法包括:基于设备状态样本数据的样本数据集,采用聚类分析方法对所述样本数据集进行聚类处理,以获取各样本数据子集,和各所述样本数据子集的聚类中心点特征信息;基于各所述样本数据子集,训练生成对应的各分类器模型;基于设备状态测试数据集中的各测试数据特征点与各所述聚类中心点的位置关系,划分各所述测试数据特征点至对应的测试数据子集中;将各测试数据子集输入至对应的所述分类器模型中,分别获取各测试数据子集对应的故障诊断结果。2.根据权利要求1所述的基于不平衡数据的故障诊断方法,其特征在于,所述采用聚类分析方法对所述样本数据集进行聚类处理,包括:采用K

means聚类分析方法对所述样本数据集进行聚类处理。3.根据权利要求2所述的基于不平衡数据的故障诊断方法,其特征在于,所述确定聚类数量K,包括:于所述采用K

means聚类分析方法对所述样本数据集进行聚类处理过程中,采用试探法确定聚类数量K的数值。4.根据权利要求1所述的基于不平衡数据的故障诊断方法,其特征在于,于所述采用聚类分析方法对所述样本数据集进行聚类处理之前,所述方法还包括:对所述样本数据集中的各样本特征点,采用Zscore函数进行标准化处理。5.根据权利要求4所述的基于不平衡数据的故障诊断方法,其特征在于,于所述基于设备状态测试数据集中的各测试数据特征点与各所述聚类中心点的位置关系,划分各所述测试数据特征点至对应的测试数据子集中之前,所述方法还包括:对所述各测试数据特征点,采用...

【专利技术属性】
技术研发人员:康琦徐其慧
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1