一种用于工业设备健康管理的数据挖掘方法技术

技术编号:38082586 阅读:15 留言:0更新日期:2023-07-06 08:49
本公开关于一种用于工业设备健康管理的数据挖掘方法,包括:获取工业设备的监测数据集,其中,监测数据集包括多个状态监测数据,多个状态监测数据包括第一监测数据和第二监测数据;将多个状态监测数据中的每个状态监测数据进行向量化处理,得到每个状态监测数据对应的状态监测向量,其中,状态监测向量包括第一监测向量和第二监测向量;针对每个状态监测向量,将向量相似度满足第一预设要求的状态监测向量划分至同一类别,以得到多个类别的向量簇,其中,在任一类别的向量簇中的第一监测向量的数量和比例满足第二预设要求的情况下,将该类别确定为目标类别;基于目标类别的向量簇中的第二监测向量对应的第二监测数据,确定新的故障数据。的故障数据。的故障数据。

【技术实现步骤摘要】
一种用于工业设备健康管理的数据挖掘方法


[0001]本公开总体说来涉及工业设备监测
,更具体地讲,涉及一种用于工业设备健康管理的数据挖掘方法。

技术介绍

[0002]目前,制造行业内数字智能化、设备物联等新兴技术不断涌现,转型智慧智能工厂成为生产线的必然发展方向。工厂内的工业设备往往复杂且自动化程度高,生产设备、检测设备、刀具设备等多为高端精密设备,加工、检测精度为微米,生产过程产生海量数据信息。为了及时掌握产品、设备状态,及时高效的介入干预控制,需要对工业设备的各种监测数据进行大数据分析,尤其是工业设备发生故障时所产生的数据,从而实现工业设备的健康管理分析。
[0003]然而,在工业设备的海量历史监测数据中,工业设备处于正常运行时的数据往往占据绝大部分比例,即工业设备发生故障时所产生的数据只占总体的极小部分比例,并且监测设备还会存在大量误报、漏报等情况,导致工业设备的故障数据没有很好的存储和原始积累的过程,无论是在基础数据量方面,还是在数据可靠性方面,都不具有可用于工业设备健康管理分析的成熟条件。
[0004]在此种情况下,对工厂内的工业设备进行健康管理分析时,如果采用开源数据、培养高级数据专家或者短期内积累数据等方式使故障数据量达到可用于健康管理分析的基本要求,通常会引入获取的数据与实际业务的耦合性低等问题,并且会大大增加成本的投入。因此,在工厂内工业设备的故障数据量小时,需要用经济且高效的方式着重针对故障数据进行梳理和挖掘。

技术实现思路

[0005]本公开提供一种用于工业设备健康管理的数据挖掘方法,能够很好地利用工业设备历史故障数据库中已确定的故障数据来挖掘新的故障数据,提高了对故障数据进行梳理和挖掘的经济性和效率,为后续的设备健康管理工作提供了可靠的数据支撑。
[0006]在一个总的方面,提供一种用于工业设备健康管理的数据挖掘方法,包括:获取工业设备的监测数据集,其中,所述监测数据集包括多个状态监测数据,所述多个状态监测数据包括第一监测数据和第二监测数据,所述第一监测数据为已确定的所述工业设备发生故障时的故障数据,所述第二监测数据为待确定的数据;将所述多个状态监测数据中的每个状态监测数据进行向量化处理,得到每个状态监测数据对应的状态监测向量,其中,所述状态监测向量包括第一监测向量和第二监测向量,所述第一监测数据对应于所述第一监测向量,所述第二监测数据对应于所述第二监测向量;针对每个状态监测向量,将向量相似度满足第一预设要求的状态监测向量划分至同一类别,以得到多个类别的向量簇,其中,在任一类别的向量簇中的第一监测向量的数量和比例满足第二预设要求的情况下,将该类别确定为目标类别;基于所述目标类别的向量簇中的第二监测向量对应的第二监测数据,确定新
的故障数据。
[0007]可选地,所述针对每个状态监测向量,将向量相似度满足第一预设要求的状态监测向量划分至同一类别,包括:针对任意一个状态监测向量,分别计算该状态监测向量相对于当前每个类别的向量簇的平均向量相似度;当该状态监测向量相对于当前每个类别的向量簇的平均向量相似度中的最大值大于第一阈值时,将该状态监测向量划分至所述最大值所对应的类别;当所述最大值小于或等于所述第一阈值时,新创建一个类别并将该状态监测向量划分至所述新创建的类别。
[0008]可选地,所述针对任意一个状态监测向量,分别计算该状态监测向量相对于当前每个类别的向量簇的平均向量相似度,包括:针对当前任意一个类别的向量簇,分别计算该状态监测向量与该类别的向量簇中的所有种子向量的向量相似度,其中,所述种子向量包括第一监测向量和/或划分至各个类别的首个状态监测向量;将该状态监测向量与该类别的向量簇中的所有种子向量的向量相似度的平均值作为该状态监测向量相对于该类别的向量簇的平均向量相似度。
[0009]可选地,所述在任一类别的向量簇中的第一监测向量的数量和比例满足第二预设要求的情况下,将该类别确定为目标类别,包括:在任一类别的向量簇中的第一监测向量的所述数量大于第二阈值以及所述比例大于第三阈值时,将该类别确定为目标类别。
[0010]可选地,所述多个状态监测数据还包括第三监测数据,所述第三监测数据为已确定的所述工业设备正常运行时的正常数据,其中,所述状态监测向量包括第三监测向量,所述第三监测数据对应于所述第三监测向量。
[0011]可选地,所述基于所述目标类别的向量簇中的第二监测向量对应的第二监测数据,确定新的故障数据,包括:基于每个第一监测向量和第三监测向量,得到第一向量集,并基于每个目标类别的向量簇中的第二监测向量,得到第二向量集;利用所述第一向量集对二分类模型进行训练,并利用训练好的二分类模型对所述第二向量集中的每个第二监测向量进行预测,得到所述第二向量集中的每个第二监测向量的预测结果;基于所述第二向量集中的每个第二监测向量的预测结果,从所述第二向量集中确定第四监测向量,并将所述第四监测向量对应的第二监测数据确定为新的故障数据。
[0012]可选地,所述第一向量集还包括每个第一监测向量和第三监测向量对应的标签信息,所述标签信息用于指示对应的第一监测数据属于故障数据或者对应的第三监测数据属于正常数据,所述二分类模型用于预测所述第二向量集中的每个第二监测向量对应的第二监测数据属于故障数据的预测概率。
[0013]可选地,所述从所述第二向量集中确定第四监测向量,包括:从所述第二向量集中选取所述预测概率大于第四阈值的第二监测向量,并将所述预测概率大于第四阈值的第二监测向量确定为所述第四监测向量。
[0014]可选地,所述利用所述第一向量集对二分类模型进行训练,并利用训练好的二分类模型对所述第二向量集中的每个第二监测向量进行预测,得到所述第二向量集中的每个第二监测向量的预测结果,包括:利用所述第一向量集对所述二分类模型进行交叉训练,分别得到多个训练好的二分类模型;利用所述多个训练好的二分类模型,对所述第二向量集中的每个第二监测向量分别进行预测,得到所述第二向量集中的每个第二监测向量的多个原始预测结果;基于所述第二向量集中的每个第二监测向量的多个原始预测结果,得到所
述第二向量集中的每个第二监测向量的预测结果,其中,针对所述第二向量集中的任意一个第二监测向量,将该第二监测向量的多个原始预测结果的平均值作为该第二监测向量的预测结果。
[0015]可选地,所述利用所述第一向量集对所述二分类模型进行交叉训练,包括:将所述第一向量集随机划分为第一数量个向量子集;在每次训练时,利用所述第一数量个向量子集中的第二数量个向量子集对所述二分类模型进行训练,其中,所述第二数量小于所述第一数量,其中,任意一次训练时使用的第二数量个向量子集与其他次训练时使用的第二数量个向量子集不完全相同。
[0016]根据本公开的实施例的用于工业设备健康管理的数据挖掘方法,通过将具有一定数据相似度的状态监测数据划分为同类数据,筛选出待处理数据中类似于已确定的故障数据的部分,能够很好地利用工业设备历史故障数据库中已确定的故障数据来挖掘新的故障数据,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于工业设备健康管理的数据挖掘方法,其特征在于,包括:获取工业设备的监测数据集,其中,所述监测数据集包括多个状态监测数据,所述多个状态监测数据包括第一监测数据和第二监测数据,所述第一监测数据为已确定的所述工业设备发生故障时的故障数据,所述第二监测数据为待确定的数据;将所述多个状态监测数据中的每个状态监测数据进行向量化处理,得到每个状态监测数据对应的状态监测向量,其中,所述状态监测向量包括第一监测向量和第二监测向量,所述第一监测数据对应于所述第一监测向量,所述第二监测数据对应于所述第二监测向量;针对每个状态监测向量,将向量相似度满足第一预设要求的状态监测向量划分至同一类别,以得到多个类别的向量簇,其中,在任一类别的向量簇中的第一监测向量的数量和比例满足第二预设要求的情况下,将该类别确定为目标类别;基于所述目标类别的向量簇中的第二监测向量对应的第二监测数据,确定新的故障数据。2.如权利要求1所述的数据挖掘方法,其特征在于,所述针对每个状态监测向量,将向量相似度满足第一预设要求的状态监测向量划分至同一类别,包括:针对任意一个状态监测向量,分别计算该状态监测向量相对于当前每个类别的向量簇的平均向量相似度;当该状态监测向量相对于当前每个类别的向量簇的平均向量相似度中的最大值大于第一阈值时,将该状态监测向量划分至所述最大值所对应的类别;当所述最大值小于或等于所述第一阈值时,新创建一个类别并将该状态监测向量划分至所述新创建的类别。3.如权利要求2所述的数据挖掘方法,其特征在于,所述针对任意一个状态监测向量,分别计算该状态监测向量相对于当前每个类别的向量簇的平均向量相似度,包括:针对当前任意一个类别的向量簇,分别计算该状态监测向量与该类别的向量簇中的所有种子向量的向量相似度,其中,所述种子向量包括第一监测向量和/或划分至各个类别的首个状态监测向量;将该状态监测向量与该类别的向量簇中的所有种子向量的向量相似度的平均值作为该状态监测向量相对于该类别的向量簇的平均向量相似度。4.如权利要求1所述的数据挖掘方法,其特征在于,所述在任一类别的向量簇中的第一监测向量的数量和比例满足第二预设要求的情况下,将该类别确定为目标类别,包括:在任一类别的向量簇中的第一监测向量的所述数量大于第二阈值以及所述比例大于第三阈值时,将该类别确定为目标类别。5.如权利要求1所述的数据挖掘方法,其特征在于,所述多个状态监测数据还包括第三监测数据,所述第三监测数据为已确定的所述工业设备正常运行时的正常数据,其中,所述状态监测向量包括第三监测向量,所述第三监测数据对应...

【专利技术属性】
技术研发人员:杨小强
申请(专利权)人:重庆科创职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1