基于跨域关联性表示的滚动轴承未知故障检测方法技术

技术编号:37677547 阅读:19 留言:0更新日期:2023-05-26 04:43
本发明专利技术属于故障诊断技术领域,公开了基于跨域关联性表示的滚动轴承未知故障检测方法,包括模型初始化阶段和模型聚类阶段,具体的:构建滚动轴承未知故障检测模型,包括因果推理编码器、伪标签生成模块;将滚动轴承数据集划分为类别已知的故障数据集和类别未知的故障数据集及混合数据集;将类别已知的故障数据集送入因果推理编码器进行有监督的训练;将类别已知的故障数据集、类别未知的故障数据集输入到训练好的因果推理编码器,获得预测输出,并将混合数据输入伪标签生成模块生成伪标签;将模型的预测输出和伪标签通过对比损失进行训练;本发明专利技术将有监督的特征提取过程应用于无监督的聚类过程,实现故障诊断与新类发现同时考虑。虑。虑。

【技术实现步骤摘要】
基于跨域关联性表示的滚动轴承未知故障检测方法


[0001]本专利技术属于故障诊断
,特别涉及基于跨域关联性表示的滚动轴承未知故障检测方法。

技术介绍

[0002]故障诊断技术可以有效预防故障的发生,减少安全隐患,在核电、航空航天、制造等领域具有重要意义。未知故障检测是指给定一个已知的故障样本集和一个未知的故障样本集(这两个样本集的类别不重叠),利用从已知的类故障样本中学习到的知识来发现未知的类样本的新故障。由于实际生产环境中对设备运行安全可靠的要求较高,难以获得丰富的故障样本。
[0003]基于深度学习的故障诊断方法目的是利用收集的监测数据与健康状态之间的关系诊断设备是否发生故障,有(1)基于自动编码器的故障诊断方法,(2)基于RBM的故障诊断方法,(3)基于卷积神经网络的故障诊断方法,(4)基于迁移学习的故障诊断方法等,基于深度学习的新类发现方法目的是利用已标记数据的知识去发现未标记数据的新类别,其中已标记数据与未标记数据的类别是不相交的;以上故障诊断方法都没有考虑到当新的故障类型发生时,如何识别故障类型的问题。
[0004]而且目前现有方法存在以下问题:第一,没有剔除设备故障数据中不相关的特征,不相干的特征导致模型学习冗余信息,收集到的数据并不总是故障部分,模型提取的特征包括有故障和无故障的特征。无故障的特征会干扰模型的判断;第二,没有建立标记数据和未标记数据之间的学习关系,标记数据和未标记数据的潜在关联挖掘不足,新类发现一般包括两个步骤:特征提取和聚类,由于标记数据和未标记数据来自不同的类别,标记数据在聚类阶段没有得到充分利用。第三,没有考虑样本之间的相似性关系,使聚类时样本被分配到其他簇中,或者样本与正确分类的簇相距太远。

技术实现思路

[0005]针对现有技术存在的不足,本专利技术提供基于跨域关联性表示的滚动轴承未知故障检测方法,将故障诊断问题与新类发现问题一起考虑,将故障数据集划分为已知类的故障数据集和未知类的故障数据集,利用已知类的知识来辅助未知类的聚类过程,实现通过将有监督的特征提取过程中学到的知识应用于无监督的聚类过程来解决现有技术的缺陷问题。
[0006]为了解决上述技术问题,本专利技术采用的技术方案是:基于跨域关联性表示的滚动轴承未知故障检测方法,包括两个阶段:模型初始化阶段和模型聚类阶段,模型初始化阶段用于训练监督模型,模型聚类阶段用于识别和发现新类,具体包括以下步骤:步骤1、构建滚动轴承未知故障检测模型,所述模型包括因果推理编码器、SoftMax层、伪标签生成模块和损失模块,
所述因果推理编码器包括因果推理模块,所述伪标签生成模块用于在聚类阶段生成伪标签;步骤2、将滚动轴承数据集划分为类别已知的故障数据集和类别未知的故障数据集以及两者的混合数据集;步骤3、模型初始化阶段:将类别已知的故障数据集在模型初始化阶段送入因果推理编码器进行有监督的训练,得到一个学习到已知类别知识的因果推理编码器和旧分类器,训练好的因果推理编码器用于在模型聚类阶段提取特征;步骤4、模型聚类阶段:步骤4

1、将类别已知的故障数据集输入到在模型初始化阶段训练好的因果推理编码器中,经过SoftMax层获得预测的特征;将类别未知的故障数据集输入到训练好的因果推理编码器,经过多层感知机和SoftMax层获得预测的特征;将和两个特征拼接在一起作为模型的预测输出;步骤4

2、将混合数据集输入到伪标签生成模块,用于初始化伪标签生成模块参数;步骤4

3、将类别未知的故障数据集预测获得的特征输入到伪标签生成模块获得模型的伪标签;步骤5、将步骤4

1得到的模型的预测输出和步骤4

3得到的模型的伪标签通过对比损失进行训练,得到最终的未知故障检测模型;步骤6、将待检测的类别未知的滚动轴承数据输入步骤5训练好的模型,获得故障类别。
[0007]进一步的,在模型训练时,将训练数据分为三组:类别已知的故障数据集记为标记数据集、类别未知的故障数据集记为未标记数据集、两个数据集的混合数据集,其中和分别是标记数据集和未标记数据集中的数据样本,是标记数据集中的类标签,N是标记数据集中的样本数,是未标记数据集中的样本数;假设标记数据集中的类数为,未标记数据集中的类数为u,其中u是先验已知的,设定标记数据集和未标记数据集中的类是不相交的,因此,未知故障检测的任务可以表示为学习从数据域到标签的完整集合的映射,其中和之前的类属于已知类的标签,和之间的类是在聚类过程中发现的新类;所述模型初始化阶段用于通过标记数据集训练监督模型;所述模型聚类阶段使用预训练的因果推理编码器作为特征提取器,其中,标注数据集作为因果推理编码器的输入,经过一个具有个输出的SoftMax分类层,得到输出;未标记数据集输入到因果推理编码器,然后由多层感知器进行训练,最后,使用具有
u个输出的SoftMax层进行分类,得到输出;随后,两个输出特征和被连接起来,混合数据集输入伪标签生成模块,用于训练伪标签生成模块,最后同时使用标签和伪标签进行训练。
[0008]进一步的,所述因果推理模块使用do算子消除了故障数据集中的样本中混杂特征的影响,具体如下:首先,将故障数据集中的样本中导致故障的主要特征记为M,导致故障的次要特征记为B,发生故障的记为F,箭头代表不同对象之间的因果关系,构造故障数据集中的样本的特征与故障的因果图,表示次要特征导致故障,表示主要特征导致故障,表示次要特征的存在导致主要特征发生,然后导致故障发生;此时,故障发生的因果关系可以表示为:;其中表示主要特征存在时发生故障的概率,表示主要特征和次要特征同时存在时发生故障的概率,表示次要特征存在时主要特征出现的概率;然后使用后门调整来观察混杂因素并对其进行分层,具体是,对次要特征B进行分层,即,其中每个是次要特征B知识的一个分层,在每个特征层中,分别计算主要特征M和故障F之间的关系,之后计算这些因果效应的平均值,并根据各个特征层在总体的分布频率进行加权求和,得到整体的因果效应:;其中表示次要特征出现的概率;表示使用do算子消除了混杂特征后发生故障的概率;当使用后门调整来观察数据时,通过完全随机选择样本来消除混杂因素,do算子根据次要特征B主动分层,切断了从次要特征B到主要特征M的路径。
[0009]进一步的,所述伪标签生成模块包括一个预训练好的因果推理编码器和两个分类器,其中因果推理编码器使用模型初始化阶段训练好的因果推理编码器,一个分类器用于识别未标记类的类别,称为新分类器,以混合数据集作为输入,因果推理编码器学习与故障相关的特征,由于中的类数u是先验知识,在因果推理编码器的末尾添加了u个输出的分类器层,在这里,将新分类器的预测输出重新表述为one

hot伪标签,可用于进一步提高模型性能;未标记数据集中的未标记样本的one

hot伪标签是通过在上设置阈值生成的,新分类器的伪标签公式表示为: ;其中是新分类器的预测结果,j和k为未标记数据集中样本的索引,使用上...

【技术保护点】

【技术特征摘要】
1.基于跨域关联性表示的滚动轴承未知故障检测方法,其特征在于,包括两个阶段:模型初始化阶段和模型聚类阶段,模型初始化阶段用于训练监督模型,模型聚类阶段用于识别和发现新类,具体包括以下步骤:步骤1、构建滚动轴承未知故障检测模型,所述模型包括因果推理编码器、SoftMax层、伪标签生成模块和损失模块,所述因果推理编码器包括因果推理模块,所述伪标签生成模块用于在聚类阶段生成伪标签;步骤2、将滚动轴承数据集划分为类别已知的故障数据集和类别未知的故障数据集以及两者的混合数据集;步骤3、模型初始化阶段:将类别已知的故障数据集在模型初始化阶段送入因果推理编码器进行有监督的训练,得到一个学习到已知类别知识的因果推理编码器和旧分类器,训练好的因果推理编码器用于在模型聚类阶段提取特征;步骤4、模型聚类阶段:步骤4

1、将类别已知的故障数据集输入到在模型初始化阶段训练好的因果推理编码器中,经过SoftMax层获得预测的特征;将类别未知的故障数据集输入到训练好的因果推理编码器,经过多层感知机和SoftMax层获得预测的特征;将和两个特征拼接在一起作为模型的预测输出;步骤4

2、将混合数据集输入到伪标签生成模块,用于初始化伪标签生成模块参数;步骤4

3、将类别未知的故障数据集预测获得的特征输入到伪标签生成模块获得模型的伪标签;步骤5、将步骤4

1得到的模型的预测输出和步骤4

3得到的模型的伪标签通过对比损失进行训练,得到最终的未知故障检测模型;步骤6、将待检测的类别未知的滚动轴承数据输入步骤5训练好的模型,获得故障类别。2.根据权利要求1所述的基于跨域关联性表示的滚动轴承未知故障检测方法,其特征在于,在模型训练时,将训练数据分为三组:类别已知的故障数据集记为标记数据集、类别未知的故障数据集记为未标记数据集、两个数据集的混合数据集,其中和分别是标记数据集和未标记数据集中的数据样本,是标记数据集中的类标签,N是标记数据集中的样本数,是未标记数据集中的样本数;假设标记数据集中的类数为,未标记数据集中的类数为u,其中u是先验已知的,设定标记数据集和未标记数据集中的类是不相交的,因此,未知故障检测的任务可以表示为学习从数据域到标签的完整集合的映射,其中和之前的类属于已知类的标签,和之间的类是在聚类过程中发现的新类;所述模型初始化阶段用于通过标记数据集训练监督模型;
所述模型聚类阶段使用预训练的因果推理编码器作为特征提取器,其中,标注数据集作为因果推理编码器的输入,经过一个具有个输出的SoftMax分类层,得到输出;未标记数据集输入到因果推理编码器,然后由多层感知器进行训练,最后,使用具有u个输出的SoftMax层进行分类,得到输出;随后,两个输出特征和被连接起来,混合数据集输入伪标签生成模块,用于训练伪标签生成模块,最后同时使用标签和伪标签进行训练。3.根据权利要求1所述的基于跨域关联性表示的滚动轴承未知故障检测方法,其特征在于,所述因果推理模块使用do算子消除了故障数据集中的样本中混杂特征的影响,具体如下:首先,将故障数据集中的样本中导致故障的主要特征记为M,导致故障的次要特征记为B,发生故障的记为F,箭头代表不同对象之间的因果关系,构造故障数据集中的样本的特征与故障的因果图,表示次要特征导致故障,表示主要特征导致故障,表示次要特征的存在导致主...

【专利技术属性】
技术研发人员:聂婕王成龙于树松丁香乾冯毅熊许佳立
申请(专利权)人:中国海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1