一种无监督迁移学习的滚动轴承故障诊断方法及系统技术方案

技术编号:36802080 阅读:11 留言:0更新日期:2023-03-08 23:51
本发明专利技术属于轴承故障诊断技术领域,具体提供了一种无监督迁移学习的滚动轴承故障诊断方法及系统,其中方法包括:在迁移学习网络训练过程中,对源域和目标域进行特征提取和域适配;目标域样本批量输入矩阵经过网络训练得到故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数‖G‖

【技术实现步骤摘要】
一种无监督迁移学习的滚动轴承故障诊断方法及系统


[0001]本专利技术涉及轴承故障诊断
,更具体地,涉及一种无监督迁移学习的滚动轴承故障诊断方法及系统。

技术介绍

[0002]滚动轴承是旋转机械的关键部件,滚动轴承发生故障时会对设备造成重大损伤,严重影响设备的安全性和可靠性。传统的轴承故障诊断多采用信号分析的方法,如经验小波变换(empirical wavelet transform,EWT)法,变分模态分解(variational mode decomposition,VMD),信号时频峭度谱频带划分法。但信号分析方法通常需要人为地设计轴承故障特征提取的算法,依赖于大量的先验知识和专家经验。
[0003]相比于信号分析方法,在进行轴承故障诊断时,深度学习可以自动提取故障特征,大幅降低工作难度,深度学习在实际应用中取得了较好地诊断效果。文献于2017年就提出了首层大卷积核神经网络(Deep Convolutional Neural Networks with Wide First

layer Kernels,WDCNN)故障诊断方法,提高了网络在噪声环境下的轴承故障诊断效果。文献[6]提出了双dropout、FC层的网络(Convolution Neural Network with two Dropout layers and two Fully

connected layers,DFCNN),将轴承原始一维时域信号转化为二维灰度图。文献提出了一种融合多种故障类别信息的深度自编码器网络(Stacked Discriminant Information

based Auto

Encoder,SDIAE),引入了结构判别信息来设计新的损失函数,提高网络的特征提取能力。文献提出了一种融合多模态传感器信号的方法,提高了轴承在噪音环境下的故障诊断准确率。文献提出了一种基于双向长短期记忆网络(Bi

directional Long Short

Term Memory,Bi

LSTM)的故障诊断模型,将原始振动信号直接输入该模型中,可以诊断出轴承的具体故障类型及损伤程度。文献提出了多尺度卷积和长短期记忆神经网络模型(Multi

scale Convolutional Neural Network and Long Shor

Term Memory,MCNN

LSTM)故障诊断模型,该模型通过两个不同大小卷积核的CNN对轴承原始振动信号进行特征提取,再利用堆叠LSTM网络对学习到的特征进行故障识别。
[0004]使用深度学习进行轴承故障诊断有许多成功的应用案列,但同时也带来了一些问题,如:随着网络模型层数的增加,模型参数也会大量增加,此时网络训练所需的时间和算力也会大幅度的增加;利用深度学习进行故障诊断,需要大量有标签的故障数据,而在实际的工业制造环境中,机械设备很少会在故障状态下运行,难以获取得到所需的故障数据。

技术实现思路

[0005]本专利技术针对现有技术中存在的现有利用深度学习方法进行滚动轴承故障诊断,主要采用有监督学习的方式,需要大量带标签的轴承故障数据,但实际工业运行中,此类数据通常难以获取的技术问题。
[0006]本专利技术提供了一种无监督迁移学习的滚动轴承故障诊断方法,包括以下步骤:
[0007]S1,将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数
据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;
[0008]S2,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数||G||
*

[0009]S3,构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。
[0010]优选地,所述S1具体包括:在进行迁移学习网络训练时,将最大均值差异与交叉熵损失函数结合,以最小化源域特征与目标域特征之间的分布差异。
[0011]优选地,所述S1中将目标域样本批量输入矩阵经过网络计算得到故障类别输出批量矩阵G具体包括:
[0012]采用一维卷积网络的卷积运算对故障特征进行自动提取,所述一维卷积网络包含特征提取模块和分类器,特征提取模块包含了输入层Input、卷积层Conv、批量归一化层BN、池化层Pooling;分类器包含全连接层FC和Softmax函数。
[0013]优选地,所述最大均值差异是迁移学习中常用的源域和目标域分布差异度量准测,通过最大均值差异MMD函数可以计算出将源域和目标域映射到再生希尔伯特空间后的均值差异,MMD的值越小,代表源域和目标域分布越相似,MMD计算表达式如下:
[0014][0015]式(1.3)中,x
s
表示源域样本向量,x
t
表示目标域样本向量,m
s
表示源域样本数量,m
t
表示目标域样本数量,代表再生希尔伯特空间,f(*)表示将源域和目标域数据映射到希尔伯特空间的非线性映射函数,本专利技术采用高斯核函数k(*)作为映射函数,表达式如下:
[0016][0017]式(1.4)中,a表示向量,σ表示带宽,它影响着k(*)的局部作用范围。
[0018]优选地,所述S2具体包括:
[0019]通过G的F范数||G||
F
定量地表示该矩阵的可分辨性;
[0020]G
i,j
表示批量输出矩阵中的第i个输出向量中的第j个元素,由于||G||
F
为非负数,则定义损失值Loss
F
为:
[0021]Loss
F


||G||
F
ꢀꢀ
(1.6)
[0022]G的核范数||G||
*
可以定义为:
[0023][0024]式中,k=min(m,n),m表示训练集每次训练样本数量,n表示轴承的故障类别数,σ
i
表示最大的k个奇异值中的第i个,||G||
F
也可用奇异值表示:
[0025][0026]通过式(1.7)和式(1.8),可证得||G||
F
和||G||
*
的关系为:
[0027][0028]已知||G||
F
最大值为通过式(1.9)可得||G||
*
的最大值为:
[0029][0030]优选地,所述S2还包括:
[0031]当||G||
F
接近上限时,第i个最大奇异值可以近似本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无监督迁移学习的滚动轴承故障诊断方法,其特征在于,包括以下步骤:S1,将某工况下带有故障标签的数据集称为源域,另一工况下不带故障标签的数据集称为目标域,在网络的迁移学习训练过程中,将两者的样本批量输入矩阵同时输入网络进行特征提取,对两者被提取到的特征进行域适配;S2,用于目标域样本批量输入矩阵经过网络训练得到的故障类别输出批量矩阵G,最大化故障类别输出批量矩阵G的核范数‖G‖
*
;S3,构造出基于迁移学习的快速批量核范式最大化的深度卷积神经网络模型,将待测故障轴承源数据输入所述深度卷积神经网络模型以得到诊断结果。2.根据权利要求1所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述S1具体包括:在进行迁移学习网络训练时,将最大均值差异与交叉熵损失函数结合,以最小化源域特征与目标域特征之间的分布差异。3.根据权利要求1所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述S1中将源域和目标域的样本批量输入矩阵经过网络训练进行特征提取具体包括:采用一维卷积网络的卷积运算对故障特征进行自动提取,所述一维卷积网络包含特征提取模块和分类器,特征提取模块包含了输入层Input、卷积层Conv、批量归一化层BN、池化层Pooling;分类器包含全连接层FC和Softmax函数。4.根据权利要求2所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述最大均值差异是迁移学习中常用的源域和目标域分布差异度量准测,通过最大均值差异MMD函数可以计算出将源域和目标域映射到再生希尔伯特空间后的均值差异,MMD的值越小,代表源域和目标域分布越相似,MMD计算表达式如下:式(1.3)中,x
s
表示源域样本向量,x
t
表示目标域样本向量,m
s
表示源域样本数量,m
t
表示目标域样本数量,代表再生希尔伯特空间,f(*)表示将源域和目标域数据映射到希尔伯特空间的非线性映射函数,本发明采用高斯核函数k(*)作为映射函数,表达式如下:式(1.4)中,a表示向量,σ表示带宽,它影响着k(*)的局部作用范围。5.根据权利要求1所述的无监督迁移学习的滚动轴承故障诊断方法,其特征在于,所述S2具体包括:表示批量输出矩阵中的第i个输出向量中的第j个元素,由于‖G‖
F
为非负数,则定义损失值Loss
F
为:
Loss
F
=<...

【专利技术属性】
技术研发人员:郑波黄健豪陈国庆
申请(专利权)人:中国民用航空飞行学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1