基于子域自适应的滚动轴承故障诊断方法技术

技术编号:36211915 阅读:55 留言:0更新日期:2023-01-04 12:08
基于子域自适应的滚动轴承故障诊断方法,属于深度学习领域。传统的轴承故障诊断方法在已标记的故障数据充足的情况下训练神经网络获得故障诊断模型,但实际场景中,设备往往提供不了大量标记数据。本发明专利技术可以在现有的故障诊断模型的基础上,通过迁移学习获得针对新的与原先分布不同的无标记数据的诊断模型,为实际工况下标记不足数据的故障诊断提供一种更有效地诊断工具。基于子域自适应的轴承故障诊断算法分为四步:卷积神经网络进行特征提取;计算源域与目标域的局部最大均值差异;训练深度子域卷积神经网络;最后使用训练获得的模型进行故障诊断。实验结果表明轴承故障诊断的准确率完全满足实际应用的需求。确率完全满足实际应用的需求。确率完全满足实际应用的需求。

【技术实现步骤摘要】
基于子域自适应的滚动轴承故障诊断方法


[0001]本专利技术属于深度学习领域,涉及一种基于子域自适应的滚动轴承故障诊断方法,属于深度神经网络迁移学习的


技术介绍

[0002]近年来,随着深度学习的不断发展,故障诊断领域也有了比较新的突破。基于深度学习的诊断模型已经被证实优于传统方法的性能。但是,可靠的深度学习模型往往是基于大量标记数据训练而得到的,在实际工况下,收集足够多的标记数据通常既昂贵又费力。对于缺少标记数据的目标任务,可以利用来自相关源域的数据来丰富标记数据。然而,这种处理方式受到不同领域数据分布变化的影响,这将削弱深度学习模型的泛化能力。
[0003]针对上述问题,迁移学习是一种有效的解决方案。迁移学习是解决目标领域标记数据有限或无标记数据问题的一种著名工具,近年来在人工智能领域得到了迅速发展。迁移学习在故障诊断领域内应用的基本思路是通过把一个或多个故障诊断任务中获得的故障诊断知识转移到另一个任务来缩小实验数据和实际工况中未标记数据的性能差距。前者定义为源域,是诊断模型可以用大量标记数据进行充分训练的地方;后者定义为目标域,是由于缺少标记数据而难以训练模型的地方。而在基于迁移学习的故障诊断中基于特征的方法表现出了最佳的诊断性能,特别是对于跨领域存在严重差异的任务。它们将数据映射到一个公共特征空间,然后提取相似的特征。
[0004]域自适应(Domain Adaptation)的方法就是一种基于特征的方法,浅层域自适应方法通过学习不变特征以及在不使用目标域标签的情况下构建起了源域和目标域之间的联系。但是,这种域自适应方法主要学习全局域适应,即对齐全局源域分布和目标域分布,而不考虑两个子域之间的关系(一个子域包含同一类中的样本),这可能会丢失每个类别的细粒度信息。如图2所示。从图2(左)可以看出,使用全局域自适应时,源域和目标域的特征分布基本一致,但子域之间分布距离很小,这将导致目标域分类结果不理想,从而导致得到的诊断模型在目标域数据上表现不理想。而使用子域自适应则可以解决上述问题,如图2(右) 所示。

技术实现思路

[0005]本专利技术结合工业生产中的滚动轴承故障诊断这一实际应用,提出一种基于子域自适应的滚动轴承故障诊断方法,该方法基于一种新的模型:子域自适应卷积神经网络(Deep Subdomain Adaptation Convolutional Neural Network,简称 DSACNN),用于解决变工况下的轴承故障诊断。本方法能够直接从源域和目标域的原始振动信号中提取特征,无需人工数据转换即可诊断未标记目标域的轴承故障。本方法解决了原有全局域适应在故障诊断领域应用的不足之处,从而使获得的诊断模型在目标域能获得更好的分类精度,为实际工况下标记故障数据不足的滚动轴承故障诊断提供一种更有效的诊断工具。
[0006]基于子域自适应的滚动轴承故障诊断方法的流程如图1所示:首先获取轴承振动
数据,所述轴承振动数据包括有标注的源域数据和无标注的目标域数据;
[0007]将所述源域数据和所述目标域数据发送到深度子域卷积神经网络,首先通过其中的特征提取模块从所述源域数据和所述目标域数据中提取可迁移的特征。然后在其中的子域自适应模块中根据所述源域数据的特征和所述目标域数据的特征使用局部最大均值差异(Local Maximum Mean Discrepancy,简称LMMD) 计算可迁移特征相关子域的分布差值,并将该差值作为目标函数的一部分和源域分类损失函数一起计算目标损失函数;
[0008]训练所述深度子域卷积神经网络,根据所述损失函数通过反向传播更新所述初始特征提取模块的参数,训练完成后得到可用于目标域的滚动轴承故障分类预测模型。
[0009]将待诊断的目标轴承数据输入所述得到的模型中进行分类,得到输出结果。
[0010]以下为基于子域自适应的滚动轴承故障诊断方法的各阶段详解:
[0011](1)特征提取模块
[0012]特征提取的过程如下:将源域和目标域的一维数据同时发送到卷积神经网络(Convolutional Neural Network,简称CNN),CNN的结构如表1所示,如图 3所示。源域和目标域的参数相同,这意味着施加了相等的非线性特征映射。在卷积层和最大池化层中进行几轮卷积和池运算后,可以提取高级特征。为避免过度拟合全连接层后使用了Dropout技术,速率为0.5。此外,为了加速训练过程,在每个卷积层之后还引入了批量标准化(Batch Normalization,简称BN),并将数据分布拉回到标准正态分布,从而使梯度始终处于较大状态;在BN之后,引入非线性激活函数ReLU来增强网络的学习能力,消除梯度消失或爆炸。该 CNN网络的输出将作为下一阶段的输入数据。
[0013][0014]表1
[0015](2)子域自适应模块
[0016]子域自适应模块使用最大均值差异(Maximum Mean Discrepancy,简称 MMD)技术实现源域到目标域的特征迁移。MMD是用来衡量两个分布差异的指标,测量的是再生核希尔伯特空间中两个分布之间的距离。之前的MMD方法主要关注全局分布的对齐,忽略了同一故障类别中两个子域之间的特征关系。因此,本文引入了局部最大均值差异(Local Maximum Mean Discrepancy,简称 LMMD)度量源域和目标域数据相关子域的差值,调整相关子域同一故障类别下的分布,捕获每个类别的细粒度信息,实现子域之间的特征对齐。LMMD可定义
为公式(1)。
[0017][0018]其中p和q分别表示源域和目标域中的数据的分布,表示源域和目标域之间的LMMD值,x
s
和x
t
分别为源域和目标域的样本,p
(c)
和q
(c)
分别表示源域和目标域中类别c的数据的分布,代表再生希尔伯特空间,f(
·
)代表再生希尔伯特空间的映射函数。
[0019]与MMD不同的是,LMMD计算的是每个类别c之间的分布差异,如果该均值距离在再生希尔伯特空间上的距离足够小,则可视为源域和目标域在类别c 上的分布是相同的,否则视为不同分布。E表示求对应函数的期望值,该值虽然无法通过直接计算得到,但根据向量内积的性质,可以使用均值代替,均值则是通过计算期望的无偏估计得到。
[0020]假设每个样本属于类别c的权重为w
c
,那么公式4

5的无偏估计式可表示为公式2。
[0021][0022]其中和分别为属于类别c的源域样本和目标域样本的权重,C为总的故障类别数,D
s
表示源域,D
t
表示目标域;表示源域中属于类别c的样本x的权重的总和,表示目标域中属于类别c的样本x的权重的总和。权重的计算方法则如公式3所示。
[0023][0024]其中y
ic
表示标签向量y
i
的第c个元本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于子域自适应的滚动轴承故障诊断方法,其特征在于:(1)特征提取模块特征提取的过程如下:将源域和目标域的一维数据同时发送到卷积神经网络CNN,源域和目标域的参数相同;为避免过度拟合全连接层后使用了Dropout技术,速率为0.5;此外,为了加速训练过程,在每个卷积层之后还引入了批量标准化简称BN,并将数据分布拉回到标准正态分布,从而使梯度始终处于较大状态;在BN之后,引入非线性激活函数ReLU来增强网络的学习能力,消除梯度消失或爆炸;该CNN网络的输出将作为下一阶段的输入数据;表1(2)子域自适应模块引入了局部最大均值差异LMMD)度量源域和目标域数据相关子域的差值,调整相关子域同一故障类别下的分布,捕获每个类别的细粒度信息,实现子域之间的特征对齐;LMMD定义为公式(1);其中p和q分别表示源域和目标域中的数据的分布,表示源域和目标域之间的LMMD值,x
s
和x
t
分别为源域和目标域的样本,p
(c)
和q
(c)
分别表示源域和目标域中类别c的数据的分布,代表再生希尔伯特空间,f(
·
)代表再生希尔伯特空间的映射函数;E表示求对应函数的期望值,使用均值代替,均值则是通过计算期望的无偏估计得到;假设每个样本属于类别c的权重为w
c
,那么公式4

5的无偏估计式表示为公式2;其中和分别为属于类别c的源域样本和目标域样本的权重,C为总的故障类别数,D
s
表示源域,D
t
表示目标域;表示源域中属于类别c的样本x的权重的总和,表示目标域中属于类别c的样本x的权重的总和;权重的计
算方法则如公式3所示;其中y
ic
表示标签向量y
i
的第c个元素,为所有样本属于c类的总和;在源域的计算过程中,使用真实标签作为标签向量计算属于类别c的权重但是在目标域往往只有少标签或无标签的情况,无法通过直接计算来得到目标域属于类别c的权重;但在深度神经网络中,输出部分往往刻画的是一种概率分布,描述属于类别c的样本x
i
的概率,如公式4所示;因此,即使目标域没有标签,也使用来估计属于类别c的样本x
i
的概率,从而计算出目标域中属于类别c的权重此外,映射函数f(
·
)的计算也需要进一步的展开;给定源域带标签的数据和目标域不带标签的数据,且分别遵循p
(c)
和q
(c)
的独立分布,那么深度神经网络在l层通过映射函数分别生成源域和目标域的激活向量T
sl
、T
tl
;于是,公式1通过向量的完全平方公式展开为公式5;其中T
sl
、T
tl
分别为源域...

【专利技术属性】
技术研发人员:包振山臧天昊张文博杜嘉磊
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1