【技术实现步骤摘要】
基于子域自适应的滚动轴承故障诊断方法
[0001]本专利技术属于深度学习领域,涉及一种基于子域自适应的滚动轴承故障诊断方法,属于深度神经网络迁移学习的
技术介绍
[0002]近年来,随着深度学习的不断发展,故障诊断领域也有了比较新的突破。基于深度学习的诊断模型已经被证实优于传统方法的性能。但是,可靠的深度学习模型往往是基于大量标记数据训练而得到的,在实际工况下,收集足够多的标记数据通常既昂贵又费力。对于缺少标记数据的目标任务,可以利用来自相关源域的数据来丰富标记数据。然而,这种处理方式受到不同领域数据分布变化的影响,这将削弱深度学习模型的泛化能力。
[0003]针对上述问题,迁移学习是一种有效的解决方案。迁移学习是解决目标领域标记数据有限或无标记数据问题的一种著名工具,近年来在人工智能领域得到了迅速发展。迁移学习在故障诊断领域内应用的基本思路是通过把一个或多个故障诊断任务中获得的故障诊断知识转移到另一个任务来缩小实验数据和实际工况中未标记数据的性能差距。前者定义为源域,是诊断模型可以用大量标记数据进行充分训练的地方;后者定义为目标域,是由于缺少标记数据而难以训练模型的地方。而在基于迁移学习的故障诊断中基于特征的方法表现出了最佳的诊断性能,特别是对于跨领域存在严重差异的任务。它们将数据映射到一个公共特征空间,然后提取相似的特征。
[0004]域自适应(Domain Adaptation)的方法就是一种基于特征的方法,浅层域自适应方法通过学习不变特征以及在不使用目标域标签的情况下构建起了源域和目 ...
【技术保护点】
【技术特征摘要】
1.一种基于子域自适应的滚动轴承故障诊断方法,其特征在于:(1)特征提取模块特征提取的过程如下:将源域和目标域的一维数据同时发送到卷积神经网络CNN,源域和目标域的参数相同;为避免过度拟合全连接层后使用了Dropout技术,速率为0.5;此外,为了加速训练过程,在每个卷积层之后还引入了批量标准化简称BN,并将数据分布拉回到标准正态分布,从而使梯度始终处于较大状态;在BN之后,引入非线性激活函数ReLU来增强网络的学习能力,消除梯度消失或爆炸;该CNN网络的输出将作为下一阶段的输入数据;表1(2)子域自适应模块引入了局部最大均值差异LMMD)度量源域和目标域数据相关子域的差值,调整相关子域同一故障类别下的分布,捕获每个类别的细粒度信息,实现子域之间的特征对齐;LMMD定义为公式(1);其中p和q分别表示源域和目标域中的数据的分布,表示源域和目标域之间的LMMD值,x
s
和x
t
分别为源域和目标域的样本,p
(c)
和q
(c)
分别表示源域和目标域中类别c的数据的分布,代表再生希尔伯特空间,f(
·
)代表再生希尔伯特空间的映射函数;E表示求对应函数的期望值,使用均值代替,均值则是通过计算期望的无偏估计得到;假设每个样本属于类别c的权重为w
c
,那么公式4
‑
5的无偏估计式表示为公式2;其中和分别为属于类别c的源域样本和目标域样本的权重,C为总的故障类别数,D
s
表示源域,D
t
表示目标域;表示源域中属于类别c的样本x的权重的总和,表示目标域中属于类别c的样本x的权重的总和;权重的计
算方法则如公式3所示;其中y
ic
表示标签向量y
i
的第c个元素,为所有样本属于c类的总和;在源域的计算过程中,使用真实标签作为标签向量计算属于类别c的权重但是在目标域往往只有少标签或无标签的情况,无法通过直接计算来得到目标域属于类别c的权重;但在深度神经网络中,输出部分往往刻画的是一种概率分布,描述属于类别c的样本x
i
的概率,如公式4所示;因此,即使目标域没有标签,也使用来估计属于类别c的样本x
i
的概率,从而计算出目标域中属于类别c的权重此外,映射函数f(
·
)的计算也需要进一步的展开;给定源域带标签的数据和目标域不带标签的数据,且分别遵循p
(c)
和q
(c)
的独立分布,那么深度神经网络在l层通过映射函数分别生成源域和目标域的激活向量T
sl
、T
tl
;于是,公式1通过向量的完全平方公式展开为公式5;其中T
sl
、T
tl
分别为源域...
【专利技术属性】
技术研发人员:包振山,臧天昊,张文博,杜嘉磊,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。