当前位置: 首页 > 专利查询>盐城工学院专利>正文

一种基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法技术

技术编号:32486143 阅读:100 留言:0更新日期:2022-03-02 09:51
本发明专利技术公开了一种基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法,包括以下步骤,将数据集划分为训练集和测试集,并对其原始信号进行归一化操作;将归一化后的数据转换成对应于不同故障情况的二维灰度图并设置对应的标签;将灰度图像输入卷积神经网络进行特征提取;利用注意力机制模块提取图像的显著性特征,并将输出值约束在0

【技术实现步骤摘要】
一种基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法


[0001]本专利技术涉及基于深度学习的轴承故障诊断
,尤其涉及一种基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法。

技术介绍

[0002]滚动轴承作为机械设备中的核心部件之一,其健康状况是保证设备能够正常工作的关键因素。据相关文献统计,约有30%的故障是由故障损坏所引起的。一旦因为轴承故障引发大面积的机械故障,会导致整个系统运行出现问题,那么必将导致不可估量的人身、财产损失,所以轴承故障诊断技术的研究具有重要的经济价值和社会效益。
[0003]随着人工智能与大数据技术的快速发展,在工业大数据背景下,智能化的故障诊断技术作为保障机械设备安全运行的重要手段,逐渐成为了工业领域的热点问题。故障诊断借助深度学习技术的应用也取得了新的研究进展。作为深度学习的典型技术,注意力机制、卷积神经网络(Convolutional Neural Network,CNN)和门控循环神经单元(Gated Recurrent Unit,GRU)在故障诊断上的研究也取得了很大的进展。
[0004]CNN可以通过使用局部感受野和权重分配策略进行优化的方式来减少需要训练的参数数量,有效地减轻训练过程中的计算负担,但CNN的平移不变性和池化层的存在会导致许多非常有价值的空间信息丢失,同时也忽略了局部与整体之间的关联。对于序列信号来说,缺少内部之间的长期依赖关系。然而这种隐藏在序列内部之间的长期依赖关系被认为是一种有助于故障诊断的特征。GRU是长短时记忆网络(Long Short Term Memory,LSTM)的一种变体,LSTM有三个不同的门结构,参数较多,训练起来比较困难。而GRU只含有两个门结构,在超参数全部调优的情况下两者性能相当,且GRU结构更为简单,容易实现。门控机制是为了更好地捕捉时间序列中时间步距离的依赖关系。它通过学习到的门来控制着信息的流动,门控机制控制输入和记忆,在当前时间步做出预测。门控机制的特点在于能够长期保存序列中的信息,且不会随着时间而消失。同样的GRU虽然在时间序列数据的故障诊断上解决了循环神经网络的梯度消失和梯度爆炸问题,但是它固有的顺序性使得GRU模型没有考虑到数据的局部特征,这将导致特征提取不全面,数据利用不充分,信息丢失的问题。

技术实现思路

[0005]专利技术目的:本专利技术的目的在于克服数据利用不充分、特征提取不全面、冗余特征干扰故障判断的问题,提出一种基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法。
[0006]为实现上述目的,本专利技术采用如下技术方案:
[0007]一种基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法,包括以下步骤:
[0008]步骤a,将数据集划分为训练集和测试集,并对其原始信号进行归一化操作;
[0009]步骤b,将步骤a归一化后的数据转换成对应于不同故障情况的二维灰度图并设置对应的标签;
[0010]步骤c,将步骤b得到的灰度图像输入卷积神经网络(Convolutional Neural Network,CNN)进行特征提取;
[0011]步骤d,利用注意力机制模块提取图像的显著性特征,并将输出值约束在0

1之间;
[0012]步骤e,将步骤c从卷积神经网络(CNN)中提取的特征与其对应的注意力机制模块所输出的显著性特征进行逐元素相乘;
[0013]步骤f,将步骤e相乘得到的结果输入门控循环单元(Gated Recurrent Unit,GRU),通过门控循环单元捕捉时序数据的时间相关性;
[0014]步骤g,最终利用softmax分类器输出分类标签。
[0015]所述步骤a中,采用min

max标准化(Min

Max Normalization)方法对轴承信号进行归一化处理,并将其结果映射到[0,255]之间,具体公式为:
[0016][0017]其中,X是原始数据,Xnorm是归一化之后的结果,Xmax是原始数据中最大值,Xmin是原始数据中最小值,这里为了消除小数,使用round函数对数值进行四舍五入。
[0018]所述步骤b中,在转换过程中,采用直接转换的方法,从一维信号中随机截取一段N2的信号,将信号值逐行填充到N
×
N矩阵中,即每N个信号值都可以填充到矩阵的一行中,然后对矩阵进行标准化,从而得到相应的灰度图;填充的数据被归一化为0到255,并且使用零填充来防止数据输入到卷积神经网络时的大小损失。这样做减少了传统信号处理方法造成的数据丢失,提高了模型的整体运行效率。
[0019]所述步骤c中,卷积神经网络采用LeNet

5的结构,结构由两部分组成:卷积编码器:由两个卷积层组成;全连接层密集块:由三个全连接层组成。
[0020]所述步骤d中,利用与卷积神经网络并行的注意力机制模块提取图像的显著性特征,同时注意力机制模块的输出同卷积神经网络的输出维度保持一致,并通过Sigmoid函数将其输出值约束在0

1之间,具体公式为:
[0021][0022]其中,x是注意力机制模块的输出结果。
[0023]本专利技术添加了与CNN模块并行的注意力机制模块,模型可以获得更全面的上下文信息,即可以对从CNN网络提取到的特征进行不同重要程度的区分,将比较重要的特征,通过注意力机制提高其影响程度,从而能够更好地获得灰度图的特征,提高故障诊断任务的准确率;对于非重要特征,则降低其影响程度,抑制非重要特征对模型的干扰能力。
[0024]所述步骤f中,将步骤e提取到的关键特征输入门控循环单元,完整的门控循环单元,包括多个计算单元,其前向传递描述为:
[0025]z
t
=σ(W
xz
x
t
+W
hz
h
t
‑1+b
z
)
[0026]r
t
=σ(W
xr
x
t
+W
hr
h
t
‑1+b
r
)
[0027][0028][0029]y
t
=σ(W
o
·
H
t
)
[0030]其中,z
t
与r
t
表示更新门与重置门;与H
t
为候选隐藏状态与隐藏状态;x
t
为给定时间步t的数据输入;y
t
为输出层输出;W
xz
,W
hz
,W
xr
,W
hr
,W
o
均表示对应环节的权值矩阵;b
z
,b
r
,均表示对应环节的偏置矢量;σ为sigmoid函数;tanh为双曲正切函数;
⊙<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法,其特征在于,包括以下步骤:步骤a,将数据集划分为训练集和测试集,并对其原始信号进行归一化操作;步骤b,将步骤a归一化后的数据转换成对应于不同故障情况的二维灰度图并设置对应的标签;步骤c,将步骤b得到的灰度图像输入卷积神经网络进行特征提取;步骤d,利用注意力机制模块提取图像的显著性特征,并将输出值约束在0

1之间;步骤e,将步骤c从卷积神经网络中提取的特征与其对应的注意力机制模块所输出的显著性特征进行逐元素相乘;步骤f,将步骤e相乘得到的结果输入门控循环单元,通过门控循环单元捕捉时序数据的时间相关性;步骤g,最终利用softmax分类器输出分类标签。2.根据权利要求1所述的基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法,其特征在于,所述步骤a中,采用min

max标准化方法对轴承信号进行归一化处理,并将其结果映射到[0,255]之间,具体公式为:其中,X是原始数据,Xnorm是归一化之后的结果,Xmax是原始数据中最大值,Xmin是原始数据中最小值,这里为了消除小数,使用round函数对数值进行四舍五入。3.根据权利要求1所述的基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法,其特征在于,所述步骤b中,在转换过程中,采用直接转换的方法,从一维信号中随机截取一段N2的信号,将信号值逐行填充到N
×
N矩阵中,即每N个信号值都可以填充到矩阵的一行中,然后对矩阵进行标准化,从而得到相应的灰度图;填充的数据被归一化为0到255,并且使用零填充来防止数据输入到卷积神经网络时的大小损失。4.根据权利要求1所述的基于注意力机制和卷积门控循环单元模型的轴承故障诊断方法,其特征在于,所述步骤c中,卷积神经网络采用LeNet

5的结构,结构由两部分组成:卷积编码器:由两个卷积层组成;全连接层密集块:由三个全连接层组成。5.根据权利要求1所述的基于...

【专利技术属性】
技术研发人员:徐鹏皋军邵星王翠香潘磊
申请(专利权)人:盐城工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1