一种基于AttentionCNN模型的轴承故障实时智能诊断方法与系统技术方案

技术编号:32343933 阅读:9 留言:0更新日期:2022-02-16 18:58
本发明专利技术给出了一种基于Attention CNN模型的轴承故障实时智能诊断方法与系统,包括使用振动传感器采集故障轴承振动信号,再对故障轴承振动信号采用定长随机分割方法进行分割获得数据样本;对数据样本按照滚动轴承的状态类型贴上各个类型对应的标签之后,再按照一定的比例划分为训练集、验证集和测试集;分别根据所述训练集和所述验证集中的数据制作出多种处于不平衡状态下的轴承故障数据集并将制作出的所有轴承故障数据集构成不平衡数据集;构建上述模型,分别用不同的轴承故障数据集训练上述模型,获得上述训练模型;利用上述训练模型对所述滚动轴承进行实时故障检测。本发明专利技术能够实时、准确、自动地识别轴承的运行状态,从而有效维护机械设备正常运转。有效维护机械设备正常运转。有效维护机械设备正常运转。

【技术实现步骤摘要】
一种基于Attention CNN模型的轴承故障实时智能诊断方法与系统


[0001]本专利技术涉及设备健康管理
,尤其是一种基于Attention CNN模型的轴承故障实时智能诊断方法与系统。

技术介绍

[0002]轴承是现代工业设备关键组成部分,轴承工作场景复杂,一旦发生故障可能会引发严重的安全事故,造成大量人员伤亡和巨大经济损失。轴承是直升机、航空发动机、风力发电机等设备中关键的支撑部件之一,所以能否及时准确的检测出故障,排除机械的安全隐患是至关重要的。因此如何实时、准确、自动的诊断出旋转机械的故障对保证其正常运行和安全生产具有重要意义。
[0003]传统基于信号的方法指利用各种信号分析技术,从时域信号或者频域信号中提取故障特征进行诊断。
[0004]机器学习的方法也被运用于旋转机械的故障诊断,机器学习可以提取特征进行分类,而不需要丰富的专家知识进行判断,减小了诊断的难度。机器学习在故障诊断中使用振动信号作为样本进行输入,然后通过提取特征进行分类。传统的故障分类算法和机器学习算法在故障识别领域都取得了一定的成就,但是传统的故障检测算法依赖专家经验,同时机器学习算法不能很好的学习振动信号中复杂的非线性关系,而且不能够自动提取故障特征,不同类型的故障识别需要设计不同类型的特征提取器。
[0005]深度学习方法在故障识别领域也取得了巨大的发展,它可以从原始的信号中提取深层特征,处理海量复杂数据,并且基于深度学习的方法可以自适应的提取具有代表性的特征,不需要人工干预,且识别故障相比传统的算法具有更高的准确率。在深度学习领域卷积神经网络因为它的卷积和池化操作降低了参数量,通过局部感受野(local receptive fields)和共享权重(shared weights)提高了识别的速度和准确度。
[0006]虽然现有多种旋转机械故障检测模型,并且取得了良好的实验结果,但是在旋转机械故障诊断领域依然存在着许多的挑战。

传统的深度学习故障检测模型为了取得较高的准确率,往往会采用多层神经网络叠加的方式,因此模型复杂度过高。多层网络叠加的模型不仅对训练设备有着极高的要求,也导致训练成功的模型故障检测时间过长,不适用于工业场景下故障实时诊断问题。

深度学习的故障诊断模型需要大量高质量的样本,这样才能保证模型不会出现过拟合。现有的模型都是在样本数量理想的情况下进行实验,实际的工业情况是故障样本少于正常样本,所以数据不平衡现象普遍存在于工业领域。
[0007]针对现有技术的不足,本专利技术提供了一种数据不平衡条件下的基于Attention CNN模型的轴承实时智能故障诊断方法。本专利技术轴承故障检测精度高,检测时间短,并且在不平衡数据情况下也能有高准确率和良好的稳定性。

技术实现思路

[0008]本专利技术提出了一种基于Attention CNN模型的轴承故障实时智能诊断方法与系统,以解决上文提到的现有技术的缺陷。
[0009]在一个方面,本专利技术提出了一种基于Attention CNN模型的轴承故障实时智能诊断方法,该方法包括以下步骤:S1:使用振动传感器采集故障轴承振动信号,再对所述故障轴承振动信号采用定长随机分割方法进行分割获得数据样本;S2:对所述数据样本按照滚动轴承的状态类型贴上各个类型对应的标签之后,再按照一定的比例划分为训练集、验证集和测试集;S3:分别根据所述训练集和所述验证集中的数据制作出多种处于不平衡状态下的轴承故障数据集并将制作出的所有所述轴承故障数据集构成不平衡数据集;S4:构建Attention CNN模型,分别用不同的所述轴承故障数据集训练所述Attention CNN模型,同时用所述测试集进行模型测试,最终获得Attention CNN训练模型;S5:利用所述Attention CNN训练模型对所述滚动轴承进行实时故障检测。
[0010]以上方法首先采用定长随机分割加强数据的随机性,从而加强模型的鲁棒性;其次在构建模型的时候采用批量归一化、Dropout和L2正则化缓解模型过拟合,提高模型检测效率;再通过注意力机制计算特征对最终输出的重要程度,在没有多层神经网络的情况下依然有着出色的故障诊断能力,且在不平衡数据情况下,具有出色的稳定性;在模型训练阶段采用指数衰减学习率和回调函数,防止模型出现过拟合并保存训练过程中的最佳模型;最后,将保存的模型应用于旋转机械实时故障检测;所述Attention CNN模型网络结构包括:卷积层、池化层、Batch Normalization(BN)层、Attention模块、全连接层和分类层。所述卷积层对原始振动信号进行特征提取;所述池化层对卷积层的特征进行下采样,降低模型参数;所述BN层加快网络的拟合速度,加快计算效率;所述Attention模块计算特征对最终输出的重要程度;所述全连接层对特征进行映射;所述分类层对特征进行分类。本专利技术能够实时、准确、自动地识别轴承的运行状态,从而有效维护了机械设备正常运转。
[0011]在具体的实施例中,所述滚动轴承的状态类型分为正常状态和使用电火花加工技术分别对轴承外圈、内圈和滚动体分别制造直径不同的单点缺陷。
[0012]在具体的实施例中,所述分别根据所述训练集和所述验证集中的数据制作出多种处于不平衡状态下的轴承故障数据集,具体包括:分别对所述训练集和所述验证集执行以下操作:在正常数据样本数量固定的情况下,分别按照正常数据与故障数据的比值为多种不同的比例来模拟不同的不平衡状态下的情况;从而分别对所述训练集和所述验证集获得对应的多种处于不平衡状态下的轴承故障数据集。
[0013]在具体的实施例中,所述对所述故障轴承振动信号采用定长随机分割方法进行分割获得数据样本,具体包括:当所述故障轴承振动信号的数据样本的采样数据总长度为Length,并且采样窗口为W,在(0,Length

W)区间内取一个随机数index,则所述数据样本的长度为index + W。这样做的目的在于增强数据的随机性,从而增加模型的鲁棒性。
CNN模型,具体包括:在训练过程中为了防止模型的过拟合,在卷积层使用L2正则化;在训练所述Attention CNN模型的过程中采用指数衰减学习率,能够极大地提高模型训练的效率,先使用较大的学习率快速得到一个较优的解,然后随着迭代的继续,逐步减小学习率,使得模型在训练后期更加的稳定,这种方法可以避免损失平台(loss plateau),是跳出局部最优解的有效策略。 [0017]其中为初始学习率,为最终学习率,为衰减率,decay_step为衰减速度,global_step为当前迭代次数;在训练所述Attention CNN模型的过程中使用回调函数(callback);回调函数可以在刚开始过拟合的时候就中断训练,从而避免用更少的轮次去从头开始训练模型,同时可以直接保存训练过程中出现的最佳模型。
[0018]在训练所述Attention CNN模型的过程中使用Adma优化器和交叉熵损失函数,利用梯度下降算法更新网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Attention CNN模型的轴承故障实时智能诊断方法,其特征在于,包括以下步骤:S1:使用振动传感器采集故障轴承振动信号,再对所述故障轴承振动信号采用定长随机分割方法进行分割获得数据样本;S2:对所述数据样本按照滚动轴承的状态类型贴上各个类型对应的标签之后,再按照一定的比例划分为训练集、验证集和测试集;S3:分别根据所述训练集和所述验证集中的数据制作出多种处于不平衡状态下的轴承故障数据集并将制作出的所有所述轴承故障数据集构成不平衡数据集;S4:构建Attention CNN模型,分别用不同的所述轴承故障数据集训练所述Attention CNN模型,同时用所述测试集进行模型测试,最终获得Attention CNN训练模型;S5:利用所述Attention CNN训练模型对所述滚动轴承进行实时故障检测。2.根据权利要求1所述的方法,其特征在于,所述滚动轴承的状态类型分为正常状态和使用电火花加工技术分别对轴承外圈、内圈和滚动体分别制造直径不同的单点缺陷。3.根据权利要求1所述的方法,其特征在于,所述分别根据所述训练集和所述验证集中的数据制作出多种处于不平衡状态下的轴承故障数据集,具体包括:分别对所述训练集和所述验证集执行以下操作:在正常数据样本数量固定的情况下,分别按照正常数据与故障数据的比值为多种不同的比例来模拟不同的不平衡状态下的情况;从而分别对所述训练集和所述验证集获得对应的多种处于不平衡状态下的轴承故障数据集。4.根据权利要求1所述的方法,其特征在于,所述对所述故障轴承振动信号采用定长随机分割方法进行分割获得数据样本,具体包括:当所述故障轴承振动信号的数据样本的采样数据总长度为Length,并且采样窗口为W,在(0,Length

W)区间内取一个随机数index,则所述数据样本的长度为index + W。5.根据权利要求1所述的方法,其特征在于,所述构建Attention CNN模型的具体步骤包括:T1:构建第一层卷积,第一卷积层为一维卷积神经网络,卷积核的大小设置为64,卷积核的数量设置为32,步长为2,采用Same填充;T2:在所述T1之后加入Batch Normalization;T3:在所述T2之后加入Relu激活函数,利用所述Relu激活函数加速收敛和缓解梯度消失;T4:在所述T3之后引入最大池化层,利用所述最大池化层进行下采样;T5:在所述T4之后引入Dropout,利用所述Dropout让一部分神经元不激活;T6:在所述T5之后引入第二层卷积神经网络,第二卷积层为一维卷积神经网络,设置卷积核的大小和卷积核的数量,并采用Same填充;T7:在所述T6之后加入Batch Normalization;T8: 在所述T7之后加入Relu激活函数;T9: 在所述T8之后引入Flatten层,其中所述Flatten层将高维的特征平铺到一维空间中;
T10: 在所述T9之后加入Attention机制让注意力集中在有故障信息的部分;T11:利用全连接层对所述全连接层机制输出的特征进行映射;T12:分类层的神经元个数等于轴承故障类别总数,采用Softmax激活函数。6.根据权利要求5所述的方法,其特征在于,所述构建Attention CNN模型中的Attention计算步骤包括:将Source中的特征信息当做由若干个&am...

【专利技术属性】
技术研发人员:蔡绍滨陈鑫王宇昊
申请(专利权)人:杭州云智声智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1