当前位置: 首页 > 专利查询>浙江大学专利>正文

基于注意力机制与神经网络的复杂装备健康状态监测方法技术

技术编号:20545796 阅读:58 留言:0更新日期:2019-03-09 18:44
本发明专利技术公开了一种基于注意力机制与神经网络的复杂装备健康状态监测方法。主要步骤为:获取复杂装备的多传感数据;进行特征选择获得有效测量数据;预处理得到多个切片样本;建立融合了注意力机制和深度神经网络的神经网络分类模型;将切片样本与其对应的标签输入到神经网络分类模型中离线训练神经网络分类模型;将待预测的多传感数据的切片样本输入到训练好的神经网络分类模型中,得到复杂装备的健康状态。本发明专利技术考虑到了多传感器信号的数据特征,充分挖掘了数据中的局部特征和时序信息,预测精度高,适用性广,能广泛应用于各种复杂装备中。

Health Monitoring Method for Complex Equipment Based on Attention Mechanism and Neural Network

The invention discloses a health condition monitoring method for complex equipment based on attention mechanism and neural network. The main steps are as follows: acquiring multi-sensor data of complex equipment; selecting features to obtain effective measurement data; preprocessing to obtain multiple slice samples; establishing a neural network classification model that integrates attention mechanism and deep neural network; inputting slice samples and their corresponding labels into the neural network classification model to train the neural network classification model offline; and putting more to be predicted. The slice samples of sensor data are input into the trained neural network classification model to get the health status of complex equipment. The method takes into account the data characteristics of multi-sensor signals, fully excavates the local features and time sequence information of data, has high prediction accuracy and wide applicability, and can be widely used in various complex equipment.

【技术实现步骤摘要】
基于注意力机制与神经网络的复杂装备健康状态监测方法
本专利技术涉及了一种复杂装备状态监测方法,尤其是涉及了一种基于注意力机制与神经网络的复杂装备健康状态监测方法,属于系统健康管理领域。
技术介绍
在工业生产上,对复杂装备的健康状态进行实时监测是非常有意义的,其能提供视情维护能力,为维修活动提供指导。还可以缩减检查成本、降低全寿命周期的成本,避免不必要的开销。还可以及时监测出装备的使用情况,使技术员能及时作出相关调整。基于神经网络的监测模型已经成为复杂装备视情维护中常用的方法之一。基于神经网络的监测模型依赖于大量且有效的历史数据,而实际应用中复杂装备的历史运行数据较难获取。即使能获取,这些数据通常是不完整的且含有一定噪声,这就对神经网络模型的要求非常高,否则模型预测准确率将会降低。准确率相对较低是基于神经网络的监测方法面临的主要技术难点。在基于神经网络的监测模型中,常用的方法有多层感知机(MLP)、循环神经网络(RNN)、长短期记忆网络(LSTM)和卷积神经网络(CNN)等。多层感知机模型是最常用的神经网络,但其特征提取能力不强,当隐藏层较多时容易产生梯度扩散消失问题,且不能直接处理时序信号;传统的循环神经网络可以处理时序信号,但其存在梯度消失和梯度爆炸的问题,在长序列时序信号上效果较差;长短期记忆网络克服了传统循环神经网络的缺点,对长序列时序信号有较好的处理能力,但其特征提取能力不强;卷积神经网络具有较强的特征提取能力,但其也无法直接处理时序信号。以上就是基于神经网络的健康状态监测方法的主要缺点和不足。
技术实现思路
为了解决
技术介绍
中存在的问题,本专利技术提出了一种基于深度神经网络的复杂装备健康状态监测方法。该方法能克服上述已有方法的不足,提高了神经网络模型的准确率,为技术人员提供了参考信息,为设备的正常运行提供了保障。且该方法能广泛应用于各种复杂装备中。为达到上述目的,本专利技术中模型的建立包括以下具体步骤:S1.获取复杂装备的多传感数据;S2.对多传感数据进行特征选择,获得有效测量数据;S3.对有效测量数据进行预处理,包括利用数据均值对缺失值进行填充、对各数据进行标准化处理以及对数据进行切片处理,得到多个切片样本;S4.建立融合了注意力机制和深度神经网络的用于健康状态监测的神经网络分类模型;S5.针对复杂装备已作健康状态标签标记的多传感数据进行步骤S1~S3后与其对应的标签输入到神经网络分类模型中,离线训练神经网络分类模型;S6.针对复杂装备需要预测的多传感数据进行步骤S1~S3后输入到训练好的神经网络分类模型中,得到复杂装备的健康状态。所述的复杂装备包括涡轮发动机、水轮机、数控机床、风机和机车等。所述步骤S1中通过多种传感器分别间隔采样采集获得多方面的测量数据,作为多传感数据。具体实施中采集21种不同的传感数据值,形成21维数据充分代表了复杂装备的运行状态。所述步骤S2中,根据方差特征选择原则,从多传感数据中选取方差大于特征阈值的传感数据作为有效特征,具体针对每种传感数据,计算每种传感数据所有时刻的方差值,将方差值和特征阈值比较,具体实施设定特征的特征阈值为10-8,经过特征选取后保留下来的形成有效测量数据。所述步骤S3具体如下:S31.对于有效测量数据中存在的缺失值,求出数据的均值,利用均值作为填充值对缺失值进行数据填充;所述的缺失值是指有效测量数据在某一时刻采集时由于由于传感器本身故障或数据处理软件缺陷等原因造成的空缺值。S32.对数据填充后的有效测量数据进行标准化处理,将各有效测量数据转换为均值为0、方差为1的无量纲数据序列;S33.对无量纲数据序列进行切片处理,切片的时间长度为30,时间步长为1,获得多个切片样本。本专利技术在神经网络分类模型中,输出为健康状态类别。所述步骤S4中,所述的神经网络分类模型构建为:S41.构造连续三层卷积神经网络,前两层卷积神经网络均包括连续依次连接的一个卷积层和一个池化层,第三层卷积神经网络只有一个卷积层;卷积层均由K个卷积滤波器组成,K个卷积滤波器的大小相同,但卷积滤波器的内部权值不同,对输入的数据进行卷积得到K个特征图谱;池化层采取最大池化策略,分别对卷积层输出的各个特征图谱进行池化操作,得到池化后的特征图谱;步骤S3获得切片数据输入到第一层卷积神经网络的卷积层,经卷积层卷积处理后获得多幅特征图谱,多幅特征图谱经池化层池化后输入到第二层卷积神经网络的卷积层再次进行卷积处理,卷积后再次进行池化处理,池化后的多幅特征图谱输入到第三层卷积神经网络的卷积层进行卷积处理。三层卷积神经网络具有很强的特征提取能力,能很好的提取输入数据中的重要局部特征,同时也能实现较好的去噪效果,降低数据规模。其中第三层卷积神经网络只包含一个卷积层,且其卷积滤波器数量为1,可以实现将之前的多幅特征图谱转换为单幅特征图谱,方便后续网络对数据的处理,提高预测精度。三层卷积神经网络中的两个卷积层的卷积滤波器数量和尺寸设置均有不同。S42.在三层卷积神经网络之后,构建尺寸转换层(Reshape),第三层卷积神经网络输出的特征图谱通过尺寸转换层转化为后面长短期记忆网络(LSTM)的输入数据;S43.尺寸转换层之后构造第一层长短期记忆网络,第一层长短期记忆网络中包括N个长短时记忆单元;S44.第一层长短期记忆网络之后构造第二层长短期记忆网络,第二层长短期记忆网络中包括N个长短时记忆单元;S45.第二层长短期记忆网络之后构建注意力机制层,注意力机制层添加注意力机制函数;S46.注意力机制层之后构造第三层长短期记忆网络,第三层长短期记忆网络中包括同样N个长短时记忆单元;尺寸转换层输出的数据分别输入到第一层长短期记忆网络的各个长短时记忆单元中,经各个长短时记忆单元处理输入到第二层长短期记忆网络的各个长短时记忆单元中,经各个长短时记忆单元处理输入到注意力机制层,经注意力机制层进行权重处理后再输入到第三层长短期记忆网络的各个长短时记忆单元中,最后经各个长短时记忆单元处理输出;具体实施中,三层长短期记忆网络的长短时记忆单元的个数均为20个。S47.在第三层长短期记忆网络的最后一个长短时记忆单元之后连接构建连续的两个全连接层,第一层全连接神经元个数为10,第二层全连接层神经元个数为15;S48.构建输出层,输出层神经元个数设置为4,输出复杂装备的四种健康状态类别,分别为健康、中等、退化和故障。所述的神经网络分类模型都包括三层卷积神经网络、三层长短期记忆网络和两层全连接网络,在第二层长短期记忆网络和第三层长短期记忆网络中间连接注意力机制层,通过长短期记忆网络和注意力机制层的设计融合能实现对复杂装备的健康状态监测。同时本专利技术在模型中加入三个dropout层,能够避免出现过拟合现象。第三层卷积神经网络、第一层全连接网络和第二层全连接网络后均设有dropout层,dropout层的dropout率均设置为0.3。对于神经网络分类模型,所述的输出层的激活函数选择softmax进行分类,模型损失函数选择交叉熵损失函数(categoricalcrossentropy)函数。选用Adam优化算法,学习率设置为0.001,利用已作健康状态标签标记的多传感数据处理获得切片样本离线训练深度神经网络模型。本专利技术首先使用卷积神经网络作为特本文档来自技高网...

【技术保护点】
1.基于注意力机制与神经网络的复杂装备健康状态监测方法,其特征在于:包括以下步骤:S1.获取复杂装备的多传感数据;S2.对多传感数据进行特征选择,获得有效测量数据;S3.对有效测量数据进行预处理,包括利用数据均值对缺失值进行填充、对各数据进行标准化处理以及对数据进行切片处理,得到多个切片样本;S4.建立融合了注意力机制和深度神经网络的神经网络分类模型;S5.针对复杂装备已作健康状态标签标记的多传感数据进行步骤S1~S3后与其对应的标签输入到神经网络分类模型中,离线训练神经网络分类模型;S6.针对复杂装备需要预测的多传感数据进行步骤S1~S3后输入到训练好的神经网络分类模型中,得到复杂装备的健康状态。

【技术特征摘要】
1.基于注意力机制与神经网络的复杂装备健康状态监测方法,其特征在于:包括以下步骤:S1.获取复杂装备的多传感数据;S2.对多传感数据进行特征选择,获得有效测量数据;S3.对有效测量数据进行预处理,包括利用数据均值对缺失值进行填充、对各数据进行标准化处理以及对数据进行切片处理,得到多个切片样本;S4.建立融合了注意力机制和深度神经网络的神经网络分类模型;S5.针对复杂装备已作健康状态标签标记的多传感数据进行步骤S1~S3后与其对应的标签输入到神经网络分类模型中,离线训练神经网络分类模型;S6.针对复杂装备需要预测的多传感数据进行步骤S1~S3后输入到训练好的神经网络分类模型中,得到复杂装备的健康状态。2.根据权利要求1所述的基于注意力机制与神经网络的复杂装备健康状态监测方法,其特征在于:所述步骤S1中通过多种传感器分别间隔采样采集获得多方面的测量数据,作为多传感数据。3.根据权利要求1所述的基于注意力机制与神经网络的复杂装备健康状态监测方法,其特征在于:所述步骤S2中,根据方差特征选择原则,从多传感数据中选取方差大于特征阈值的传感数据作为有效特征,经过特征选取后保留下来的形成有效测量数据。4.根据权利要求1所述的基于注意力机制与神经网络的复杂装备健康状态监测方法,其特征在于:所述步骤S3具体如下:S31.对于有效测量数据中存在的缺失值,求出数据的均值,利用均值作为填充值对缺失值进行数据填充;S32.对数据填充后的有效测量数据进行标准化处理,将各有效测量数据转换为均值为0、方差为1的无量纲数据序列;S33.对无量纲数据序列进行切片处理,切片的时间长度为30,时间步长为1,获得多个切片样本。5.根据权利要求1所述的基于注意力机制与神经网络的复杂装备健康状态监测方法,其特征在于:所述步骤S4中,所述的神经网络分类模型构建为:S41.构造连续三层卷积神经网络,前两层卷积神经网络均包括连续依次连接的一个卷积层和一个池化层,第三层卷积神经网络只有一个卷积层;卷积层均由K个卷积滤波器组成,K个卷积滤波器的大小相同,但卷积滤波器的内部权值不同,对输入的数据...

【专利技术属性】
技术研发人员:刘振宇刘惠郏维强张栋豪谭建荣
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1