当前位置: 首页 > 专利查询>河海大学专利>正文

基于增量式Informer算法的设备健康状态预测方法技术

技术编号:36375531 阅读:18 留言:0更新日期:2023-01-18 09:35
本发明专利技术公开了一种基于增量式Informer算法的设备健康状态预测方法,包括S1构建设备状态数据集,获取设备上传感器采样信息与工况信息;S2对数据进行数据预处理,并分为若干个批次序列子集;S3:将数据子集进行第一次增量式Informer训练,将M1作为当前模型M

【技术实现步骤摘要】
基于增量式Informer算法的设备健康状态预测方法


[0001]本专利技术属于技术设备运行状态检测领域,具体涉及一种基于增量式Informer算法的设备健康状态预测方法。

技术介绍

[0002]利用传感器收集的设备信息对设备的运行状态进行预测,不仅可以根据需求对设备进行调整,符合生产要求,还可以提前检修设备,减少损失,防患未然。主流的设备故障预测方法有两大类:基于物理模型的方法和基于数据驱动的方法。前者对先验知识的要求较高,对于未知模型和复杂模型难以实现,后者现主要发展的是基于机器学习的预测方法。传统的时序预测方法如LSTM、RNN、ARIMA等模型都可以进行时序建模,但是大多容易出现梯度消失和梯度爆炸问题,难以用于长时间序列预测问题(LSTF);而目前的算法大多是一次性将已有的数据放入模型进行训练,在实际应用中,随着时间的推移,收集到可用于训练的数据越来越多,模型的预测精度会逐渐降低,而且将新的数据集合并重复训练则比较耗时,容易造成灾难性遗忘问题。
[0003]为了解决上述问题,如Haoyi Zhou等对Transformer进行改造,如下论文: Zhou H,Zhang S,Peng J,et al.Informer:Beyond efficient transformer for long sequence ti meseries forecasting[C]//Proceedings of the AAAI Conference on Artificial Intelligence.2021,35(12):11106

11115.,提出了用于高效解决LSTF问题的Informer模型,不仅提高了预测能力,且提高了长序列预测的推理速度。该方法设计了ProbSparse自注意机制,有效减少时间复杂度和内存使用;其注意力蒸馏和生成式解码器能够有效地处理长序列输入,提高了长序列预测的推理速度,但仍是离线模型,难以根据新生成的数据流做出相应的调整。又如李孟萱等人对LSTM进行改造,如下论文:李孟萱.可增量的集成式LSTM时间序列预测研究[D]中南财经政法大学, 2020.DOI:10.27660/d.cnki.gzczu.2020.000122。该文提出了可增量式的集成式LSTM,实现了LSTM的并行训练和增量更新,但仍未能够很好地解决LSTF问题,而且每次需要重新训练多个弱学习器,学习过程较为繁琐。

技术实现思路

[0004]本专利技术目的在于提出一种基于增量式Informer算法的设备健康状态预测方法,解决现有技术中预测算法长时序预测能力差、模型训练效率低、无法适时更新模型的技术问题。
[0005]为实现上述目的,本专利技术通过以下技术方案实现:
[0006]基于增量式Informer设备健康状态预测训练方法,包括以下步骤:
[0007]步骤S1:构建设备状态数据集,获取相关设备上传感器采样信息与工况信息,采集数据的时间间隔为t,总时长为N个月,N为大于等于3的正整数;
[0008]步骤S2,对步骤S1获得的数据进行数据预处理,并将得到的样本数据按顺序分为
若干个批次序列子集,作为后续模型的输入数据;
[0009]步骤S3,将步骤S2获得的数据子集进行第一次增量式Informer训练,训练结束后,保留模型M1的各项参数和用于预测的样本数据,并将M1作为当前模型M
cur

[0010]步骤S4,使用步骤S3保存的模型M1对未来一个周期时刻的设备健康状态进行预测,并保存用于预测的历史数据和预测数据;
[0011]步骤S5,根据预测数据和工况,判断设备的健康状态;若状态不良则向水电机组管理人员发出预警。
[0012]步骤S6,继续收集下一批传感器的数据,直至满足下一周期预测的需求,将新收集的数据用于微调当前模型,持续增量式训练现有模型M
cur
,重复步骤S5和步骤 S6。
[0013]优选地,所述步骤S2中的预处理具体包括:
[0014]步骤S21,对所得数据样本的三类数据特征进行缺失值填充。对于空冷进口温度等,属于时间上下文关联的可用常数度量的属性,采用基于KNN异常填充的思想,计算缺失值时间附近K个特征值之和,取平均值来插补缺失值。对于工况信息,属于数值等级的属性,采用该特征中出现频率最多的值来插补缺失值;
[0015]步骤S22,根据Z

score标准化方法对步骤S21获得的特征进行标准化处理,有利于提高模型精度和加快求解速度,其转化函数为:
[0016][0017]其中,x

为变换后的数据,x为样本真实数据,为所有样本数据的均值,σ为所有样本数据的标准差;
[0018]步骤S23,采用基于K

means++的离散点检测方式,对S22获得的特征数据进行异常值检测,并处理数据异常值。首先按照工况标记分别进行检测,从步骤S22获得的样本中随机选取1个作为初始质心,计算每个样本到质心的距离。距离的度量方式优选欧式距离。其次计算每个样本点被选为下一个质心概率。概率的计算公式为:
[0019][0020]其中,D(y)为样本y到质心的欧式距离,χ为质心以外的所有样本点,P(y)为被选中的概率。∑
x∈χ
D(x)2为样本质心以外的所有样本点到质心的欧式距离的平方和。
[0021]接着选取概率最接近0.5的点作为下一个质心。重复上述步骤,直至质心的数量达到K个。最后计算所有样本点到质心的距离,如果样本点距离超过相应阈值,则标记为离散点。将标记为离散点的样本替换为其附近K个值的平均值,从而确保数据的准确性;
[0022]步骤S24,采用基于PCA的降低特征维度方式对S23获得的特征进行特征筛选,降低样本特征数量,减少计算开销。
[0023]首先对步骤S22获得的样本计算协方差矩阵,协方差矩阵的计算公式为:
[0024][0025]其中,x
i
,y
i
为不同特征在不同样本上的取值,为特征在样本集中的均值, cov(x,y)为协方差矩阵。
[0026]接着求出cov(x,y)的特征值λ和特征向量v。将特征值λ进行数值比较排序,剔除末尾的特征值。最后将样本集映射到上述保留的特征向量构建的空间中,完成降维工作;
[0027]步骤S25,将时间特征转换成一定维度的时间戳,如[年,月,日,小时,分]。
[0028]步骤S26,在步骤S25处理完成的数据上使用一个时间长度为T的时间窗口进行滑动取样,其中T等于用于预测的历史数据长度和预测数据长度之和,得到N个序列子集并按时间先后进行排序。
[0029]通过步骤S2将经步骤S1所收集到的信息转换为能够用于训练模型的输入数据。
[0030]优选地,所述步骤S3中第一次增量式Informer训练具体包括:
[0031]步骤S31,在进行增量式训练之前,将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于增量式Informer算法的设备健康状态预测方法,其特征在于,包括如下步骤:步骤S1:构建设备状态数据集,获取相关设备上传感器采样信息与工况信息,采集数据的时间间隔为t,总时长为N个月,N为大于等于3的正整数;步骤S2:对步骤S1获得的数据进行数据预处理,并将得到的样本数据按顺序分为若干个批次序列子集,作为后续模型的输入数据;步骤S3:将步骤S2获得的数据子集进行第一次增量式Informer训练,训练结束后,保留模型M1的各项参数和用于预测的样本数据,并将M1作为当前模型M
cur
;步骤S4:使用步骤S3保存的模型M1对未来一个周期时刻的设备健康状态进行预测,并保存用于预测的历史数据和预测数据;步骤S5:根据预测数据和工况,判断设备的健康状态;若状态不良则向设备管理人员发出预警;步骤S6:继续收集下一批传感器的数据,直至满足下一周期预测的需求,将新收集的数据用于微调当前模型,持续增量式训练现有模型M
cur
,重复步骤S5和步骤S6。2.根据权利要求1所述的基于增量式Informer算法的设备健康状态预测方法,其特征在于,所述步骤S2中,数据的预处理预处理具体包括如下步骤:步骤S21:对所得数据样本的三类数据特征进行缺失值填充:对于设备属于时间上下文关联的可用常数度量的数据,采用基于KNN异常填充的思想,计算缺失值时间附近K个特征值之和,取平均值来插补缺失值;对于工况信息数据,属于数值等级的属性,采用该特征中出现频率最多的值来插补缺失值;步骤S22:根据Z

score标准化方法对步骤S21获得的特征进行标准化处理,其转化函数为:其中,x

为变换后的数据,x为样本真实数据,为所有样本数据的均值,σ为所有样本数据的标准差;步骤S23:采用基于K

means++的离散点检测方式,对S22获得的特征数据进行异常值检测,并处理数据异常值;步骤S24:采用基于PCA的降低特征维度方式对S23获得的特征进行特征筛选,降低样本特征数量,减少计算开销;步骤S25:将时间特征转换成一定维度的时间戳;步骤S26:在步骤S25处理完成的数据上使用一个时间长度为T的时间窗口进行滑动取样,其中T等于用于预测的历史数据长度和预测数据长度之和,得到N个序列子集并按时间先后进行排序。3.根据权利要求2所述的基于增量式Informer算法的设备健康状态预测方法,其特征在于,所述步骤S23包括如下步骤:首先,按照工况标记分别进行检测,从步骤S22获得的样本中随机选取1个作为初始质心,计算每个样本到质心的距离,采用欧式距离表示;其次,计算每个样本点被选为下一个质心概率,概率的计算公式为:
其中,D(y)为样本y到质心的欧式距离,χ为质心以外的所有样本点,P(y)为被选中的概率,∑
x∈χ
D(x)2为样本质心以外的所有样本点到质心的欧式距离的平方和,P(y)为被选中的概率;接着选取概率最接近0.5的点作为下一个质心,重复上述步骤,直至质心的数量达到K个;最后计算所有样本点到质心的距离,如果样本点距离超过相应阈值,则标记为离散点;将标记为离散点的样本替换为其附近K个值的平均值,从而确保数据的准确性。4.根据权利要求3所述的基于增量式Informer算法的设备健康状态预测方法,其特征在于,所述步骤S24包括如下步骤:首先对步骤S22获得的样本计算协方差矩阵,协方差矩阵的计算公式为:其中,x
i
,y
i
为不同特征在不同样本上的取值,为特征在样本集中的均值,cov(x,y)为协方差矩阵,n为样本数量;接着求出cov(x,y)的特征值λ和特征向量ν,将特征值λ进行数值比较排序,剔除末尾的特征值;最后将样本集映射到上述保留的特征向量构建的空间中,完成降维工作。5.根据权利要求4所述的基于增量式Informer算法的设备健康状态预测方法,其特征在于,所述步骤S3中,第一次增量式Informer训练具体包括如下步骤:步骤S31:在进行增量式训练之前,将步骤S25中获得的序列子集中获取第一个子集D1,按比例划分训练集和验证集,进行若干次训练得到多个Informer模型,然后对比在测试集上的均方误差MSE,选取MSE最小的模型作为初始模型M0,保留模型参数与训练集数据,其中MSE的计算公式为:其中,y
i
为某一特征在不同样本上的真实取值,为该特征经过模型在不同样本上的预测值,n为样本数量,为测试集上的均方误差;步骤S32:使用当前模型预测下一周期的数据并保存,获取下一个序...

【专利技术属性】
技术研发人员:丁洁赵徐姚
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1