【技术实现步骤摘要】
基于增量式Informer算法的设备健康状态预测方法
[0001]本专利技术属于技术设备运行状态检测领域,具体涉及一种基于增量式Informer算法的设备健康状态预测方法。
技术介绍
[0002]利用传感器收集的设备信息对设备的运行状态进行预测,不仅可以根据需求对设备进行调整,符合生产要求,还可以提前检修设备,减少损失,防患未然。主流的设备故障预测方法有两大类:基于物理模型的方法和基于数据驱动的方法。前者对先验知识的要求较高,对于未知模型和复杂模型难以实现,后者现主要发展的是基于机器学习的预测方法。传统的时序预测方法如LSTM、RNN、ARIMA等模型都可以进行时序建模,但是大多容易出现梯度消失和梯度爆炸问题,难以用于长时间序列预测问题(LSTF);而目前的算法大多是一次性将已有的数据放入模型进行训练,在实际应用中,随着时间的推移,收集到可用于训练的数据越来越多,模型的预测精度会逐渐降低,而且将新的数据集合并重复训练则比较耗时,容易造成灾难性遗忘问题。
[0003]为了解决上述问题,如Haoyi Zhou等对Transformer进行改造,如下论文: Zhou H,Zhang S,Peng J,et al.Informer:Beyond efficient transformer for long sequence ti meseries forecasting[C]//Proceedings of the AAAI Conference on Artificial Intelligence.2021,35( ...
【技术保护点】
【技术特征摘要】
1.基于增量式Informer算法的设备健康状态预测方法,其特征在于,包括如下步骤:步骤S1:构建设备状态数据集,获取相关设备上传感器采样信息与工况信息,采集数据的时间间隔为t,总时长为N个月,N为大于等于3的正整数;步骤S2:对步骤S1获得的数据进行数据预处理,并将得到的样本数据按顺序分为若干个批次序列子集,作为后续模型的输入数据;步骤S3:将步骤S2获得的数据子集进行第一次增量式Informer训练,训练结束后,保留模型M1的各项参数和用于预测的样本数据,并将M1作为当前模型M
cur
;步骤S4:使用步骤S3保存的模型M1对未来一个周期时刻的设备健康状态进行预测,并保存用于预测的历史数据和预测数据;步骤S5:根据预测数据和工况,判断设备的健康状态;若状态不良则向设备管理人员发出预警;步骤S6:继续收集下一批传感器的数据,直至满足下一周期预测的需求,将新收集的数据用于微调当前模型,持续增量式训练现有模型M
cur
,重复步骤S5和步骤S6。2.根据权利要求1所述的基于增量式Informer算法的设备健康状态预测方法,其特征在于,所述步骤S2中,数据的预处理预处理具体包括如下步骤:步骤S21:对所得数据样本的三类数据特征进行缺失值填充:对于设备属于时间上下文关联的可用常数度量的数据,采用基于KNN异常填充的思想,计算缺失值时间附近K个特征值之和,取平均值来插补缺失值;对于工况信息数据,属于数值等级的属性,采用该特征中出现频率最多的值来插补缺失值;步骤S22:根据Z
‑
score标准化方法对步骤S21获得的特征进行标准化处理,其转化函数为:其中,x
′
为变换后的数据,x为样本真实数据,为所有样本数据的均值,σ为所有样本数据的标准差;步骤S23:采用基于K
‑
means++的离散点检测方式,对S22获得的特征数据进行异常值检测,并处理数据异常值;步骤S24:采用基于PCA的降低特征维度方式对S23获得的特征进行特征筛选,降低样本特征数量,减少计算开销;步骤S25:将时间特征转换成一定维度的时间戳;步骤S26:在步骤S25处理完成的数据上使用一个时间长度为T的时间窗口进行滑动取样,其中T等于用于预测的历史数据长度和预测数据长度之和,得到N个序列子集并按时间先后进行排序。3.根据权利要求2所述的基于增量式Informer算法的设备健康状态预测方法,其特征在于,所述步骤S23包括如下步骤:首先,按照工况标记分别进行检测,从步骤S22获得的样本中随机选取1个作为初始质心,计算每个样本到质心的距离,采用欧式距离表示;其次,计算每个样本点被选为下一个质心概率,概率的计算公式为:
其中,D(y)为样本y到质心的欧式距离,χ为质心以外的所有样本点,P(y)为被选中的概率,∑
x∈χ
D(x)2为样本质心以外的所有样本点到质心的欧式距离的平方和,P(y)为被选中的概率;接着选取概率最接近0.5的点作为下一个质心,重复上述步骤,直至质心的数量达到K个;最后计算所有样本点到质心的距离,如果样本点距离超过相应阈值,则标记为离散点;将标记为离散点的样本替换为其附近K个值的平均值,从而确保数据的准确性。4.根据权利要求3所述的基于增量式Informer算法的设备健康状态预测方法,其特征在于,所述步骤S24包括如下步骤:首先对步骤S22获得的样本计算协方差矩阵,协方差矩阵的计算公式为:其中,x
i
,y
i
为不同特征在不同样本上的取值,为特征在样本集中的均值,cov(x,y)为协方差矩阵,n为样本数量;接着求出cov(x,y)的特征值λ和特征向量ν,将特征值λ进行数值比较排序,剔除末尾的特征值;最后将样本集映射到上述保留的特征向量构建的空间中,完成降维工作。5.根据权利要求4所述的基于增量式Informer算法的设备健康状态预测方法,其特征在于,所述步骤S3中,第一次增量式Informer训练具体包括如下步骤:步骤S31:在进行增量式训练之前,将步骤S25中获得的序列子集中获取第一个子集D1,按比例划分训练集和验证集,进行若干次训练得到多个Informer模型,然后对比在测试集上的均方误差MSE,选取MSE最小的模型作为初始模型M0,保留模型参数与训练集数据,其中MSE的计算公式为:其中,y
i
为某一特征在不同样本上的真实取值,为该特征经过模型在不同样本上的预测值,n为样本数量,为测试集上的均方误差;步骤S32:使用当前模型预测下一周期的数据并保存,获取下一个序...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。