基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法技术

技术编号:21141379 阅读:17 留言:0更新日期:2019-05-18 05:14
本发明专利技术公开了一种基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法,包括以下步骤:首先利用相关性指标和趋势性指标,对发动机训练数据集进行特征筛选;然后利用量子模糊聚类得到的健康状态标签,并训练多变量深度森林分类器,得到航空发动机健康评估模型;同时利用发动机训练数据集,训练长短周期记忆神经网络(LSTM)时间序列预测模型;最后利用发动机测试数据集,根据训练好的健康评估模型和时间序列预测模型,得到发动机不同健康阶段的维持时间和最终的剩余使用寿命(RUL)。本发明专利技术克服了观测数据存在的无标签、不均衡和初值不确定性,为航空发动机后续不同健康阶段的维修决策提供了技术参考。

Aeroengine Life Prediction Method Based on Labelless, Unbalanced and Initial Uncertain Data

【技术实现步骤摘要】
基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法
本专利技术涉及一种航空发动机寿命预测方法,特别是涉及一种基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法。
技术介绍
发动机是航空器中结构最为精密复杂的子系统,为航空器提供飞行所需的动力,对安全性和可靠性要求极为苛刻。发动机在极端使用环境下长时连续工作过程中,其性能不可避免地产生退化,极易引发各类故障,威胁系统安全。以健康评估和故障预测为核心的PHM技术,是实现航空发动机预测维护和保障发动机运行可靠性的关键,已成为航空领域的关注焦点。近几年来,由于大数据分析技术、云计算技术及人工智能技术的推动,工业4.0及中国制造2025等概念的提出,使得航空发动机运行期间的观测数据,已成为发动机检测故障、预测故障发展趋势以及最终剩余使用寿命的高价值资源。相对于基于模型的寿命预测方法,数据驱动的方法不需要发动机退化过程的精确解析模型,通过对观测数据直接处理与分析,挖掘出数据背后隐藏的发动机健康状态和寿命信息,为故障预测与维护决策提供可靠信息。现有数据驱动的寿命预测方法又可细分为三类:单变量方法,直接方法和多变量方法。单变量方法首先建立一个综合健康度指标(SHI),利用事先设定的失效阈值确定系统的RUL。SHI构建和阈值确定这两个步骤极度依赖于应用对象的领域知识,是这类方法在实际应用中的掣肘问题。直接方法则是通过将当前样本与数据库中的历史样本进行相似度匹配,寻找出最为相似的样本作为参照进行RUL预测。这类方法在样本充足完备的条件下,具有良好的性能和普适性。多变量方法不需要构建SHI,也不需要大量历史样本,直接利用设备运行数据,提取和系统健康状态退化相关的特征量,通过聚类方法对设备健康状态的特征量进行分类,进而获知设备所处的健康阶段信息,动态设定设备的失效阈值,再进行RUL预测。该方法可克服单变量方法和直接方法的不足或约束,近年来颇受PHM领域的关注。然而,现有的多变量方法需要事先设定健康状态的类别个数,而且需要假定所有样本的初始都处于健康状态,也难以基于现实中发动机传感器采集的无标签、不均衡且初值不确定的数据来做出预测。
技术实现思路
专利技术目的:本专利技术要解决的技术问题是提供一种基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法,在现有航空发动机观测数据存在无标签、不均衡、初值不确定性问题的情况下,解决了现有的多变量方法不能基于上述观测数据进行很好预测的不足,能够在缺少先验知识情况下,实现航空发动机不同健康阶段的维持时间和RUL预测,为航空发动机后续不同健康阶段的维修决策提供技术参考。技术方案:本专利技术所述的基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法,包括以下步骤:(1)根据定义的相关性指标和趋势性指标,对发动机性能退化数据集X(I×J×K)进行特征选择,其中,I为相似发动机样本个数,J为每个发动机样本中各传感器输出的观测变量个数,Ki为每个发动机样本的观测数据个数,i=1,2,...,I;(2)根据步骤(1)的特征选择结果,将发动机样本中观测变量个数由J个减少为F个,得到代表发动机性能退化数据集的三维矩阵X(I×F×K);(3)将三维矩阵X(I×F×K)按变量按F方向展开为一个二维数据集X(Z×F)(Z=K1+K2+...+KI),利用量子聚类理论得到二维数据集X(Z×F)的势能分布,确定所述发动机性能退化数据集的类别数量C,根据类别数量C利用模糊聚类理论得到发动机性能退化数据集的健康度标签Tag;(4)将步骤(3)中所述的二维数据集X(Z×F)和健康标签Tag中前90%的样本作为训练集、后10%的样本作为验证集,训练多变量深度森林分类器,若验证的集中分类准确率均大于90%,则保留所训练的多变量深度森林模型后结束训练,否则重新训练,直到满足条件为止;(5)分别针对步骤(3)所述的二维数据集X(Z×F)中每个特征变量f进行LSTM网络训练。最终可以得到F个LSTM时间序列预测模型,本步骤可以与步骤(4)先后进行或者同时进行;(6)利用步骤(5)中的F个LSTM时间序列预测模型,分别预测不同观测变量的变化趋势,将各变化趋势输入到步骤(3)中训练好的多变量深度森林模型中,得到测试数据集以及预测值的健康状态,根据不同健康状态对应的时间和预测开始,计算得到发动机不同健康阶段的维持时间和RUL。进一步的,步骤(1)中的特征选择过程为:(1)建立相关性指标Corr(i,j)和趋势性指标Tre(j)如下:其中,其中,j(Ki)为发动机样本i的第j个观测变量,Corr(i,j)是特征序列j(Ki)与其序列长度k=1,2,3,...Ki的斯皮尔曼相关系数,r2(j(Ki))为秩次的差值的平方;(2)分别计算发动机各观测变量与其运行周期的相关性指标Corr(i,j),并计算各变量的趋势性指标Tre(j);(3)如果第j个观测变量同时满足|Corr(i,j)|≥0.5和Tre(j)==0or1这两个条件,则此观测变量被选择保留下来。进一步的,步骤(3)中确定类别数量C的方法为:(1)建立势能函数U(x):其中,E是Hamilton算子的特征值,E=d/2,d为Hamilton算子可能的最小特征值,可以用样本的数据维数来表示,ψ为带有Parzen窗的高斯核函数估计波函数,σ为波函数宽度调节参数;(2)通过判断势能函数的局部极小值点,极小值点的数量即为类别数量C。进一步的,步骤(4)中所述的多变量深度森林分类器参数为:n_cascadeRF=2,n_cascadeRFtree=101,cascade_test_size=0.2,tolance=0,其中,n_cascadeRF代表每层完全随机森林或随机森林中的数量,n_cascadeRFtree代表每层中单个完全随机森林或随机森林包含的完全随机决策树或随机决策树的数量,cascade_test_size代表验证样本所占训练样本的比例,tolance代表级联层扩展的精度差。为了对预测结果进行评分,还包括对预测结果评分的方法,评分s表达式为:其中,n是测试样本个数,是预测的RUL,tRUL是真实的RUL,a1和a2为设定的整数值,当-a1≤d<a2时,视为及时预测,当d<-a1时,视为超前预测,当d≥a2时,视为滞后预测。进一步的,a1=10,a2=13。有益效果:本方法能够很好的处理观测数据存在的无标签、不均衡和初值不确定的问题,不需要融合发动机多源数据来构建SHI,同时也不依赖先验知识设定发动机失效阈值,能够动态设定发动机的失效阈值,除了预测出发动机最终的RUL,还能够提供发动机维持在不同健康阶段的时间,同时给出不同时刻健康阶段的概率值。附图说明图1是本方法整体流程图;图2是训练数据集发动机1中传感器1、2和7变化情况及平滑示意图;图3是为传感器1、4、9和13在训练集不同发动机样本中的相关性指标示意图;图4是基于深度森林的健康评估框架示意图;图5是深度森林的概率结果示意图;图6是利用深度森林健康评估模型得到的发动机样本94和99训练结果示意图;图7是基本的LSTM时间序列预测模型框架示意图;图8是LSTM不同阶段方向传播误差示意图;图9是利用LSTM时间序列预测模型预测得到的测试集中发动机1各传感器本文档来自技高网
...

【技术保护点】
1.一种基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法,其特征在于包括以下步骤:(1)根据定义的相关性指标和趋势性指标,对发动机性能退化数据集X(I×J×K)进行特征选择,其中,I为相似发动机样本个数,J为每个发动机样本中各传感器输出的观测变量个数,Ki为每个发动机样本的观测数据个数,i=1,2,...,I;(2)根据步骤(1)的特征选择结果,将发动机样本中观测变量个数由J个减少为F个,得到代表发动机性能退化数据集的三维矩阵X(I×F×K);(3)将三维矩阵X(I×F×K)按变量按F方向展开为一个二维数据集X(Z×F)(Z=K1+K2+...+KI),利用量子聚类理论得到二维数据集X(Z×F)的势能分布,确定所述发动机性能退化数据集的类别数量C,根据类别数量C利用模糊聚类理论得到发动机性能退化数据集的健康度标签Tag;(4)将步骤(3)中所述的二维数据集X(Z×F)和健康标签Tag中前90%的样本作为训练集、后10%的样本作为验证集,训练多变量深度森林分类器,若验证的集中分类准确率均大于90%,则保留所训练的多变量深度森林模型后结束训练,否则重新训练,直到满足条件为止;(5)分别针对步骤(3)所述的二维数据集X(Z×F)中每个特征变量f进行LSTM网络训练,最终可以得到F个LSTM时间序列预测模型,本步骤可以与步骤(4)先后进行或者同时进行;(6)利用步骤(5)中的F个LSTM时间序列预测模型,分别预测不同观测变量的变化趋势,将各变化趋势输入到步骤(3)中训练好的多变量深度森林模型中,得到测试数据集以及预测值的健康状态,根据不同健康状态对应的时间和预测开始,计算得到发动机不同健康阶段的维持时间和RUL。...

【技术特征摘要】
1.一种基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法,其特征在于包括以下步骤:(1)根据定义的相关性指标和趋势性指标,对发动机性能退化数据集X(I×J×K)进行特征选择,其中,I为相似发动机样本个数,J为每个发动机样本中各传感器输出的观测变量个数,Ki为每个发动机样本的观测数据个数,i=1,2,...,I;(2)根据步骤(1)的特征选择结果,将发动机样本中观测变量个数由J个减少为F个,得到代表发动机性能退化数据集的三维矩阵X(I×F×K);(3)将三维矩阵X(I×F×K)按变量按F方向展开为一个二维数据集X(Z×F)(Z=K1+K2+...+KI),利用量子聚类理论得到二维数据集X(Z×F)的势能分布,确定所述发动机性能退化数据集的类别数量C,根据类别数量C利用模糊聚类理论得到发动机性能退化数据集的健康度标签Tag;(4)将步骤(3)中所述的二维数据集X(Z×F)和健康标签Tag中前90%的样本作为训练集、后10%的样本作为验证集,训练多变量深度森林分类器,若验证的集中分类准确率均大于90%,则保留所训练的多变量深度森林模型后结束训练,否则重新训练,直到满足条件为止;(5)分别针对步骤(3)所述的二维数据集X(Z×F)中每个特征变量f进行LSTM网络训练,最终可以得到F个LSTM时间序列预测模型,本步骤可以与步骤(4)先后进行或者同时进行;(6)利用步骤(5)中的F个LSTM时间序列预测模型,分别预测不同观测变量的变化趋势,将各变化趋势输入到步骤(3)中训练好的多变量深度森林模型中,得到测试数据集以及预测值的健康状态,根据不同健康状态对应的时间和预测开始,计算得到发动机不同健康阶段的维持时间和RUL。2.根据权利要求1所述的基于无标签、不均衡、初值不确定数据的航空发动机寿命预测方法,其特征在于步骤(1)中的特征选择过程为:(1)建立相关性指标Corr(i,j)和趋势性指标Tre(j)如下:其中,其中,j(Ki)为发动机样本i的第j个观测变量,Corr(i,j)是特征序列j(Ki)与其序列长度...

【专利技术属性】
技术研发人员:王村松陆宁云程月华姜斌
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1