一种故障数据标记方法及故障识别装置制造方法及图纸

技术编号:23985371 阅读:31 留言:0更新日期:2020-04-29 13:16
本公开提供了一种故障数据标记方法及故障识别装置,属于数据处理技术领域,包括:获取未标记的故障数据集;用DPCA算法确定截断距离;应用共享邻域算法优化DPCA算法中求局部密度ρ和距离δ的方法,根据DPCA算法绘制故障数据集的聚类中心决策图;应用BIC选择准则优化聚类中心决策图,确认簇类别数及聚类中心;人工研判每个聚类中心所属的故障类别;应用DPCA算法对故障数据集聚类,并以人工研判结果为依据标记每一个数据点,最终形成带标签的故障数据集。该方法避免误识别提高了聚类算法的准确性,自动确定未知数据集中簇类别数,解决了当前聚类算法无法对簇类别数未知的数据集进行标记的问题。

A fault data marking method and fault identification device

【技术实现步骤摘要】
一种故障数据标记方法及故障识别装置
本专利技术涉及数据处理领域,特别涉及一种故障数据标记方法及故障识别装置。
技术介绍
有数据表明,除去飞行员人为操作失误导致的事故,有52%的飞行器硬件故障为飞行系统故障,而在飞行系统故障中有36%的故障为动力系统故障。航空发动机作为整个飞行系统的动力中心,有着构造复杂且工作环境恶劣的特点。如何保障其安全平稳的运行,是对航空发动机维修与保障技术一个挑战。航空发动机故障诊断技术可以对与发动机工作状态紧密相关的各种参数实施监测,判断或预报故障类型,在保障飞行安全的同时也可以提高维修效率。这些对于航空工业以及航空运输业都有着重大意义和深远影响。随着数据挖掘与处理技术的日渐成熟,机载监控设备以及地面嵌入式子系统的日渐完善,基于信息融合技术的航空发动机故障诊断方法也随之兴起并被广泛应用在航空发动机故障诊断领域。一篇于2015年发表于“自动化仪表”第36卷第1期的名称为“航空发动机气路改进神经网络故障诊断研究”的文章,应用改进型的BP神经网络对航空发动机气路数据进行了分析与研究;一篇于2017年发表于“推进技术”第38卷第5期的名称为“基于监督流形学习的航空发动机振动故障诊断方法”的文章,在应用流形学习对航空发动机进行故障提取后,应用带有RBF核的支持向量机以及K-近邻分类器对特征数据进行分类处理;一篇于2017年发表于“推进技术”第38卷第11期的名称为“应用深度核极限学习机的航空发动机部件故障诊断”的文章,提出了应用深度核极限学习机的航空发动机部件故障诊断技术。这些技术的诞生及应用对航空发动机故障诊断技术有着很高的应用价值。然而,这些基于有监督学习发展出来的航空发动机故障诊断技术都需要大量而准确的有标记数据对故障诊断模型进行训练后才能精准的完成故障诊断任务。因此,如何对未知的航空发动机数据进行数据标注,使其成为能够为故障诊断模型提供数据支持的训练数据集是一个十分值得研究的课题。随着数据记录及存储技术的发展,各行各业包括航空工业及航空运输业所产生的数据呈爆炸性增长,传统的人工数据标注方法已经无法满足行业需求。聚类算法作为一种无监督学习的算法,可以不经过训练,直接从数据的内部结构入手,对未标记的数据集进行分类与标记。一篇于2015年发表于“计算机工程与设计”的名称为“基于聚类和拟合的QAR数据离群点检测算法”的文章,在航空发动机故障诊断领域,提出了一种基于K-means与最小二乘法的航空发动机QAR数据离群点研究;一篇于2014年发表于“振动与冲击”第33卷第1期的名称为“基于相似性传播聚类的航空发动机突发故障诊断”的文章,将相似性传播聚类算法应用于航空发动机突发故障诊断;一篇于2015年发表于“南昌航空大学”的名称为“基于网格细化小波聚类的航空发动机转子系统故障诊断》应用基于网格细化小波聚类算法对航空发动机转子系统进行了故障分类。当前故障数据进行分析的聚类算法均需要在分类之前确定待分类数据集中簇类别数或是簇类别数的大概范围,对于簇类别数未知的数据集分类能力有限,因此无法对簇类别数未知的故障数据集进行标记。
技术实现思路
有鉴于此,本专利技术提供了一种故障数据标记方法及故障识别装置,本专利技术的技术方案如下:第一方面,本专利技术提供了一种故障数据标记方法,包括如下步骤:步骤1:获取未标记的故障数据集;步骤2:确定截断距离;步骤3:求出故障数据集中每一个数据点的局部密度ρ和距离δ;步骤4:绘制出故障数据集的聚类中心决策图;步骤5:优化故障数据集的聚类中心决策图,确认最终的簇类别数及聚类中心;步骤6:人工研判每个聚类中心所属的故障类别;步骤7:对故障数据集进行聚类,标记每一个数据点,最终形成带标签的故障数据集。根据本专利技术实施例的一种具体实现方式,所述步骤1包括如下步骤:步骤1.1:获取未标记的故障数据集;步骤1.2:选取典型参数,建立故障模型;步骤1.3:故障类别分类。根据本专利技术实施例的一种具体实现方式,所述步骤2采用DPCA算法确定截断距离的方法:选取截断距离,使得平均每个数据点,在以截断距离为半径的邻域内,数据点的个数不超过总数据点数的2%。根据本专利技术实施例的一种具体实现方式,所述步骤3应用共享邻域算法对DPCA中求局部密度ρ和距离δ的方法优化后的求解方式为:其中:Wij:第i个数据点与第j个数据点的相似度;dcut:截断距离;CNN(si,sj):第i个数据点与第j个数据点在以dcut为半径的邻域的交集中数据点的个数;si:第i个数据点;sj:第j个数据点。根据本专利技术实施例的一种具体实现方式,所述步骤4绘制故障数据集的聚类中心决策图的方法为:以局部密度ρ为横轴,距离δ为纵轴画出聚类中心决策图。根据本专利技术实施例的一种具体实现方式,所述步骤5,应用BIC选择准则对DPCA算法画出的故障数据决策图进行优化,BIC选择准则的计算公式为:BIC=kln(n)-2ln(L),其中k为簇类别数,n为数据集中数据点总数量,L为似然函数。根据本专利技术实施例的一种具体实现方式,所述的BIC选择准则,分别计算k取不同值时的BIC值,选取BIC值最小时k的取值作为最终的簇类别数。根据本专利技术实施例的一种具体实现方式,所述步骤6,参照步骤1.3故障类别分类,对每个聚类中心进行人工研判,判断每个聚类中心所属的故障类别。根据本专利技术实施例的一种具体实现方式,所述步骤7,以步骤5中确定的聚类中心点及簇类别数为基础,应用DPCA算法中的数据聚类方法对故障数据集进行聚类,并以步骤6中的人工研判结果为依据对每一个数据点进行标记,最终形成带标签的故障数据集。第二方面,本专利技术提供了一种故障识别装置,利用故障数据标记方法进行故障识别。根据本专利技术实施例的一种具体实现方式,所述故障识别装置包括:获取模块,用于未标记的故障数据集;第一计算模块,用于对未标记的故障数据集进行聚类计算,确认最终的簇类别数及聚类中心;判断模块,用于人工研判每个聚类中心所属的故障类别;第二计算模块,用于对人工研判后的故障数据集进行聚类,标记每一个数据点,最终形成带标签的故障数据集;输出模块,用于输出故障识别结果。本专利技术提出一种故障数据标记方法及故障识别装置,算法过程应用共享邻域(Sharedneighborhood)算法优化DPCA中求局部密度ρ和距离δ的方法,避免误识别,提高了聚类算法的准确性,应用BIC准则优化了DPCA算法画出的故障数据决策图,自动确定未知数据集中簇类别数,解决了当前聚类算法无法对簇类别数未知的故障数据集进行标记的问题。附图说明图1为本专利技术提供的一种故障数据标记方法示意图;图2为航空发动机气路部件故障的危害列表示意图;图3为航空发动机气路部件故障数据示意图;图4为DPCA算法流程示意图;图5为簇类别数选择缺陷示意图;<本文档来自技高网
...

【技术保护点】
1.一种故障数据标记方法,其特征在于,步骤如下:/n步骤1:获取未标记的故障数据集;/n步骤2:确定截断距离;/n步骤3:求出故障数据集中每一个数据点的局部密度ρ和距离δ;/n步骤4:绘制出故障数据集的聚类中心决策图;/n步骤5:优化故障数据集的聚类中心决策图,确认最终的簇类别数及聚类中心;/n步骤6:人工研判每个聚类中心所属的故障类别;/n步骤7:对故障数据集进行聚类,标记每一个数据点,最终形成带标签的故障数据集。/n

【技术特征摘要】
1.一种故障数据标记方法,其特征在于,步骤如下:
步骤1:获取未标记的故障数据集;
步骤2:确定截断距离;
步骤3:求出故障数据集中每一个数据点的局部密度ρ和距离δ;
步骤4:绘制出故障数据集的聚类中心决策图;
步骤5:优化故障数据集的聚类中心决策图,确认最终的簇类别数及聚类中心;
步骤6:人工研判每个聚类中心所属的故障类别;
步骤7:对故障数据集进行聚类,标记每一个数据点,最终形成带标签的故障数据集。


2.根据权利要求1所述的故障数据标记方法,其特征在于,所述的步骤1包括如下步骤:
步骤1.1:获取未标记的故障数据集;
步骤1.2:选取典型参数,建立故障模型;
步骤1.3:故障类别分类。


3.根据权利要求1所述的故障数据标记方法,其特征在于,所述的步骤2采用DPCA算法确定截断距离的方法:选取截断距离dcut,使得平均每个数据点,在以截断距离为半径的邻域内,数据点的个数不超过总数据点数的2%。


4.根据权利要求1所述的故障数据标记方法,其特征在于,所述的步骤3应用共享邻域算法对DPCA中求局部密度ρ和距离δ的方法优化后的求解方式为:






其中:
Wij:第i个数据点与第j个数据点的相似度;
dcut:截断距离;
CNN(si,sj):第i个数据点与第j个数据点在以dcut为半径的邻域的交集中数据点的个数;
si:第i个数据点;
sj:第j个数据点。


5.根据权利要求1所述的故障数据标记方法,其特征在于...

【专利技术属性】
技术研发人员:程弓周之曾祥熙梁宇凡李玉基史睿冰杨宁国张鹏张玉忠李涛李士华赵慧赟孙明月赫赤董光玲
申请(专利权)人:中国人民解放军六三八五零部队中国人民解放军空军工程大学装备管理与无人机工程学院
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1