基于少数类过采样方法的异质不平衡数据故障检测方法技术

技术编号:26223501 阅读:50 留言:0更新日期:2020-11-04 10:55
本发明专利技术供一种基于少数类过采样方法的异质不平衡数据故障检测方法,其包括获取机电设备健康状态相关的所监测的不平衡数据集T={T

【技术实现步骤摘要】
基于少数类过采样方法的异质不平衡数据故障检测方法
本专利技术涉及计算机仿真
,特别涉及一种基于少数类过采样方法的异质不平衡数据故障检测方法。
技术介绍
检测关键部件的任何可能故障对提高工程系统的安全性和可用性是非常重要的。数据驱动模型和智能传感器的发展大大扩展了故障诊断研究的应用领域。然而,不平衡数据为数据驱动故障检测方法带来很大的挑战。在不平衡数据中,某一类或少数类的数据量远远小于其它类或称多数类样本的数据量。不平衡数据往往使得数据驱动模型的最优决策面向多数类偏移,降低模型在少数类样本上的分类准确性。在故障检测问题中,由于系统可靠性提高和故障率降低,收集到的绝大多数监测数据是关于目标系统的健康状态,而故障数据只占很小的一部分。比如,轨道卫星软件故障数据只占所有监测数据的0.41%。高铁制动系统一年间28837个监测数据中,只有159个与故障相关。因此,类间不平衡性会大大降低故障检出率和数据驱动模型的效能,这在工业中是不希望接受的。针对不平衡数据问题所提出来的众多分类方法中,少数类过采样方法是其中重要的一类。这类方法利用真本文档来自技高网...

【技术保护点】
1.一种基于少数类过采样方法的异质不平衡数据故障检测方法,其特征在于,其包括以下步骤:/n步骤S1,获取机电设备健康状态相关的所监测到的不平衡数据集T={T

【技术特征摘要】
1.一种基于少数类过采样方法的异质不平衡数据故障检测方法,其特征在于,其包括以下步骤:
步骤S1,获取机电设备健康状态相关的所监测到的不平衡数据集T={T-,T+},其中,所述不平衡数据集T包括N-个与设备正常运行状态相关样本的多数类T-和一个包含N+个与设备故障相关样本的少数类T+,且N->N+,令N=N-+N+,样本表示为{x,y},其中x=[x1,x2,…,xa]是包含a个与设备运行工况相关的数值型和/或标称型监测变量的输入向量,y={-1,+1}为类标签,其中-1代表设备处于正常运行状态,+1代表设备发生故障,每一个标称型变量xn能取Mn,i个离散值,i∈[1,2,…,a];
步骤S2,以等概率从少数类故障数据集T+随机选择一个样本x+;
步骤S3,基于异质数值差异指标HVDM或平均数值型变量距离在所述少数类故障数据集T+中找到样本x+的k个近邻样本;其中,所述异质数值差异指标HVDM的表达式(2)为:



其中,HVDM为异质数值差异指标;di(x1,i,x2,i)为机电设备两个输入变量取值x1,i,x2,i之间的距离;x1、x2为两个输入向量;
或者,所述平均数值型变量距离的确定方法为:
在利用表达式(2)计算两个输入向量x1和x2之间的距离时,输入变量之间距离di(x1,x2)的确定方法如下:



其中,|x1-x2|是一个数值型变量两个值之间的绝对差值;
当第i个变量为标称型时,标称型变量的两个值之间的距离是所有数值型变量绝对插值的平均值,其中,xl,j是训练集中第j个样本中第l个数值型变量的值;mean代表均值,xl∈numerical代表所有数值型变量集合中的任一变量;
步骤S4,从所述k个近邻样本中选择一个x+的最近邻样本
步骤S5,基于所述最近邻样本计算人工生成样本的数值型变量和标称型变量
步骤S6,基于所述数值型变量和标称型变量对所述机电设备进行故障检测,获得故障检测结果。


2.根据权利要求1所述的基于少数类过采样方法的异质不平衡数据故障检测方法,其特征在于,在所述异质数值差异指标HVDM的表达式(2)中,所述两个输入向量x1和x2之间的距离di(x1,i,x2,i)是根据表达式(3)计算获得,



其中:
σi是第i个变量的标准差;
...

【专利技术属性】
技术研发人员:刘杰
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1