System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于RTSGAN-CatBoost的故障分类方法技术_技高网

基于RTSGAN-CatBoost的故障分类方法技术

技术编号:40594416 阅读:4 留言:0更新日期:2024-03-12 21:56
本发明专利技术公开了基于RTSGAN‑CatBoost的故障分类方法,首先使用统计方法对原始故障数据进行特征提取;之后构建RTSGAN模型,将提取特征后的新数据样本输入到RTSGAN模型进行训练;经过上述数据增强后,得到了一套高质量的合成样本,结合提取特征后的新数据样本,构建一个平衡的正常/故障样本数据集,并划分训练集和测试集;使用CatBoost算法对训练集进行迭代训练以构建分类模型,并优化模型参数,使模型能够高效进行后续分类任务;最后使用训练好的分类模型在测试集上测试,采用四种评价指标评价模型的分类性能。本发明专利技术提高了不平衡条件下故障分类的准确率,为故障诊断提供可靠保障。

【技术实现步骤摘要】

本专利技术属于故障诊断,具体涉及基于rtsgan-catboost的故障分类方法。


技术介绍

1、在智能轨道交通管理系统中,为了保证高速列车的安全运行,各种列车部件装有传感器装置以进行实时监控。当列车上的设备产生故障信号时,列车运行控制系统需快速判断并做出正确响应,以保证列车行驶安全以及乘客生命安全。因此,故障诊断技术在智能轨道交通管理系统中起着关键的作用。当前处于人工智能时代,成熟运用人工智能算法,高速数据采集技术,先进传感器技术等设计开发准确有效的故障检测系统将是未来故障诊断系统的发展方向。但由于在实际生活中,机器大多数时间处在正常运行状态,故障发生为小概率事件,所以在小样本的情况下,故障诊断的效果很难达到预期效果。当正常状态与故障状态的数据样本出现不平衡时,若采用传统分类算法故障分类时,会导致训练模型对少数类样本的特征学习不充分导致分类准确率低下,从而降低模型整体的分类性能和泛化性。在列车的行驶过程中,对于故障信号的漏判造成的后果严重危害列车行驶安全以及乘客生命安全,因此,在小样本及不平衡条件下的故障分类对于当前高速行驶的列车具有重要意义。

2、当下解决小样本不平衡的方法有合成少数类过采样技术(synthetic minorityoversampling technique,smote),生成对抗网络、变分自编码(variational auto-encoders,vae)等,这些方法的主要思想是针对不平衡的进行扩充以提高数据质量,然后利用大量的样本来训练分类器。上述基本的模型虽有一定的效果,但是也存在弊端,smote技术采用随机线性插值的方法合成新样本,会增加后续的分类难度,gan和vae都难以训练。应用生成对抗网络的变体进行数据增强可以有效解决故障数据不平衡的问题,为模型训练提供高质量合成,提高模型的准确性和泛化性。


技术实现思路

1、本专利技术的目的是提供基于rtsgan-catboost的故障分类方法,解决了在小样本状态下故障诊断的效果很难达到预期效果的问题。

2、本专利技术所采用的技术方案是,基于rtsgan-catboost模型的故障分类方法,使用真实世界时间序列生成对抗网络对原始故障数据进行数据增强,在学习有效特征的同时,生成与原始样本相似的高质量平衡样本数据集,在得到平衡样本数据集后,采用catboost算法构建并训练分类模型,得到优化后分类模型,有效提高小样本故障分类准确性;具体按照以下步骤实施:

3、步骤1、特征提取:首先将原始的故障数据采用基于统计的方法进行特征提取,即提取原始故障数据的统计学特征作为新数据样本用于模型的后续训练任务;

4、步骤2、构建真实世界时间序列生成对抗网络模型rtsgan:rtsgan模型由编码器-解码器模块和生成模块组成;

5、步骤3、使用rtsgan模型扩充故障数据样本:将步骤1提取特征后的新数据样本输入到rtsgan模型中,输出合成数据样本;

6、步骤4、将步骤1提取特征后的新数据样本和步骤3的合成数据样本合并得到平衡的故障数据集,并划分训练集和测试集;

7、步骤5、采用catboost算法对训练集进行训练从而构建一个分类模型,并对该分类模型中的超参数进行调优,得到优化后分类模型;

8、步骤6、将测试集输入到训练好的优化后分类模型中,并评估该优化后分类模型的性能。

9、本专利技术的特点还在于:

10、步骤1使用基于统计方法的特征提取,提取原始故障数据的统计学特征作为新数据样本用于模型的后续训练任务。选取的特征为均值、标准差、方差、最小值、最大值、峰值、偏度以及峰度。

11、步骤2首先学习一个编码器-解码器模块,该模块提供时间序列实例与固定维潜在向量之间的映射,然后学习一个生成模块,在同一潜在空间中生成向量。训练完成结束后将发生器和解码器相结合,rtsgan能够生成尊重原始特征分布和时间动态的真实世界时间序列数据;

12、步骤2.1、构建编码器-解码器模块,该模块由一个将输入序列编码为潜在向量的编码器和一个从潜在向量重建输入序列的解码器组成。如下公式(1),(2)分别为编码器从输入层到隐藏层的原始数据x的编码过程和从隐藏层到输出层的解码过程:

13、h=gθ1(χ)=σ(w1χ+b1)        (1)

14、

15、其中,χ表示高维输入,h表示低维的隐变量,表示解码器的重构输出,σ是激活函数,w1,w2,b1,b2是自编码器网络的参数。

16、自动编码器在训练过程中,不断更新{w1,w2,b1,b2}使得x与重构误差较小,训练过程一般采用均方差损失函数,如公式(3)所示;或者交叉熵损失函数,如公式(4)所示。

17、

18、其中,y表示输入数据,表示自编码器的重构输出。

19、loss=-[tlogp+(1-t)log(1-p)] (4)

20、其中,t表示真实类别标签,取值为0或1,p表示预测的概率分布。

21、步骤2.2、构建生成模块,该生成模块由wgan-gp构成;wgan作为gan的改进模型,使用wasserstein距离作为度量生成数据与训练样本空间数据的代价,将训练样本与生成样本形成联合分布后对期望值去下限进行优化,wgan的目标函数为公式(5)所示:

22、

23、其中,x为来自训练样本x的数据,z为噪声样本。

24、wgan-gp模型通过额外设置一个梯度惩罚项代替权重裁剪以满足判别器d损失一阶lipschitz函数约束,梯度惩罚公式为公式(6)所示。

25、

26、其中,是真实数据和生成数据之间的随机插值,是梯度算子;

27、wgan-gp的目标函数如公式(7)所示:

28、

29、其中,λ是惩罚项系数,g和d分别表示生成器和1-lipschitz判别器;e为期望;

30、步骤3具体如下:

31、步骤3.1、将提取特征后的新数据样本输入到rtsgan模型后,编码器将每个时间序列编码为一个紧凑的潜在表示。首先将全局特征y连接到动态特征xi上,公式(8)所示,动态特征是指随时间变化的特征,全局特征包括静态特征以及全局属性等。然后将其送到n层gru中,得到gru每一步i的隐藏状态,公式(9)所示;为了更好的捕捉时间序列的属性,对gru最后一层隐藏状态进行池化操作以增强表示,公式(10)所示;最后将gru最后一层隐藏状态进行池化操作后的结果s和gru最后一个隐藏状态连接起来得到一个潜在表示r,公式(11)所示。

32、ei=[xi,y]         (8)

33、

34、

35、

36、其中,ei表示编码器的输入,表示编码器中隐藏层数为dae的n层gru第i步的输出,s表示对gru最后一层隐藏状态进行池化操作后的结果,r表示编码本文档来自技高网...

【技术保护点】

1.基于RTSGAN-CatBoost的故障分类方法,其特征在于,使用真实世界时间序列生成对抗网络对原始故障数据进行数据增强,在学习有效特征的同时,生成与原始样本相似的高质量平衡样本数据集,在得到平衡样本数据集后,采用CatBoost算法构建并训练分类模型,得到优化后分类模型,有效提高小样本故障分类准确性。

2.根据权利要求1所述的基于RTSGAN-CatBoost的故障分类方法,其特征在于,具体按照以下步骤实施:

3.根据权利要求2所述的基于RTSGAN-CatBoost的故障分类方法,其特征在于,所述步骤1中基于统计方法的特征提取,是提取原始故障数据的均值、标准差、方差、最小值、最大值、峰值、偏度和峰度。

4.根据权利要求2所述的基于RTSGAN-CatBoost的故障分类方法,其特征在于,所述步骤2具体如下:

5.根据权利要求4所述的基于RTSGAN-CatBoost的故障分类方法,其特征在于,所述步骤2.1中更新自编码器网络的参数采用均方差损失函数或者交叉熵损失函数;

6.根据权利要求4所述的基于RTSGAN-CatBoost的故障分类方法,其特征在于,所述步骤3具体如下:

7.根据权利要求6所述的基于RTSGAN-CatBoost的故障分类方法,其特征在于,所述步骤4在经过上述数据增强后,得到了一套高质量的合成样本,将所述步骤1中提取特征后的新数据样本和所述步骤3中的合成数据样本合并,构建一个平衡的正常/故障样本数据集,将数据集80%的样本作为训练集,20%样本作为测试集。

8.根据权利要求7所述的基于RTSGAN-CatBoost的故障分类方法,其特征在于,所述步骤5中,将步骤4中的训练集输入到CatBoost算法中以构建分类模型,具体如下:

9.根据权利要求8所述的基于RTSGAN-CatBoost的故障分类方法,其特征在于,所述步骤6中,采用测试集测试步骤5训练好的优化后分类模型,通过使用混淆矩阵图、准确率、召回率、F1-score对优化后分类模型进行评价。

...

【技术特征摘要】

1.基于rtsgan-catboost的故障分类方法,其特征在于,使用真实世界时间序列生成对抗网络对原始故障数据进行数据增强,在学习有效特征的同时,生成与原始样本相似的高质量平衡样本数据集,在得到平衡样本数据集后,采用catboost算法构建并训练分类模型,得到优化后分类模型,有效提高小样本故障分类准确性。

2.根据权利要求1所述的基于rtsgan-catboost的故障分类方法,其特征在于,具体按照以下步骤实施:

3.根据权利要求2所述的基于rtsgan-catboost的故障分类方法,其特征在于,所述步骤1中基于统计方法的特征提取,是提取原始故障数据的均值、标准差、方差、最小值、最大值、峰值、偏度和峰度。

4.根据权利要求2所述的基于rtsgan-catboost的故障分类方法,其特征在于,所述步骤2具体如下:

5.根据权利要求4所述的基于rtsgan-catboost的故障分类方法,其特征在于,所述步骤2.1中更新自编码器网络的参数采...

【专利技术属性】
技术研发人员:黑新宏高苗费蓉邱原王欣姬文江
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1