基于梯度提升决策树的牵引变流器故障诊断方法技术

技术编号:21300741 阅读:49 留言:0更新日期:2019-06-12 08:13
本发明专利技术涉及轨道交通领域,具体公开了一种基于梯度提升决策树的牵引变流器故障诊断方法。包括以下步骤:通过对牵引变流器故障数据样本进行递归二分类,并采用梯度提升决策树学习模型,预先构建故障分类模型;获取牵引变流器故障数据,带入分类模型进行故障诊断。本发明专利技术提出了递归二分类故障诊断总体框架,在总体框架中构建基于小波包分解和梯度提升决策树的牵引变流器故障诊断方法。本发明专利技术故障诊断精度高,能完全满足牵引变流器故障已定位的样本少、数据样本数据维度高、不同类别的样本分布不平衡、模块类故障难以区分的实际情况,具有广泛的推广价值。

Fault Diagnosis Method of Traction Converter Based on Gradient Lifting Decision Tree

The invention relates to the field of rail transit, in particular to a fault diagnosis method of traction converter based on gradient lifting decision tree. It includes the following steps: through the recursive classification of traction converter fault data samples, and the gradient lifting decision tree learning model, the fault classification model is constructed in advance; the fault data of traction converter is obtained and brought into the classification model for fault diagnosis. The invention proposes a general framework of recursive binary classification fault diagnosis, in which a fault diagnosis method of traction converter is constructed based on wavelet packet decomposition and gradient lifting decision tree. The fault diagnosis method of the invention has high accuracy and can fully satisfy the actual situation that the traction converter fault has been located with fewer samples, the data dimension of the data samples is high, the sample distribution of different categories is unbalanced, and the module fault is difficult to distinguish, and has wide popularization value.

【技术实现步骤摘要】
基于梯度提升决策树的牵引变流器故障诊断方法
本专利技术涉及轨道交通领域,更具体地,涉及一种基于梯度提升决策树的牵引变流器故障诊断方法。
技术介绍
变流器是电力机车牵引系统的关键部件,变流器故障将会导致列车运行瘫痪,严重的话会影响整个铁路干线。因此变流器一旦发生故障,需要立刻进行故障原因定位,并采取相关措施来解决故障。例如变流器四象限输入过流是变流器故障中一种常见的故障原因,引起变流器四象限输入过流的故障原因有输入异常、元器件异常、检测异常、其他异常等大类,及其网压波动异常、同步信号接反、输入大线接反、四象限模块管故障、电容鼓包、逆变模块故障、中间电压传感器故障、电流传感器故障、网侧板卡异常、脉冲输出通路异常、控制变压异常等小类。其中,网压波动异常、四象限模块故障、逆变模块故障是列车实际运行中最常见的三种故障原因。然而在实际的故障诊断中,存在着以下局限:(1)数据样本少。在电力机车牵引变流器的故障样本中,已通过专家定位的样本数量少。例如某型机车,在实际运行时采集的四象限输入过流故障的数据样本中,已通过专家定位的数据文件总共只有三百多个。(2)数据样本维度高。在单个样本中共有中间电压、输入电流、牵引网瞬时电压等九个关键字段,每个字段对应的记录有几万条。这样九乘以几万的高维度样本不能直接用于基于机器学习的故障诊断模型。(3)不同类别的样本分布不平衡。在总共三百多个已定位的数据样本中,数量排名前三的故障原因占总数的90%以上,排名第四的故障原因不超过十个,甚至无法进行交叉验证。(4)模块类故障难以区分。模块类的故障,例四象限模块与逆变模块故障,两个故障在多个关键字段上的波形特征十分相似,难以区分。针对列车的变流器故障诊断的研究,现有技术主要分成三大类:(1)基于专家经验的故障诊断;但基于专家经验的故障诊断面对海量数据时,诊断效率低;(2)基于物理模型的故障诊断;但基于物理模型的故障诊断,其仿真模型不能完全反映列车在实际运行过程中由于工况、环境等复杂多因素的影响状况;(3)基于数据模型的故障诊断;如针对于SS8车型的主变流器功率器件的开路故障,提出了基于小波分析和支持向量机(SVM)的故障诊断方法;针对200km/h的电动车组牵引变流器的三相输出电流的不平衡故障,提出了运用小波变换提取特征结合BP神经网络的故障诊断方法;提出了基于SOM的神经网络用于整流功率元件的开路故障诊断;针对BP算法存在收敛速度慢的问题,提出了用遗传算法来更新神经网络的权值参数,结合小波分析,用于整流器开路故障诊断。利用粗糙集对故障特征数据库中的数据进行处理和约简,提取出有效的故障模式规则用于故障诊断;提出了基于改进蚁群神经网络对地铁牵引逆变器的开路和短路故障进行诊断;基于数据模型的故障诊断在计算机硬件水平的提高和开源社区的发展下,得到了广泛应用,但目前的研究并没有着重考虑机车实际已定位的变流器故障样本少、类别间样本数分布不平衡的情况。本文中,小波变换是一种被广泛使用的信号特征提取方法,主要用于非平稳信号的特征提取和降维。小波变换通过小波基函数的伸缩和平移来构成一系列分辨率不同的正交投影空间及其对应的基,能同时提高时域分辨率与频域分辨率,侧重于刻画信号的低频部分。小波包分解:小波包(WaveletPacket)是小波变换的扩展。小波变换只对信号的低频部分逐层进行分解,关注信号的低频特征。而小波包分解将数据信号的高频部分和低频部分段同时逐层进行分解,关注信号在整个频段上的特征。梯度提升决策树(GradientBoostingDecisionTree):GBDT由Friedman于2001年提出,属于集成学习的一种模型,其强大的拟合和泛化性能,使其不仅在世界顶尖的数据挖掘平台Kaggle竞赛中屡获名次,并且在Facebook和阿里巴巴等互联网公司中被广泛使用。交叉验证:交叉验证(Cross-validation)主要用于建模应用中。在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。K折比例交叉验证:从初始样本中按标签的比例,平均分割成K份子样本。一个单独的子样本被保留作为验证模型的数据,其它K-1个样本用来训练。交叉验证重复K次,每个字样本验证一次,平均K次的结果,得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次。
技术实现思路
本专利技术为克服上述现有技术所述的至少一种缺陷,提供一种能够细化区分模块类故障、并且能解决数据样本少、数据样本维度高、样本分布不平衡带来的故障诊断困难问题的基于梯度提升决策树的牵引变流器故障诊断方法。为解决上述技术问题,本专利技术的技术方案如下:提供一种基于梯度提升决策树的牵引变流器故障诊断方法,包括以下步骤:通过对牵引变流器故障数据样本进行递归二分类,并采用梯度提升决策树学习模型,预先构建故障分类模型;获取牵引变流器故障数据,带入分类模型进行故障诊断。进一步地,具体包括以下步骤:S1.获取牵引变流器故障数据样本,将故障数据样本分为训练数据样本和测试数据样本;S2.将同大类的训练数据样本先合并,与其它大类的样本进行区分,后对大类中的小类进行进一步的区分,通过梯度提升决策树进行训练,得到分类模型;将测试数据样本带入分类模型进行测试,评估故障诊断效果;S3.获取牵引变流器故障数据,带入分类模型进行故障诊断。本专利技术针对牵引变流器故障数据已定位的样本少、样本数据维度高、不同类别的样本分布不平衡、模块类故障难以区分的实际情况,提出了递归二分类故障诊断总体框;运用梯度提升决策树学习模型,通过不断迭代学习,修正分类误差,得到最优的诊断结果。进一步优选地,所述步骤S1中,将获取的牵引变流器故障数据样本进行梳理、简化、去噪、清洗,得到结构化数据后再进行故障数据样本的划分。进一步地,所述步骤S2具体包括:S21.在训练样本集L(t)中,将其中标签为的样本集与其他非的样本集分别标记为Label1、Label2代入GBDT模型,进行训练;其中,it为t的函数;S22.输入测试样本,若测试样本被分在Label1,则结果为Label1。否则,若L2(t)样本集中原标签类数为1,输出分类结果为Label2;否则进入步骤S23;S23.设置L(t)=L2(t),t=t+1;进入步骤S21,直到测试样本被分类完毕。进一步地,在所述步骤S21和步骤S22中用小波包分解能量谱、相位谱、功率谱、Hilbert边际谱的一种或多种对故障数据样本进行特征提取和降维。进一步优选地,采用小波包分解能量谱对故障数据样本进行特征提取和降维。进一步地,所述小波包分解包括以下步骤:设定小波基函数的搜索空间;设定小波包分解层数;确定小波包分解最优参数组合;对原数据用最优参数组合进行小波包分解,进行特征提取。进一步优选地,设定小波基函数的搜索空间为正交小波基Daubchies的函数族DB1-DB38;优选地,设定小波包分解层数参数为1-9。进一步优选地,小波包分解中,采用梯度提升决策树进行训练,并统计在各基函数与层数组合下的全类平均准确性,得到小波包分解最优参数组合。进一步地,将测试样本带入分类模型进行交叉验证,用各项分类指标评估模型的诊断效果。进一本文档来自技高网
...

【技术保护点】
1.基于梯度提升决策树的牵引变流器故障诊断方法,其特征在于,包括以下步骤:通过对牵引变流器故障数据样本进行递归二分类,并采用梯度提升决策树学习模型,预先构建故障分类模型;获取牵引变流器故障数据,带入分类模型进行故障诊断。

【技术特征摘要】
1.基于梯度提升决策树的牵引变流器故障诊断方法,其特征在于,包括以下步骤:通过对牵引变流器故障数据样本进行递归二分类,并采用梯度提升决策树学习模型,预先构建故障分类模型;获取牵引变流器故障数据,带入分类模型进行故障诊断。2.根据权利要求1所述的基于梯度提升决策树的牵引变流器故障诊断方法,其特征在于,具体包括以下步骤:S1.获取牵引变流器故障数据样本,将故障数据样本分为训练数据样本和测试数据样本;S2.将同大类的训练数据样本先合并,与其它大类的样本进行区分,后对大类中的小类进行进一步的区分,通过梯度提升决策树进行训练,得到分类模型;将测试数据样本带入分类模型进行测试,评估故障诊断效果;S3.获取牵引变流器故障数据,带入分类模型进行故障诊断。3.根据权利要求2所述的基于梯度提升决策树的牵引变流器故障诊断方法,其特征在于,所述步骤S1中,将获取的牵引变流器故障数据样本进行梳理、简化、去噪、清洗,得到结构化数据后再进行故障数据样本的划分。4.根据权利要求2或3所述的基于梯度提升决策树的牵引变流器故障诊断方法,其特征在于,所述步骤S2具体包括:S21.在训练样本集L(t)中,将其中标签为的样本集与其他非的样本集分别标记为Label1、Label2代入GBDT模型,进行训练;其中,it为t的函数;S22.输入测试样本,若测试样本被分在Label1,则结果为Label1。否则,若L2(t)样本集中原标签类数为1,输出分类结果为Label2;否则进入步骤S23;...

【专利技术属性】
技术研发人员:戴计生张慧源王同辉刘昕武李晨朱文龙孙木兰褚金鹏刘邦繁刘雨聪
申请(专利权)人:株洲中车时代电气股份有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1