一种基于XGBoost特征提取的压缩机故障诊断方法技术

技术编号:21247411 阅读:25 留言:0更新日期:2019-06-01 07:38
本发明专利技术公开了一种基于XGBoost特征提取的压缩机故障诊断方法。首先,根据故障数据与故障类型自定义XGBoost算法的损失函数,迭代构建故障分裂树;其次,提取样本在故障树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信息的智能化表征;然后,基于该表征矩阵,使用SVM、神经网络算法分别建立故障预测模型,实现多故障模式的预测诊断。这种方法的特点是,能够充分挖掘数据中隐含故障特征信息,使故障诊断预测的精度更高。

A Compressor Fault Diagnosis Method Based on XGBoost Feature Extraction

The invention discloses a compressor fault diagnosis method based on XGBoost feature extraction. Firstly, a fault splitting tree is constructed iteratively by defining the loss function of the XGBoost algorithm according to the fault data and fault types. Secondly, the index vector of the leaf node position in the fault tree is extracted and the feature coding is reconstructed to obtain the intelligent representation of hidden fault information. Then, based on the representation matrix, the fault prediction models are established by using SVM and neural network algorithms respectively. To realize the prediction and diagnosis of multiple fault modes. The feature of this method is that it can fully mine the hidden fault feature information in the data, so that the accuracy of fault diagnosis prediction is higher.

【技术实现步骤摘要】
一种基于XGBoost特征提取的压缩机故障诊断方法
本专利技术涉及一种基于机器学习的故障诊断方法,尤其是涉及一种基于XGBoost特征提取的压缩机故障诊断方法。
技术介绍
对于故障诊断模型,特征提取的好坏很大程度上决定着该模型的性能,它是故障诊断中的关键环节。特征提取是从故障数据中挖掘提取最具代表性信息的过程,也是一个对故障数据中隐含信息进行深度挖掘的过程。较差的故障特征不仅影响算法运算的效率,也会降低算法模型对故障的预测精度。因此,研究有效的特征提取方法至关重要。现阶段,多数文献将故障诊断方法分为基于解析模型的方法、基于经验知识的方法以及基于数据驱动的方法。随着现在系统具有多变量、强耦合和非线性等特点,使得系统模型的构建非常困难,基于解析模型和经验知识方法的故障诊断效果就很不明显,而基于数据驱动的方法逐渐得到人们的关注,并成为故障诊断领域的热点。基于数据驱动的方法就是提取系统过程数据中的有用信息,根据这些有用信息来诊断系统的故障。将基于数据驱动的故障诊断技术细分为基于统计分析的故障诊断方法、基于信号处理的故障诊断方法和基于人工智能的故障诊断方法。由于故障类型和故障征兆之间不存在简单的对应关系,针对系统的不确定性和复杂性,基于人工智能的故障诊断技术较为适用。它主要是通过工业过程的正常数据以及故障数据来训练各类学习算法,进而实现故障诊断的目的。其技术难点在于如何从监测的故障数据中挖掘提取出隐含的重要特征信息,表征系统运行的正常模式和故障模式。基于人工智能的故障诊断方法包含神经网络法、支持向量机法、极限学习机法及模糊逻辑法。针对生产系统中成分的退化和机械的磨损,已有研究者通过时频分析技术在频域上利用ANN实现故障的检测和诊断;又有研究者提出了最小二乘SVM混合分类器,在对分类器进行训练的过程中,采用粒子群优化算法优化SVM的参数,实现对油浸式电力变压器的溶解气体分析的故障诊断;同时有人提出了结合奇异值分解和极限学习机算法的滚动轴承故障诊断技术;还有人采用决策树方法进行相关特征的选取,结合反向传播算法和最小二乘算法微调自适应的模糊推理神经网络的网络参数,从而对感应电机进行故障诊断。同时,研究者们针对复杂系统中的现存问题,从增加新的信息、挖掘未利用的隐含信息和采用新的数学工具三个角度对这一领域进行展望,提出四个基于数据驱动的故障诊断研究展望:基于多源信息融合的故障诊断展望、基于关联性分析的故障诊断展望、基于机器学习的故障诊断展望、基于时频分析的故障诊断展望。其中,在基于机器学习的故障诊断中,传统的智能学习方法,无论是用于分类还是回归,多数为浅层结构算法,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约,如何从监测数据中对故障特征进行挖掘并表示是该类方法的研究难点,如果能对故障数据中的隐含信息进行合理提取并表征,就能得到更好的故障检测和预测结果。目前用于故障诊断领域的机器学习方法,都是从逼近论的角度拟合监测数据,存在逼近精度等方面的不足,例如神经网络、支持向量机等,尚不能够充分挖掘监测数据中的故障特征。针对上述机器学习故障诊断的研究现状及存在的问题,本章提出基于XGBoost特征提取的压缩机故障诊断方法。该方法首先根据监测的压缩机故障数据与故障类型,自定义适应该故障诊断场景的XGBoost算法损失函数,以此构建对应的故障分裂树;其次,确定样本数据在故障分裂树中的叶子结点位置索引并创建位置索引矩阵;最后,对索引矩阵进行特定方式的编码重构,实现隐含故障信息的特征提取及智能化表征。该方法通过构建故障分裂树的方式来实现对数据中重要变量间信息的统计,包括数据结构和分布式特征。同时,通过设置分裂树的深度来实现数据中隐含特征信息的深度挖掘。以某压缩机的故障诊断为例验证该特征提取方法的有效性。
技术实现思路
针对现有技术中存在的上述问题,为了充分挖掘数据中隐含故障特征信息,提高故障诊断精确度,本专利技术目的在与提供一种基于XGBoost特征提取的压缩机故障诊断方法。一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于,包括以下步骤:1)根据压缩机故障数据样本与故障类型自定义XGBoost算法的损失函数;2)迭代构建故障分裂树;3)提取故障数据样本在故障分裂树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信息的智能化表征;4)基于该表征矩阵,使用SVM、神经网络算法分别建立故障预测模型,实现多故障模式的预测诊断。所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于,所述步骤1)中根据故障数据样本与故障类型自定义XGBoost算法的损失函数采用以下步骤:1.1)对于故障多分类诊断,引入极大似然估计法,对于给定的故障数据样本及其对应的故障状态类别,自定义损失函数为:式中:n代表故障数据样本总个数,yi代表故障的真实类别,代表故障的预测类别;根据XGBoost算法理论,此时故障分裂树模型FM第t次迭代的目标函数可表示为:式中:Ω(ft)代表故障分裂树复杂度,代表第t-1次迭代时的故障预测值,ft(xi)代表第t次迭代时的函数,C代表常数;用泰勒展开得到近似目标函数为:式中:gi和hi包含了的一阶及二阶导数信息,引导故障分裂树分裂构建;对于故障分裂树模型FM,去掉常数项和C仍有:此时的函数FM(t)为需要训练的故障分裂树的最终目标函数;则根据XGBoost算法理论,故障分裂树的叶结点累加形式变为:式中:Ij为每个叶子上面故障数据样本的集合,wj代表每棵树叶结点故障数据样本对应分数,T代表故障分裂树的叶子结点个数;λ、γ用来控制对应部分的比重;上式对wj求导并令导数为零,求得故障分裂树结构的最小损失为:式中:代表最小损失故障分裂树结构的输出分数,S代表最小损失。所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于步骤2)的迭代构建故障分裂树的步骤如下:2.1)根据故障数据样本及故障类型构建损失函数使用该损失函数构建故障分裂树第t次迭代下对应的目标函数;2.2)使用公式(3)作为目标函数引导每一步的故障分裂树构建;2.3)在故障分裂树分裂过程中,在当前故障分裂树结点的样本中依次选取一个参数特征,使用下公式(7)计算该参数作为叶结点分裂标准的增益信息Gain;式中:第一项为左子树的信息分数,第二项为右子树的信息分数,第三项为当前不分割的信息分数,GL,HL分别为分裂后左子树的gi及hi信息和,GR,HR分别为分裂后右子树的gi及hi信息和;2.4)当所有参数都计算完成后,根据此增益Gain选择对应故障参数对当前故障分裂树进行分裂,并把故障数据样本置于对应的叶结点中;2.5)根据增益Gain值是否小于设定的阙值γ时,决定是否进行当前故障分裂树结点的分裂;同时根据此故障分裂树是否达到设置的最大树深度,判断此时故障分裂树是否构建完成,停止分裂;若是,则计算公式(6)得到此故障分裂树的最小损失函数值;若否,则回到步骤2.3,并按顺序执行后续步骤。所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于步骤3)的提取故障数据样本在故障分裂树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信息的智能化表征包含以下步骤:3.1)设故本文档来自技高网
...

【技术保护点】
1.一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于,包括以下步骤:1)根据压缩机故障数据样本与故障类型自定义XGBoost算法的损失函数;2)迭代构建故障分裂树;3)提取故障数据样本在故障分裂树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信息的智能化表征;4)基于该表征矩阵,使用SVM、神经网络算法分别建立故障预测模型,实现多故障模式的预测诊断。

【技术特征摘要】
1.一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于,包括以下步骤:1)根据压缩机故障数据样本与故障类型自定义XGBoost算法的损失函数;2)迭代构建故障分裂树;3)提取故障数据样本在故障分裂树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信息的智能化表征;4)基于该表征矩阵,使用SVM、神经网络算法分别建立故障预测模型,实现多故障模式的预测诊断。2.根据权利要求1所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于,所述步骤1)中根据故障数据样本与故障类型自定义XGBoost算法的损失函数采用以下步骤:1.1)对于故障多分类诊断,引入极大似然估计法,对于给定的故障数据样本及其对应的故障状态类别,自定义损失函数为:式中:n代表故障数据样本总个数,yi代表故障的真实类别,代表故障的预测类别;根据XGBoost算法理论,此时故障分裂树模型FM第t次迭代的目标函数可表示为:式中:Ω(ft)代表故障分裂树复杂度,代表第t-1次迭代时的故障预测值,ft(xi)代表第t次迭代时的函数,C代表常数;用泰勒展开得到近似目标函数为:式中:gi和hi包含了的一阶及二阶导数信息,引导故障分裂树分裂构建;对于故障分裂树模型FM,去掉常数项和C仍有:此时的函数FM(t)为需要训练的故障分裂树的最终目标函数;则根据XGBoost算法理论,故障分裂树的叶结点累加形式变为:式中:Ij为每个叶子上面故障数据样本的集合,wj代表每棵树叶结点故障数据样本对应分数,T代表故障分裂树的叶子结点个数;λ、γ用来控制对应部分的比重;上式对wj求导并令导数为零,求得故障分裂树结构的最小损失为:式中:代表最小损失故障分裂树结构的输出分数,S代表最小损失。3.根据权利要求2所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于步骤2)的迭代构建故障分裂树的步骤如下:2.1)根据故障数据样本及故障类型构建损失函数使用该损失函数构建故障分裂树第t次迭代下对应的目标函数;2.2)使用公式(3)作为目标函数引导每一步的故障分裂树构建;2.3)在故障分裂树分裂过程中,在当前故障分裂树结点的样本中依次选取一个参数特征,使用下公式(7)计算该参数作为叶结点分裂标准的增益信息Gain;式中:第一项为左子树的信息分数,第二项为右子树的信息分数,第三项为当前不分割的信息分数,GL,HL分别为分裂后左子树的gi及hi信息和,GR,HR分别为分裂后右子树的gi及hi信息和;2.4)当所有参数都计算完成后,根据此增益Gain选择对应故障参数对当前故障分裂树进行分裂,并把故障数据样本置于对应的叶结点中;2.5)根据增益Gain值是否小于设定的阙值γ时,决定是否进行当前故障分裂树结点的分裂;同时根据此故障分裂树是否达到设置的最大树深度,判断此时故障分裂树是否构建完成,停止分裂;若是,则计算公式(6)得到此故障分裂树的最小损失函数值;若否,则回到步骤2.3,并按顺序执行后续步骤。4.据权利要求3所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于步骤3)的提取故障数据样本在故障分裂树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信...

【专利技术属性】
技术研发人员:姜少飞李治邬天骥李吉泉彭翔景立挺许青青高启龙
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1