The invention discloses a compressor fault diagnosis method based on XGBoost feature extraction. Firstly, a fault splitting tree is constructed iteratively by defining the loss function of the XGBoost algorithm according to the fault data and fault types. Secondly, the index vector of the leaf node position in the fault tree is extracted and the feature coding is reconstructed to obtain the intelligent representation of hidden fault information. Then, based on the representation matrix, the fault prediction models are established by using SVM and neural network algorithms respectively. To realize the prediction and diagnosis of multiple fault modes. The feature of this method is that it can fully mine the hidden fault feature information in the data, so that the accuracy of fault diagnosis prediction is higher.
【技术实现步骤摘要】
一种基于XGBoost特征提取的压缩机故障诊断方法
本专利技术涉及一种基于机器学习的故障诊断方法,尤其是涉及一种基于XGBoost特征提取的压缩机故障诊断方法。
技术介绍
对于故障诊断模型,特征提取的好坏很大程度上决定着该模型的性能,它是故障诊断中的关键环节。特征提取是从故障数据中挖掘提取最具代表性信息的过程,也是一个对故障数据中隐含信息进行深度挖掘的过程。较差的故障特征不仅影响算法运算的效率,也会降低算法模型对故障的预测精度。因此,研究有效的特征提取方法至关重要。现阶段,多数文献将故障诊断方法分为基于解析模型的方法、基于经验知识的方法以及基于数据驱动的方法。随着现在系统具有多变量、强耦合和非线性等特点,使得系统模型的构建非常困难,基于解析模型和经验知识方法的故障诊断效果就很不明显,而基于数据驱动的方法逐渐得到人们的关注,并成为故障诊断领域的热点。基于数据驱动的方法就是提取系统过程数据中的有用信息,根据这些有用信息来诊断系统的故障。将基于数据驱动的故障诊断技术细分为基于统计分析的故障诊断方法、基于信号处理的故障诊断方法和基于人工智能的故障诊断方法。由于故障类型和故障征兆之间不存在简单的对应关系,针对系统的不确定性和复杂性,基于人工智能的故障诊断技术较为适用。它主要是通过工业过程的正常数据以及故障数据来训练各类学习算法,进而实现故障诊断的目的。其技术难点在于如何从监测的故障数据中挖掘提取出隐含的重要特征信息,表征系统运行的正常模式和故障模式。基于人工智能的故障诊断方法包含神经网络法、支持向量机法、极限学习机法及模糊逻辑法。针对生产系统中成分的退化和机械的磨损 ...
【技术保护点】
1.一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于,包括以下步骤:1)根据压缩机故障数据样本与故障类型自定义XGBoost算法的损失函数;2)迭代构建故障分裂树;3)提取故障数据样本在故障分裂树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信息的智能化表征;4)基于该表征矩阵,使用SVM、神经网络算法分别建立故障预测模型,实现多故障模式的预测诊断。
【技术特征摘要】
1.一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于,包括以下步骤:1)根据压缩机故障数据样本与故障类型自定义XGBoost算法的损失函数;2)迭代构建故障分裂树;3)提取故障数据样本在故障分裂树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信息的智能化表征;4)基于该表征矩阵,使用SVM、神经网络算法分别建立故障预测模型,实现多故障模式的预测诊断。2.根据权利要求1所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于,所述步骤1)中根据故障数据样本与故障类型自定义XGBoost算法的损失函数采用以下步骤:1.1)对于故障多分类诊断,引入极大似然估计法,对于给定的故障数据样本及其对应的故障状态类别,自定义损失函数为:式中:n代表故障数据样本总个数,yi代表故障的真实类别,代表故障的预测类别;根据XGBoost算法理论,此时故障分裂树模型FM第t次迭代的目标函数可表示为:式中:Ω(ft)代表故障分裂树复杂度,代表第t-1次迭代时的故障预测值,ft(xi)代表第t次迭代时的函数,C代表常数;用泰勒展开得到近似目标函数为:式中:gi和hi包含了的一阶及二阶导数信息,引导故障分裂树分裂构建;对于故障分裂树模型FM,去掉常数项和C仍有:此时的函数FM(t)为需要训练的故障分裂树的最终目标函数;则根据XGBoost算法理论,故障分裂树的叶结点累加形式变为:式中:Ij为每个叶子上面故障数据样本的集合,wj代表每棵树叶结点故障数据样本对应分数,T代表故障分裂树的叶子结点个数;λ、γ用来控制对应部分的比重;上式对wj求导并令导数为零,求得故障分裂树结构的最小损失为:式中:代表最小损失故障分裂树结构的输出分数,S代表最小损失。3.根据权利要求2所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于步骤2)的迭代构建故障分裂树的步骤如下:2.1)根据故障数据样本及故障类型构建损失函数使用该损失函数构建故障分裂树第t次迭代下对应的目标函数;2.2)使用公式(3)作为目标函数引导每一步的故障分裂树构建;2.3)在故障分裂树分裂过程中,在当前故障分裂树结点的样本中依次选取一个参数特征,使用下公式(7)计算该参数作为叶结点分裂标准的增益信息Gain;式中:第一项为左子树的信息分数,第二项为右子树的信息分数,第三项为当前不分割的信息分数,GL,HL分别为分裂后左子树的gi及hi信息和,GR,HR分别为分裂后右子树的gi及hi信息和;2.4)当所有参数都计算完成后,根据此增益Gain选择对应故障参数对当前故障分裂树进行分裂,并把故障数据样本置于对应的叶结点中;2.5)根据增益Gain值是否小于设定的阙值γ时,决定是否进行当前故障分裂树结点的分裂;同时根据此故障分裂树是否达到设置的最大树深度,判断此时故障分裂树是否构建完成,停止分裂;若是,则计算公式(6)得到此故障分裂树的最小损失函数值;若否,则回到步骤2.3,并按顺序执行后续步骤。4.据权利要求3所述的一种基于XGBoost特征提取的压缩机故障诊断方法,其特征在于步骤3)的提取故障数据样本在故障分裂树中的叶子结点位置索引向量并进行特征编码重构,得到隐含故障信...
【专利技术属性】
技术研发人员:姜少飞,李治,邬天骥,李吉泉,彭翔,景立挺,许青青,高启龙,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。