一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法技术

技术编号:24796663 阅读:24 留言:0更新日期:2020-07-07 20:37
本发明专利技术公开了一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选特征变量作为训练模型的总数据,对总数据进行训练集和检验集的划分;确定模型参数建立基于XGBoost算法故障监测模型;将检验集带入基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;在基于XGBoost算法故障监测模型,发现异常后,将排名靠前的特征变量用作风机检修过程中故障原因诊断与定位的参照。

【技术实现步骤摘要】
一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法
本专利技术涉及一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,主涉及风机的主轴承的故障监测与故障诊断

技术介绍
目前深度学习网络在风电机组主轴承状态分析运用广泛,深度网络在主轴承变量间提取重要特征;利用指数加权移动平均法提取其特征变化,判断其趋势是否偏离正常状态。其中,对振动信号的研究常作为风机主轴承故障诊断的方案之一,利用小波包分解作为信号分析、图像处理的方法,即分析树表示小波包,多次迭代小波转换输入细节信息,对高频带信号的分辨率处理精细,根据分析信号引入最佳基函数与信号匹配。以及,在风机主轴承故障预测中,使用XGBoost算法的特征选取工具,对输入变量特征的重要性进行排序,筛选出与被解释变量最相关的特征变量,确定关联程度,判断其可作为主轴承故障的指标。然而现有技术在实际使用中:(1)深度学习网络优化存在梯度消失问题,很难进行优化,深度学习网络大多缺乏时效性,时间成本过大。(2)小波包分析常用于振动信号的研究,对数据类型更有要求。(3)在故障原因诊断的过程之中,现有的回归模型只能够给出故障状态判断,缺少对故障部位或者原因进行分析且准确性欠缺,单模型排序在实际中仍然不能为风机维修给出具有较高准确性的实质性建议。因此,迫切需要一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,以解决现有技术中存在的这一问题。为了解决上述技术问题,特提出一种新的技术方案。
技术实现思路
r>本专利技术的目的在于提供一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,所述方法包含下述步骤:步骤一,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;步骤二,运用Pearson相关系数、XGBoost算法、CatBoost算法和随机森林算法对原始数据集中的特征变量进行综合打分,从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;步骤三,根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选在并网状态下的特征变量作为训练模型的总数据,并对总数据进行训练集和检验集的划分;步骤四,利用机器学习常用调参方法网格搜索的方式检索最优的参数组合,确定模型参数建立基于XGBoost算法故障监测模型;步骤五,将步骤三的检验集带入步骤四的基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;步骤六,在基于XGBoost算法故障监测模型,发现异常后,将排名靠前的特征变量用作风机检修过程中故障原因诊断与定位的参照。优选地,所述步骤一通过删除日期时间列,删除控制状态列的列处理方式把数据处理成以一分钟为时间间隔。优选地,所述SCADA系统的数据库提取了2018-2019年以10秒钟为时间间隔的数据。优选地,所述以10秒钟为时间间隔的数据的数量为310万条。优选地,所述总数据进行划分的方式为80%作为训练集,20%作为检验集。与现有技术相比,本专利技术的有益效果是:(1)引入XGBoost算法建立模型,准确度相对较高,计算速度较快,比通过神经网络的方式更加灵活有效。(2)本文在特征变量选取和相关性分析方式上,融合4种算法模型,即Pearson相关系数,CatBoost算法和XGBoost算法,随机森林算法综合筛选特征集,进行特征相关性排序。(3)利用特征相关性排序作为故障原因诊断与定位的参考。(4)故障监测与故障诊断分开进行,确保在发现故障的基础上,优化结果,剖析原因,并最终联系实际给出本质的结论以及建议。附图说明图1为本专利技术的模型参数表。图2为本专利技术检验样本模型预测温度与实际温度残差图。图3为本专利技术的变量排序表。图4为本专利技术的主轴承故障监测及故障诊断流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅说明书附图,本专利技术提供一种技术方案:一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,所述方法包含下述步骤:步骤一,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;步骤二,运用Pearson相关系数、XGBoost算法、CatBoost算法和随机森林算法对原始数据集中的特征变量进行综合打分,从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;步骤三,根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选在并网状态下的特征变量作为训练模型的总数据,并对总数据进行训练集和检验集的划分;步骤四,利用机器学习常用调参方法网格搜索的方式检索最优的参数组合,确定模型参数建立基于XGBoost算法故障监测模型;步骤五,将步骤三的检验集带入步骤四的基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;步骤六,在基于XGBoost算法故障监测模型,发现异常后,将排名靠前的特征变量用作风机检修过程中故障原因诊断与定位的参照。具体实施时:1)本文基于日照莒县风场的一号风机进行建模研究,从SCADA数据库中提取了2018-2019年以10秒钟为时间间隔的数据,共约310万条。从控制状态筛选出并网状态下的数据作为输入数据,删去含有缺失值的数据行、删除其他控制状态下的数据行;列处理:删除日期时间列,删除控制状态列,最终把数据处理成以一分钟为时间间隔。2)综合四种变量排序方法:Pearson相关系数、XGBoost算法、CatBoost算法、随机森林算法,对风场集控主轴承相关特征变量进行相关性分析,对四种算法排序结果赋予平均权重打分进行综合排序,从模型结果得到建立模型所需要的排名靠前的特征变量(详细排名见表2)。3)根据公司集控中心相关部件故障记录表,即故障发生起始和停止时间详细记录表,删去故障时间段以及其前后各一天的所有数据,筛选该风机在并网正常运行的状态下的数据作为本研究的总数据,采用机器学习常用方案,将总数据随机进行划分,80%作为训练集,用于训练模型,20%作为检验集,用于对模型优劣的检验。4)以主轴承叶轮侧温度、主轴承齿轮箱侧温度作为因变量,利用机器学习常用调参方法网格搜索的方式检索局部最优的参数组合(如图1本专利技术模型参数表所示),确定模型参数建立基于XGBoost算法故障监测模型。5)将数据检验集带入训练完成的模型,得到检验本文档来自技高网...

【技术保护点】
1.一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,其特征在于,所述方法包含下述步骤:/n步骤一,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;/n步骤二,运用Pearson相关系数、XGBoost算法、CatBoost算法和随机森林算法对原始数据集中的特征变量进行综合打分,从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;/n步骤三,根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选在并网状态下的特征变量作为训练模型的总数据,并对总数据进行训练集和检验集的划分;/n步骤四,利用机器学习常用调参方法网格搜索的方式检索最优的参数组合,确定模型参数建立基于XGBoost算法故障监测模型;/n步骤五,将步骤三的检验集带入步骤四的基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;/n步骤六,在基于XGBoost算法故障监测模型,发现异常后,将排名靠前的特征变量用作风机检修过程中故障原因诊断与定位的参照。/n

【技术特征摘要】
1.一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,其特征在于,所述方法包含下述步骤:
步骤一,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;
步骤二,运用Pearson相关系数、XGBoost算法、CatBoost算法和随机森林算法对原始数据集中的特征变量进行综合打分,从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;
步骤三,根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选在并网状态下的特征变量作为训练模型的总数据,并对总数据进行训练集和检验集的划分;
步骤四,利用机器学习常用调参方法网格搜索的方式检索最优的参数组合,确定模型参数建立基于XGBoost算法故障监测模型;
步骤五,将步骤三的检验集带入步骤四的基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;
步骤六,在基于XGBo...

【专利技术属性】
技术研发人员:黄文广刘广臣陈文孙涛
申请(专利权)人:华风数据深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1