基于SVR算法和偏峰度的风电机组发电机故障预警方法技术

技术编号:25272291 阅读:24 留言:0更新日期:2020-08-14 23:05
本发明专利技术涉及风力发电机故障预警领域,提供了一种基于SVR算法和偏峰度的风电机组发电机故障预警方法,包括:对风电机组发电机的历史数据进行数据采集;进行数据清洗,去除异常数据;使用支持向量回归算法建立预警模型;残差分析预警:基于统计学中的偏度和峰度,计算预警模型输出值的残差,通过滑动窗口算法按天计算残差的峰度和偏度,偏度的最大值和峰度的最大值二者的均值作为预警模型阈值的最大值,偏度的最小值和峰度的最小值二者的均值为预警模型阈值的最小值,对风电机组发电机实时数据在线监测预警。本发明专利技术能在风电机组发电机发生故障前及时提供故障前预判,第一时间实现故障的分析和控制,防止带来巨大的经济损失和安全事故。

【技术实现步骤摘要】
基于SVR算法和偏峰度的风电机组发电机故障预警方法
本专利技术涉及风力发电机故障预警领域,特别涉及一种基于SVR算法和偏峰度的风电机组发电机故障预警方法。
技术介绍
随着近年来能源供应日益紧张,环境污染问题日益突出,国家对新能源的需求与日俱增,全球迫切地发展可再生能源来解决不可再生能源越来越匮乏的困境。风能作为一种清洁高效的能源已经成为国家重点关注和发展的对象。对于整个风电产业而言,路正在越走越宽。据《风电行业市场前瞻与投资战略规划分析报告》预计到2023年,全球风电累计装机量达969.15GW。数十年来,我国风电发展取得了举世瞩目的成就。产业规模迅速扩大,新增装机和累计装机连续多年领跑全球,并在2018年年底成为首个风电装机突破2亿千瓦的国家。欧洲风能协会(WindEurope)最新发布的一份报告显示,2019年上半年,欧洲风电新增装机容量达到4.9GW,去年同期为4.5GW。随着装机容量的快速增加,风电机组的正常运行决定着风电场的经济效益。当风电机组发生故障时,不仅会造成发电量的不足,而且可能会产生严重的安全事故。这是因为风场都处于偏远地区、风电场切分风复杂多变、且长期运行在野外、暴晒和雷雨等恶劣环境中,其次机舱位于50-80米的高空中,加剧了维护维修工作的展开。风电机组的核心部件一旦损坏,在风场无法修复,必须得运到专业厂家修理。因其维修费用高、周期长,势必给风电场造成巨大的经济损失,严重影响风电的经济效益。因此研发一种安全可靠的故障预警系统对风电场尤为重要。风电机组的故障诊断常用方法有时域分析方法和频域分析方法,时域分析方法主要研究不同时刻信号之间的关系,对于某些有明显特征的故障信号,可做出定性分析。频域分析方法通过研究波形的谐波分量来识别多种频率成分,但是频域分析所需要的信号需要特定的传感器来采集,以前安装的风机大多没有安装此类传感器,因此目前主流的方法还是采用比较经济的时域方法分析。现有的风电机组发电机预警方法普遍存在算法计算复杂、参数假设性强、耗费时间长、预测模型的可靠性不足、泛化能力弱等问题,限制了故障预测实用性的进一步提升。当机组发电机发生异常时,机组的温度参数偏离正常状态,但是温度参数的停机值的设定依据是出厂设置,一般设定比较高,无法识别出故障初期的异常状态。
技术实现思路
本专利技术的目的是克服现有技术的不足,提供了一种基于SVR算法和偏峰度的风电机组发电机故障预警方法,解决现有方法存在算法计算复杂、参数假设性强、耗费时间长、预测模型的可靠性不足、泛化能力弱等问题;通过检测发电机轴承温度实际值与预测值的变化趋势,基于机器学习中鲁棒性比较强的支持向量回归算法(SVR)为发电机轴承温度预测模型,实现训练速度快、泛化能力强、收敛速度快、准确度高的在线监测预警。本专利技术采用如下技术方案:一种基于SVR算法和偏峰度的风电机组发电机故障预警方法,所述方法包括如下步骤:S1、对风电机组发电机的历史数据进行数据采集;S2、对采集到的数据进行数据清洗,去除异常数据;S3、提取模型特征:采用随机森林算法提取建模特征;S4、建立预警模型:使用支持向量回归算法(SVR)建立预警模型;S5、残差分析预警。进一步的,基于统计学中的峰度和偏度,计算所述预警模型输出值的残差(模型预测值与实时数据之差),通过滑动窗口算法按天计算残差的峰度和偏度,通过计算偏度的最大值和峰度的最大值二者的均值作为预警模型阈值的最大值,通过计算偏度的最小值和峰度的最小值二者的均值作为预警模型阈值的最小值,以所述阈值的最大值、阈值的最小值作为风电机组发电机故障发生的阈值对风电机组发电机实时数据进行在线监测预警。进一步的,步骤S1中,所述历史数据为数据采集与监视控制系统(supervisorycontrolanddataacquisition,SCADA)采集的SCADA数据。进一步的,步骤S2中,所述数据清洗的具体步骤如下:S2.1数据缺失值处理:若缺失值样本小于设定比例,采用删除法;若缺失值样本大于等于所述设定比例,采用热卡填充法填充数据缺失值;S2.2对经S2.1处理后的数据进行滤波处理:通过统计过程控制SPC和高斯复合滤波去除数据中的异常点。进一步的,步骤S3中,采用随机森林算法提取模型的特征的具体步骤如下:S3.1采用随机森林算法对数据集的多个特征进行重要性度量;S3.2根据每个特征的重要性按降序排序;S3.3依据特征重要性剔除相应比例的特征,得到一个新的特征集;S3.4用新的特征集重复S3.1至S3.3的过程,直到剩下m个特征,m为设定值;S3.5选择袋外误差率最低的特征集作为模型特征。进一步的,步骤S3.1的具体方法为:步骤3.1.1对每一个决策树,选择相应的袋外数据(outofbag,OOB)计算袋外数据误差,记为errOOB1;所谓袋外数据是指,每次建立决策树时,通过重复抽样得到一个数据用于训练决策树,这时还有大约1/3的数据没有被利用,没有参与决策树的建立。袋外数据可以用于对决策树的性能进行评估,计算模型的预测错误率,称为袋外数据误差。3.1.1.1对于每个样本,计算其作为OOB样本的树对该样本的分类情况;3.1.1.2以简单投票作为该样本的分类结果;3.1.1.3利用误分个数占样本总数的比率,作为袋外数据误差;步骤3.1.2随机对袋外数据所有样本的特征X加入噪声干扰,再次计算袋外数据误差,记为errOOB2;步骤3.1.3假设森林中有N棵树,则特征X的重要性等于∑(errOOB2-errOOB1)/N。进一步的,步骤S4中,建立预警模型的具体步骤如下:S4.1特征标准化处理:将步骤S3中选取好的特征进行标准化处理;S4.2切分数据集:将特征(某特征的数据集)分为训练集、验证集和测试集;S4.3训练:将训练集导入模型进行训练;S4.4诊断模型:训练完成后将测试集输入模型,利用均方误差和R平方评价指标对模型的泛化能力进行评价;S4.5模型调优:通过验证集选择模型的超参数(模型内置参数),同时监控模型是否发生过拟合(以决定是否停止训练);重复S4.3至S4.5步骤使模型达到S4.4评价指标的预期范围。进一步的,步骤S5的具体方法如下:S5.1利用训练数据计算模型输出值的残差;S5.2利用滑动窗口算法按天计算残差的峰度和偏度,然后再计算峰度和偏度的最大值、最小值;S5.3计算偏度的最大值和峰度的最大值二者的均值作为预警模型阈值的最大值,计算偏度的最小值和峰度的最小值二者的均值作为预警模型阈值的最小值,所述阈值的最大值和阈值最小值作为预警模型的阈值;S5.4阈值作为上下限,将正常机组和异常机组的特征数据输入到模型,计算出模型输出值的残差,通过滑动窗口算法按天计算残差值偏度和峰度的均值,用S5.3计算的阈值进行检测是否超出阈值范围;S5.5模型接入风力发本文档来自技高网
...

【技术保护点】
1.一种基于SVR算法和偏峰度的风电机组发电机故障预警方法,所述方法包括如下步骤:/nS1、对风电机组发电机的历史数据进行数据采集;/nS2、对采集到的数据进行数据清洗,去除异常数据;/nS3、提取模型特征:采用随机森林算法提取建模特征;/nS4、建立预警模型:使用支持向量回归算法建立预警模型;/nS5、残差分析预警。/n

【技术特征摘要】
1.一种基于SVR算法和偏峰度的风电机组发电机故障预警方法,所述方法包括如下步骤:
S1、对风电机组发电机的历史数据进行数据采集;
S2、对采集到的数据进行数据清洗,去除异常数据;
S3、提取模型特征:采用随机森林算法提取建模特征;
S4、建立预警模型:使用支持向量回归算法建立预警模型;
S5、残差分析预警。


2.如权利要求1所述的基于SVR算法和偏峰度的风电机组发电机故障预警方法,其特征在于,步骤S5中,基于统计学中的峰度和偏度,计算所述预警模型输出值的残差,所述残差为模型预测值与实时数据之差;通过滑动窗口算法按天计算残差的峰度和偏度,通过计算偏度的最大值和峰度的最大值二者的均值作为预警模型阈值的最大值,通过计算偏度的最小值和峰度的最小值二者的均值作为预警模型阈值的最小值,以所述阈值的最大值、阈值的最小值作为风电机组发电机故障发生的阈值对风电机组发电机实时数据进行在线监测预警。


3.如权利要求1所述的基于SVR算法和偏峰度的风电机组发电机故障预警方法,其特征在于,步骤S2中,所述数据清洗的具体步骤如下:
S2.1数据缺失值处理:若缺失值样本小于设定比例,采用删除法;若缺失值样本大于等于所述设定比例,采用热卡填充法填充数据缺失值;
S2.2对经S2.1处理后的数据进行滤波处理:通过统计过程控制SPC和高斯复合滤波去除数据中的异常点。


4.如权利要求1所述的基于SVR算法和偏峰度的风电机组发电机故障预警方法,其特征在于,步骤S3中,采用随机森林算法提取模型的特征的具体步骤如下:
S3.1采用随机森林算法对数据集的多个特征进行重要性度量;
S3.2根据每个特征的重要性按降序排序;
S3.3依据特征重要性剔除相应比例的特征,得到一个新的特征集;
S3.4用新的特征集重复S3.1至S3.3的过程,直到剩下m个特征,m为设定值;
S3.5选择袋外误差率最低的特征集作为模型特征。


5.如权利要求4所述的基于SVR算法和偏峰度的风电机组发电机故障预警方法,其特征在于,步骤S3.1的具体方法为:
步骤3.1.1对每一个决策树,选择相应的袋外数据OOB计算袋外数据误差,记为errOOB1;
步骤3.1.2随机对袋外数据OOB所有样本的特征X加入噪声干扰,再次计算袋外数据误差,记为errOOB2;
步骤3.1.3假设森林中...

【专利技术属性】
技术研发人员:魏乐胡晓东房方
申请(专利权)人:华北电力大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1