一种基于LightGBM模型的光伏电站逆变器故障诊断方法技术

技术编号:34443904 阅读:24 留言:0更新日期:2022-08-06 16:36
本发明专利技术公开一种基于LightGBM模型的光伏电站逆变器故障诊断方法,涉及光伏发电检测领域。该基于LightGBM模型的光伏电站逆变器故障诊断方法,包括以下步骤:S1、数据采集;S2、特征提取;S3、模型选择;S4、模型实现。该基于LightGBM模型的光伏电站逆变器故障诊断方法,采用大数据分类方法对光伏电站逆变器的健康状态进行评估,从而进行故障诊断,光伏电站逆变器的数据采集点多,采集的逆变器运行数据数量大、种类多、时间跨度长,数据获取简便,采用科学的方法对采集的原始数据进行数据清洗和特征提取,特征间相关性分析可更直观看到特征间相互关系,找出判断逆变器运行状态的重要因素,采用经典的大数据分类模型,模型成熟、预测准确率高。准确率高。准确率高。

【技术实现步骤摘要】
一种基于LightGBM模型的光伏电站逆变器故障诊断方法


[0001]本专利技术涉及光伏发电检测
,具体为一种基于LightGBM模型的光伏电站逆变器故障诊断方法。

技术介绍

[0002]太阳能作为一种新型的绿色可再生能源,与其他新能源相比利用最大,,其环保、绿色、经济的优点,使得太阳能成为今后大力开发的新能源之一。特别是近几十年来,随着科学技术的不断进步,太阳能及其相关产业成为世界发展最快的行业之一。
[0003]虽然光伏并网发电的技术已经越来越广泛的被应用到世界各国,,但是光伏电站的运行环境并不友好,因此需要耗费大量人力、物力维护光伏电站。进而,能否及时监测和评估光伏电站的运行状态,是避免发生故障的关键,同时对优化光伏电站和提高大规模并网的效率也有重大意义。
[0004]作为光伏并网发电系统中最为核心的部件,逆变器的能否正常工作直接影响整个电网系统的健康运营,对于普通用户,使光伏逆变器具有智能操控性;对于光伏系统的维护人员,能够远程地,实时地保持光伏逆变器处于安全,可控,高效的状态下运行,已经成为整个光伏产业发展中待解决的问题。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术的不足,本专利技术公开了一种基于LightGBM模型的光伏电站逆变器故障诊断方法,以解决上述
技术介绍
中提出的问题。
[0007](二)技术方案
[0008]为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于LightGBM模型的光伏电站逆变器故障诊断方法,包括以下步骤:
[0009]S1、数据采集;
[0010]S2、特征提取;
[0011]S3、模型选择;
[0012]S4、模型实现。
[0013]优选的,所述数据采集中的数据为光伏电站逆变器的运行数据,采集运行过程中的日发电量、月发电量、年发电量、累计总发电量、并网功率(有效功率)、实时功率(视在功率)、直流电流、直流电压、交流电流R、交流电流S、交流电流t、交流电压r、交流电压s、交流电压t、无功功率、功率因素。
[0014]优选的,所述数据采集间隔时间为75秒,取时间间隔最新数据。
[0015]优选的,所述数据采集均为随时间变化的数据,对这些逆变器每日的发电数据,提取每日的以下特征数据:
[0016]日发电电量:发电结束日累计充电电量

发电开始日累计充电电量;
[0017]日平均功率:实时功率平均值;
[0018]平均日发电量:日发电量平均值;
[0019]平均月发电量:月发电量平均值;
[0020]直流电压极差:最高直流电压

最低直流电压;
[0021]直流电流极差:最高直流电流

最低直流电流;
[0022]交流电压r极差:最高交流电压r

最低交流电压r;
[0023]交流电压r极差:最高交流电压r

最低交流电压r;
[0024]交流电压s极差:最高交流电压s

最低交流电压s;
[0025]交流电压s极差:最高交流电压s

最低交流电压s;
[0026]交流电压t极差:最高交流电压t

最低交流电压t;
[0027]交流电压t极差:最高交流电压t

最低交流电压t;
[0028]日平均有效功率:日有效功率平均值;
[0029]根据逆变器实际状态对数据添加标签,标签为“正常”“故障”两种,将上述特征数据作为输入变量,逆变器实际状态标签为输出变量。
[0030]优选的,所述模型选择采用LightGBM(Light Gradient Boosting Machine)模型,LightGBM是GBDT算法框架下的一种改进实现,一种基于决策树算法的快速、分布式、高性能的GBDT框架,支持高效率的并行训练,并且具有更少的样本、更少的特征、更少的内存等优点。
[0031]优选的,所述LightGBM使用直方图算法(Histogram)在牺牲一定精度的条件下换取计算速度的提升和内存消耗的降低,使用了如下的两种方法:
[0032]单边梯度采样(Gradient

based One

Side Sampling(GOSS)):首先根据样本梯度进行排序,选择Top a%的大梯度的样本,再随机选择b%的其他样本,组合起来去评估信息增益,减少了样本的量(间接降低小梯度样本的出现几率);
[0033]互斥特征合并(Exclusive Feature Bundling(EFB)):基于图算法,合并了部分特征,减少总特征量。
[0034]优选的,所述LightGBM采用leaf_wise策略,而xgboost采用level_wise策略,LightGBM通过更改决策树算法的决策规则,直接原生支持类别特征,不需要转化,提高了近8倍的速度,LightGBM原生支持并行学习,目前支持特征并行(Featrue Parallelization)和数据并行(Data Parallelization)两种;
[0035]特征并行的主要思想是在不同机器、在不同的特征集合上分别寻找最优的分割点,然后在机器间同步最优的分割点;
[0036]数据并行则是让不同的机器先在本地构造直方图,然后进行全局的合并,最后在合并的直方图上面寻找最优分割点。
[0037]优选的,所述模型实现采用python中lightgbm库以及sklearn库中数据拆分、数据评价等相关函数,包括导入数据

数据特征筛选

划分训练集和测试集

模型参数设置

模型训练并导出模型

模型预测

模型评价

模型更新

模型应用。
[0038]优选的,所述导入数据:此步骤导入光伏电站逆变器发电数据,并对数据做初步清洗,删除缺失数据;
[0039]所述数据特征筛选:将日发电量、月发电量、年发电量、累计总发电量、并网功率
(有效功率)、实时功率(视在功率)、直流电流1、直流电压1、交流电流R、交流电流S、交流电流t、交流电压r、交流电压s、交流电压t、无功功率、功率因素等特征数据,并做好标签分类,根据电池状态将数据分别添加健康状态标签;
[0040]划分训练集和测试集:用sklearn.cross_validation进行训练数据集划分,训练集和交叉验证集比例为8:2,该比例可以根据需要设置,并将划分结果创建成lgb特征的数据集格式;
[0041]所述模型参数设置:将参数写成字典的形式;
[0042]所述模型训练并导出模型:直接调用python中LightGBM库,对模型进行训练,并将模型保存至本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于LightGBM模型的光伏电站逆变器故障诊断方法,其特征在于,包括以下步骤:S1、数据采集;S2、特征提取;S3、模型选择;S4、模型实现。2.根据权利要求1所述的一种基于LightGBM模型的光伏电站逆变器故障诊断方法,其特征在于:所述数据采集中的数据为光伏电站逆变器的运行数据,采集运行过程中的日发电量、月发电量、年发电量、累计总发电量、并网功率(有效功率)、实时功率(视在功率)、直流电流、直流电压、交流电流R、交流电流S、交流电流t、交流电压r、交流电压s、交流电压t、无功功率、功率因素。3.根据权利要求2所述的一种基于LightGBM模型的光伏电站逆变器故障诊断方法,其特征在于:所述数据采集间隔时间为75秒,取时间间隔最新数据。4.根据权利要求1所述的一种基于LightGBM模型的光伏电站逆变器故障诊断方法,其特征在于:所述数据采集均为随时间变化的数据,对这些逆变器每日的发电数据,提取每日的以下特征数据:日发电电量:发电结束日累计充电电量

发电开始日累计充电电量;日平均功率:实时功率平均值;平均日发电量:日发电量平均值;平均月发电量:月发电量平均值;直流电压极差:最高直流电压

最低直流电压;直流电流极差:最高直流电流

最低直流电流;交流电压r极差:最高交流电压r

最低交流电压r;交流电压r极差:最高交流电压r

最低交流电压r;交流电压s极差:最高交流电压s

最低交流电压s;交流电压s极差:最高交流电压s

最低交流电压s;交流电压t极差:最高交流电压t

最低交流电压t;交流电压t极差:最高交流电压t

最低交流电压t;日平均有效功率:日有效功率平均值;根据逆变器实际状态对数据添加标签,标签为“正常”“故障”两种,将上述特征数据作为输入变量,逆变器实际状态标签为输出变量。5.根据权利要求1所述的一种基于LightGBM模型的光伏电站逆变器故障诊断方法,其特征在于:所述模型选择采用LightGBM(Light Gradient Boosting Machine)模型,LightGBM是GBDT算法框架下的一种改进实现,一种基于决策树算法的快速、分布式、高性能的GBDT框架,支持高效率的并行训练,并且具有更少的样本、更少的特征、更少的内存等优点。6.根据权利要求5所述的一种基于LightGBM模型的光伏电站逆变器故障诊断方法,其特征在于:所述LightGBM使用直方图算法(Histogram)在牺牲一定精度的条件下换取计算速度的提升和内存消耗的降低,使用了如下的两种方法:
单边梯度采样(Gradient

based One

Side Sampling(GOSS)):首先根据样本梯度进行排序,选择Top a%的大梯度的样本,再随机选择b%的其他样本,组合起来...

【专利技术属性】
技术研发人员:汪宁宁洪星朱冲杨帆陈超
申请(专利权)人:江苏慧智能源工程技术创新研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1