新能源出力预测方法技术

技术编号:37248208 阅读:11 留言:0更新日期:2023-04-20 23:27
本发明专利技术公开了新能源出力预测方法,包括以下步骤:步骤一,数据探索分析;步骤二,关键特征确认;步骤三,特征变量提取;步骤四,初次预测;步骤五,二次预测;本发明专利技术,按照时间顺序和周期性规律对数据进行探索性分析,并对异常值进行处理,之后根据使用领域确定关键特征,再利用互信息熵进行特征前向处理,提取影响显著的重要特征变量,然后构建LightGBM模型,将提取出显著特征作为输入值,基于LightGBM进行初次预测,并将预测结果作为新变量,将提取出的n个显著特征和LightGBM的预测结果作为输入值,运用XGBoost进行二次预测,得到最终模型预测结果,规避了单一模型难以进行场景迁移的局限性,提高模型的泛化能力,防止过拟合与欠拟合。防止过拟合与欠拟合。

【技术实现步骤摘要】
新能源出力预测方法


[0001]本专利技术涉及新能源出力预测
,具体为新能源出力预测方法。

技术介绍

[0002]随着中国“双碳”目标和新型电力系统建设目标的提出,未来电力系统将呈现高比例可再生能源和高度电力电子化的“双高”特征,可再生能源具有波动性和间歇性等不确定性特征,高比例可再生能源不仅在运行和调度时存在弃风、弃光等问题,还会给电力系统的稳定性带来挑战,同时由于高度电力电子化的电力系统转动惯量下降,其稳定性相较于传统电力系统要低,基于可再生能源历史出力和外部环境因素数据,准确预测其出力、有效量化其不确定性对优化风电、光伏电场运行调度以及保障电力系统安全稳定运行具有重要意义。
[0003]XGBoost极端梯度提升模型是以CART回归树为基础、对数据集进行分类和预测的一种迭代性、树类Boosting算法,XGBoost在GBDT的基础上加以改进,速度快、效果好、支持自定义损失函数、能够处理大规模数据,LightGBM系属于梯度提升决策树(Gradient Boosting Decision Tree)范畴的机器学习模型,基于梯度单边采样和互斥特征绑定实现对GBDT的优化,GBDT包含多个弱分类器,采用加法模型不断优化降低上一个弱分类器的训练残差,以达到分类和回归的目标,LightGBM模型的基本原理与XGBoost大致相同,但前者采用了基于直方图的决策树算法及带深度限制的叶节点生长策略,具有更快的训练速度且支持并行化学习,但是无论是Xgboost模型还是LGBM模型在处理单一场景时性能较好,但场景转移后受模型低泛化性和自身局限性的影响,难以进行场景迁移,因此设计新能源出力预测方法来规避单一模型的局限性,提高模型的泛化能力,防止过拟合与欠拟合是很有必要的。

技术实现思路

[0004]本专利技术的目的在于提供新能源出力预测方法,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:新能源出力预测方法,包括以下步骤:步骤一,数据探索分析;步骤二,关键特征确认;步骤三,特征变量提取;步骤四,初次预测;步骤五,二次预测;
[0006]其中上述步骤一中,按照时间顺序和周期性规律对数据进行探索性分析,并对异常值进行处理;
[0007]其中上述步骤二中,根据使用领域确定关键特征;
[0008]其中上述步骤三中,利用互信息熵进行特征前向处理,提取影响显著的重要特征变量;
[0009]其中上述步骤四中,构建LightGBM模型,将提取出显著特征作为输入值,基于LightGBM进行初次预测,并将预测结果作为新变量;
[0010]其中上述步骤五中,将提取出的n个显著特征和LightGBM的预测结果作为输入值,运用XGBoost进行二次预测,从而得到最终模型预测结果。
[0011]优选的,所述步骤一中,进行探索性分析的过程为:将新能源发电的发电量可以看成一个周期的连续变量的原则,之后根据原则对数据集进行探索性分析;对异常值进行处理的过程为:首先绘制特征变量的散点图,随后将异常值和离群点进行剔除,或者使用同列前一个值代替异常值,使散点图中的数据具有连续性和周期性。
[0012]优选的,所述步骤二中,使用领域包括光伏发电领域和风力发电领域,在光伏发电领域确定关键特征是通过分析光伏发电系统的工作原理、功率输入输出特征,来确定关键特征;在风力发电领域确定关键特征是通过分析风力发电系统的工作原理、功率输入输出特征,来确定关键特征。
[0013]优选的,所述步骤三中,信息熵主要采用数值形式刻画随机变量取值的不确定性程度,从而对随机变量信息含量进行定量描述,且信息熵的定义表达公式为:其中X为随机变量,p(x
i
)为x
i
分布的概率函数,x
i
为待求特征;条件熵是指当变量X给定时,变量Y所具有的不确定性程度,且条件熵定义表达公式为:
[0014][0015]其中X与Y均为随机变量,p(x
i
)为X=x
i
,Y=y
i
的联合概率函数。
[0016]优选的,所述步骤四中,初次预测的详细过程为:
[0017]S41:由GOSS先根据所有样本的梯度绝对值进行排序,选取前a*100%个样本作为集合A,再将剩下的(1

a)*100个样本作为集合A
C
,接着随机抽取b*100个样本作为集合B,其中B的大小为b*|A
C
|,将一共随机选取的小梯度样本占比b*(1

a)*100%生成一个小梯度样本集,接着在小梯度样本计算信息增益时,乘以一个常数系数gi为第i个样本损失函数的一阶导,之后O为决策树的一个分裂节点上的训练数据,在这个分裂节点上,特征j在点d上分裂的方差增益为:
[0018][0019]其中n
O
=∑I[x
i
∈O],(d)=∑I[x
i
∈O;x
ij
>d]对于特征j,决策树算法选择最优的分裂点然后计算最大的增益然后根据特征j
*
在点处将数据分裂为左右子节点,之后计算其信息增
益为:
[0020][0021]S42:计算GOSS(Gradient

basedOne

SideSampling,基于梯度的单边采样)近似误差为:
[0022]S43:计算GOSS泛化误差为:
[0023]S44:计算得出的方差增益与实际样本的方差增益之间的差距为:
[0024]S45:更新模型参数;
[0025]S46:将步骤三提取出的显著特征作为输入值,基于LightGBM进行初次预测,并将预测结果作为新变量。
[0026]优选的,所述步骤五中,二次预测的详细过程为:
[0027]S51:对于样本集x
i
(i=1,2,

,1974)进行识别,并构建回归树,其公式表达为:f
k
∈F,其中x
i
为第i个样本,为第i个样本的预测值,f
k
(x
i
)为第i个变量的第k个回归树所对应的回归方程,F为所有回归树的集合;
[0028]S52:构建目标函数,包括损失函数和正则化项,损失函数用于拟合训练数据,正则化项用于简化模型,其公式表达为:
[0029][0030]其中L(φ)为目标函数,为损失函数,∑
k
Ω(f
k
)为正则化项,y
i
为样本真实值;
[0031]S53:运用泰勒公式展开损失函数,其公式表达为:
[0032][0033]S55:将步骤四中得到的初次预测结果和步骤三提取出的n个显著特征作为输入值,运用XGBoost进行二次预测,从而得到最终模型预测结果。
[0034]与现有技本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.新能源出力预测方法,包括以下步骤:步骤一,数据探索分析;步骤二,关键特征确认;步骤三,特征变量提取;步骤四,初次预测;步骤五,二次预测;其特征在于:其中上述步骤一中,按照时间顺序和周期性规律对数据进行探索性分析,并对异常值进行处理;其中上述步骤二中,根据使用领域确定关键特征;其中上述步骤三中,利用互信息熵进行特征前向处理,提取影响显著的重要特征变量;其中上述步骤四中,构建LightGBM模型,将提取出显著特征作为输入值,基于LightGBM进行初次预测,并将预测结果作为新变量;其中上述步骤五中,将提取出的n个显著特征和LightGBM的预测结果作为输入值,运用XGBoost进行二次预测,从而得到最终模型预测结果。2.根据权利要求1所述的新能源出力预测方法,其特征在于:所述步骤一中,进行探索性分析的过程为:将新能源发电的发电量可以看成一个周期的连续变量的原则,之后根据原则对数据集进行探索性分析;对异常值进行处理的过程为:首先绘制特征变量的散点图,随后将异常值和离群点进行剔除,或者使用同列前一个值代替异常值,使散点图中的数据具有连续性和周期性。3.根据权利要求1所述的新能源出力预测方法,其特征在于:所述步骤二中,使用领域包括光伏发电领域和风力发电领域,在光伏发电领域确定关键特征是通过分析光伏发电系统的工作原理、功率输入输出特征,来确定关键特征;在风力发电领域确定关键特征是通过分析风力发电系统的工作原理、功率输入输出特征,来确定关键特征。4.根据权利要求1所述的新能源出力预测方法,其特征在于:所述步骤三中,信息熵主要采用数值形式刻画随机变量取值的不确定性程度,从而对随机变量信息含量进行定量描述,且信息熵的定义表达公式为:其中X为随机变量,p(x
i
)为x
i
分布的概率函数,x
i
为待求特征;条件熵是指当变量X给定时,变量Y所具有的不确定性程度,且条件熵定义表达公式为:其中X与Y均为随机变量,p(x
i
)为X=x
i
,Y=y
i
的联合概率函数。5.根据权利要求1所述的新能源出力预测方法,其特征在于:所述步骤四中,初次预测的详细过程为:S41:由GOSS先根据所有样本的梯度绝对值进行排序,选取前a*100%个样本作为集合A,再将剩下的(1

a)*100个样本作为集合A
C
,接着随机抽取b*100个样本作为集合B,其中B的大小为b*|A
C
|,将一共随机选取的小梯度样本占比b*(1

a)*100%生成一个小梯度样本集,接着在小梯度样本计算信息增益时,乘以一个常数系数gi为第i个样本损失函数的一阶导,之后O为决策树的...

【专利技术属性】
技术研发人员:陈刚范琨陈皓勇乐琴谢忠华顾婧婧刘敏叶俨毅王俊杰朱宁万利王博文王宇绅马成元
申请(专利权)人:广东博慎智库能源科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1