System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于LGBM-Adaboost的新能源出力预测方法技术_技高网

一种基于LGBM-Adaboost的新能源出力预测方法技术

技术编号:41287627 阅读:10 留言:0更新日期:2024-05-11 09:36
本发明专利技术提供了一种基于LGBM‑Adaboost的新能源出力预测方法,属于新能源出力预测技术领域。该方法包括采集影响新能源出力的条件样本;将条件样本输入到预先训练好的强预测器中,得到新能源出力预测结果;其中,强预测器是采用自适应提升算法Adaboost,在若干个弱预测器的基础上生成的,若干个弱预测器是以历史条件样本和历史新能源出力数据为训练数据,采用轻量级梯度提升机器学习算法LGBM生成的。本发明专利技术通过LGBM为新能源出力预测生成弱预测器,然后运用Ada‑boost方法选出强预测器并输出最终优化后的预测结果,能够较好地适应新能源机组出力预测的需求。

【技术实现步骤摘要】

本专利技术属于新能源出力预测,具体涉及一种基于lgbm-adaboost的新能源出力预测方法。


技术介绍

1、随着我国双碳战略的推行和电力体系市场化改革的推进,越来越多的以光伏和风电为代表的新能源机组并网,各种多能源聚合体也以各种运营方式参与市场竞争。相较于传统能源,新能源的出力不确定以及间歇性,不仅给电网的安全调度带来了挑战,还为市场参与主体带来了直接的运营风险。新能源的出力预测,不仅是市场主体在日前阶段的决策依据,直接影响日内阶段的结算结果,同时还是电网安全调度的核心监测变量。因此新能源机组的出力预测,尤其是短期出力预测,成为电力市场主体运营决策中必须掌握的关键技术之一。

2、对于新能源的出力预测,传统的方式主要给定变量的概率分布,如风电通常采用的weibull分布,然后通过时间序列分析进行预测,关注的特征因素主要为与光伏和风电发电直接相关的物理变量或电气变量。传统的时间序列分析既要求模型建构准确要求的信息充分,还要求时间序列稳健。近年来,随着行业的发展进入成熟期,大部分市场主体的新能源场站不仅规模巨大,而且区域分布跨度广、多样性特征明显,这不仅导致新能源机组的出力预测需要海量的数据并行运算,而且导致模型的特征空间维度急剧升高,以光照这一影响光伏发电的核心变量为例,不同的场站可能其地理、气候特征千差万别,市场主体在统一调度决策中,不得不考虑更多维度的特征变量,传统的时间序列分析预测方法,已经难以满足市场主体的需要。


技术实现思路

1、有鉴于此,本专利技术旨在提供一种基于lgbm-adaboost的新能源出力预测方法,该方法通过改进的lgbm为新能源出力预测生成基础数据集和弱预测器,最后运用ada-boost方法选出强预测器并输出最终优化后的预测结果,能够较好地适应新能源机组出力预测的需求。

2、为了实现上述技术问题,本专利技术提供的技术方案如下:

3、一种基于lgbm-adaboost的新能源出力预测方法,包括如下步骤:

4、采集影响新能源出力的条件样本;

5、将条件样本输入到预先训练好的强预测器中,得到新能源出力预测结果;

6、其中,强预测器是采用自适应提升算法adaboost,在若干个弱预测器的基础上生成的,若干个弱预测器是以历史条件样本和历史新能源出力数据为训练数据,采用轻量级梯度提升机器学习算法lgbm生成的。

7、进一步的,在生成弱预测器之前,还包括基于历史条件样本和历史新能源出力数据进行数据集生成,数据集生成,具体包括:

8、将历史条件样本和历史新能源出力数据两个样本序列进行数据清洗和数据预处理;

9、采用连续变量分箱的方法将样本序列进行离散化,得到两个离散变量序列;

10、采用互斥特征捆绑efb的方法降低离散变量序列的特征维度;

11、采用基于梯度的单边采样goss的方法从降低维度后的离散变量序列中生成数据集。

12、进一步的,在基于梯度的单边采样goss的方法中,采用二分类交叉熵作为该方法的代理损失函数,二分类交叉熵的表达式,具体如下:

13、

14、式中,表示二分类交叉熵的值,f(xi)表示特征序列xi的概率分布函数,yi表示第i个样本真实值,n表示样本总数。

15、进一步的,弱预测器的生成流程,具体包括:

16、基于初始损失函数生成lgbm的初始决策树;

17、采用直方图算法对初始决策树进行分裂;

18、当算法收敛后,调整lgbm的超参数,生成多个弱预测器;

19、采用tpe算法优化多个弱预测器的超参数,得到用于强预测器生成的若干个基础弱预测器。

20、进一步的,采用自适应鲁棒函数作为lgbm的损失函数构成形式,自适应鲁棒函数的表达式,具体为:

21、

22、式中,f(x,β,c)表示自适应鲁棒函数的值,β为控制鲁棒性的变形系数,c为尺度参数,x表示特征样本序列。

23、进一步的,采用tpe算法优化的超参数包括:树深度、叶片节点数、l1和l2正则化参数和自适应鲁棒函数中的形状参数。

24、进一步的,在tpe算法中,基于采集函数迭代求解待优化的超参数,采集函数的表达式,具体如下:

25、

26、式中,eiε(x)表示采集函数的值,θ表示概率密度分位点,ε表示残差的阈值;表示预测误差小于阈值的样本分布,l(x)表示预测误差大于阈值的样本分布,y表示真实样本变量,p(y)表示真实样本变量y的概率密度。

27、进一步的,强预测器的生成流程,具体包括:

28、设定若干个弱预测器迭代步对应的训练数据样本的初始权重为:

29、

30、式中,di表示第i步训练数据集对应的权值序列;表示第i步迭代第j个样本的权值;n为样本总数;

31、ada-boost在第t步获得的预测器为:

32、

33、式中,ωt(x)表示第t步获得的预测器输出,wi,t表示第i个样本在第t步的权重,xi表示特征样本序列,yi表示真实样本序列;

34、在t+1步,预测器的权重赋值系数更新为

35、

36、式中,γt表示第t步的权重赋值系数,表示第i步迭代第t个样本的权值;

37、当算法收敛后,ada-boost生成的强预测器为:

38、

39、式中,ω*(x)表示强预测器的输出,m为迭代总步数。

40、进一步的,预测器的加权预测误差为:

41、

42、式中,δt表示预测器的加权预测误差。

43、进一步的,ωt(x)在最终强预测器中的权重赋值系数,具体为:

44、

45、综上,本专利技术提供了一种基于lgbm-adaboost的新能源出力预测方法,包括采集影响新能源出力的条件样本;将条件样本输入到预先训练好的强预测器中,得到新能源出力预测结果;其中,强预测器是采用自适应提升算法adaboost,在若干个弱预测器的基础上生成的,若干个弱预测器是以历史条件样本和历史新能源出力数据为训练数据,采用轻量级梯度提升机器学习算法lgbm生成的。本专利技术通过lgbm为新能源出力预测生成弱预测器,然后运用ada-boost方法选出强预测器并输出最终优化后的预测结果,能够较好地适应新能源机组出力预测的需求。

本文档来自技高网...

【技术保护点】

1.一种基于LGBM-Adaboost的新能源出力预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,在生成所述弱预测器之前,还包括基于所述历史条件样本和历史新能源出力数据进行数据集生成,所述数据集生成,具体包括:

3.根据权利要求2所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,在所述基于梯度的单边采样GOSS的方法中,采用二分类交叉熵作为该方法的代理损失函数,所述二分类交叉熵的表达式,具体如下:

4.根据权利要求1所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,所述弱预测器的生成流程,具体包括:

5.根据权利要求4所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,采用自适应鲁棒函数作为LGBM的损失函数构成形式,所述自适应鲁棒函数的表达式,具体为:

6.根据权利要求5所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,采用TPE算法优化的超参数包括:树深度、叶片节点数、L1和L2正则化参数和所述自适应鲁棒函数中的形状参数。

7.根据权利要求4所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,在所述TPE算法中,基于采集函数迭代求解待优化的超参数,所述采集函数的表达式,具体如下:

8.根据权利要求1所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,所述强预测器的生成流程,具体包括:

9.根据权利要求8所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,预测器的加权预测误差为:

10.根据权利要求9所述的基于LGBM-Adaboost的新能源出力预测方法,其特征在于,Ωt(x)在最终的强预测器中的权重赋值系数,具体为:

...

【技术特征摘要】

1.一种基于lgbm-adaboost的新能源出力预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于lgbm-adaboost的新能源出力预测方法,其特征在于,在生成所述弱预测器之前,还包括基于所述历史条件样本和历史新能源出力数据进行数据集生成,所述数据集生成,具体包括:

3.根据权利要求2所述的基于lgbm-adaboost的新能源出力预测方法,其特征在于,在所述基于梯度的单边采样goss的方法中,采用二分类交叉熵作为该方法的代理损失函数,所述二分类交叉熵的表达式,具体如下:

4.根据权利要求1所述的基于lgbm-adaboost的新能源出力预测方法,其特征在于,所述弱预测器的生成流程,具体包括:

5.根据权利要求4所述的基于lgbm-adaboost的新能源出力预测方法,其特征在于,采用自适应鲁棒函数作为lgbm的损失函数构成形式,所述自适应鲁棒函数的表...

【专利技术属性】
技术研发人员:邓韦斯卢斯煜王皓怀戴仲覆鲁聪周保荣刘显茁程铭胡甲秋李崇浩邹金王嘉阳
申请(专利权)人:中国南方电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1