【技术实现步骤摘要】
一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法
[0001]本专利技术公开了一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法,涉及信息
和电力负荷预测
技术介绍
[0002]目前,电力工业在我国飞速发展,但是其受限于目前技术无法对电能进行大规模存储,而过多生产电力会导致资源浪费,电力生产不足会影响到正常的经济生活。所以,设计一个高精度的电力负荷预测模型以预测未来用电量是要解决的技术问题之一。
[0003]现有技术中,主要有两大类方法可以实现电力负荷预测:一类是用时间序列方法来实现预测,其实质是对历史数据的拟合,一类是用机器学习方法预测,例如决策树、支持向量机等。但是上述传统预测方法存在一定缺陷,例如,时间序列方法无法使用多变量数据预测,机器学习方法需要寻求最优参数,并且寻参时容易陷入局部最优。
技术实现思路
[0004]本专利技术针对电力负荷预测精度不高的问题,提供一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法。为避免陷入局部最优,使用引入自适应学习因子和差 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进蜻蜓与轻量级梯度提升树模型的电力负荷预测方法,其特征在于,所述方法包括:S101:采集数据预处理,本发明的数据预处理包括缺失值处理、数据规范化、异常值处理、数据离散化;S102:基于引入自适应学习因子和差分进化策略的蜻蜓算法对轻量级梯度提升树模型的训练参数进行优化,并将改进的轻量级梯度提升树模型应用于电力负荷预测;S103:结合测试集进行模型检验,计算预测值与实际值的误差,验证模型的优良。2.根据权利要求1所述的电力负荷预测方法,其特征在于:S1011:本发明中对数据进行预处理时,对于缺失值处理的三种方法:直接删除法;替换插值;预测插补;常见的数据规范化有三种方法:最小最大法;log函数规范化;零
‑
均值规范化;常见的特征选择类型分为三类:过滤式、包裹式、嵌入式。3.根据权利要求1所述的电力负荷预测方法,其特征在于:S1021:本发明提出低内存使用,可处理大规模数据的轻量级梯度提升树模型对电力负荷进行预测;轻量级梯度提升树模型采用了基于直方图的决策树算法,首先把样本中连续的浮点特征离散化成k个整数,并构造一个宽度为k的直方图;然后在遍历数据的时候,把离散化后的值作为索引在直方图中积累统计量,一次遍历结束之后,直方图积累了需要的统计量,最后通过直方图的离散值遍历找出最佳的分割点。这样将大规模的数据放到了直方图中,使得内存占用更小,模型运算更快更加稳定;在此基础上,轻量级梯度提升树模型通过直方图做差加速,一个叶子的直方图可以由它的父亲节点和兄弟节点的直方图做差来获得,并且直方图的宽度都为k,在构造直方图时,遍历该叶子上的所有数据,可以通过直方图做差只需遍历k次,大大提升了运行速度。轻量级梯度提升树还可以通过先计算直方图小的叶子节点,然后通过做差来获得直方图大的兄弟节点,用较小的代价得到其他兄弟节点的直方图;针对使用按层生长的Level
‑
wise决策树生长策略效率低下的问题,轻量级梯度提升树采用了较高效的带有深度限制的按叶子生长的Leaf
‑
wise策略;Level
‑
wise在进行遍历数据时可以同时分裂同一层的叶子,不易造成过拟合,但是在遍历时不加以区分同一层叶子的分裂增益,增大了计算开销;Leaf
‑
wise可以根据当前所有叶子中分裂增益最大的一个叶子进行分裂,并以此循环,这样在分裂次数相同的情况下,Leaf
‑
wise可以降低误差,获得更高的精度;为避免模型生出较深的决策树而产生过拟合,轻量级梯度提升树在此基础上增加了最大深度限制,这样既保证了低误差、高效率,还可以防止过拟合。4.权利要求1所述的电力负荷预测方法,其特征在于:S1022:蜻蜓算法是一种基于仿生学提出的启发式搜索算法,研究表明,在自然界中,蜻蜓的生活习性可以归纳为分离、结队、聚集、觅食和避敌五种行为;而群体的主要目标是为了生存,所以群体中个体都会被食物吸引,并躲避敌人;因此,该群体具有五种不同类型的行为来更新个体的位置,设五种行为的位置向量分别为S
i
,A
i
,C
i
,F
i
,E
i
,这些行为通过以下公式进行数学建模:(1)、分离行为
式中,i=1,2,
…
,N
p
;j=1,2,
…
,N,S
i
是第i个蜻蜓个体分离后的位置。N指与第i个蜻蜓个体相邻的个体数,当两个蜻蜓的欧式距离小于搜索半径r,详见式(6),就表示这两个个体是相邻个体;N
p
表示群体的数量,X,X
j
分别是目前的蜻蜓个体和第j个蜻蜓个体的位置;(2)、结队行为式中,A
i
第i个蜻蜓个体结队后的位置,V
j
表示第j个相邻蜻蜓个体的速度;(3)、聚集行为式中,C
i
第i个蜻蜓个体聚集后的位置;(4)、觅食行为F
i
=X
+
‑
X
ꢀꢀꢀꢀ
(4)式中,F
i
表示第i个蜻蜓个体食物源的位置,X
+
表示食物源的位置,也代表当前个体的最佳适应度值;(5)、避敌行为E
i
=X+X
‑
ꢀꢀꢀꢀ
(5)式中,E
i
表示第i个蜻蜓个体敌人的位置X
‑
表示敌人的位置,也代表当前个体的最差适应度值;食物源的位置和敌人的位置分别是从当前蜻蜓发现的最佳适应度和最差适应度选择的。一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。