基于随机森林回归和多步寻优的短期负荷需求预测方法技术

技术编号:21893543 阅读:45 留言:0更新日期:2019-08-17 15:09
本发明专利技术公开了基于随机森林回归和多步寻优的短期负荷需求预测方法,包括:S100提供原始数据集,将原始数据集划分为训练集和预测集;S200对原始数据集进行特征筛选;S300基于训练集训练随机森林回归模型,对随机森林回归模型参数进行多步寻优,得短期负荷需求预测模型;S400以预测集为输入,利用短期负荷需求预测模型获得负荷需求预测值,将负荷需求预测值及对应的负荷特征数据加入训练集,作为预测下一个预测点的负荷需求值时的历史负荷需求数据和历史负荷特征数据。本发明专利技术方法模型全局泛化性能强,参数选择快速,运行效率高,短期负荷需求预测精度高。

Short-term load demand forecasting method based on Stochastic Forest regression and multi-step optimization

【技术实现步骤摘要】
基于随机森林回归和多步寻优的短期负荷需求预测方法
本专利技术涉及电力负荷需求预测领域,尤其涉及基于随机森林回归和多步寻优的短期负荷需求预测方法。
技术介绍
随着我国电力大数据+互联网融合的日益深入,电网公司与售电企业逐步走入市场,短期电力负荷需求预测对电网系统调控和电力市场运营都具有重要意义。电力负荷需求预测是电网经济安全运行的必要保障。可以说,精准的短期负荷预测(ShortTermLoadForecasting,STLF)对电力需求响应、能源市场分析以及电力输配电规划具有重要决策意义。由于短期电力负荷需求受到诸多如温度、假期、地区等非线性因素的影响,因此特征数据质量以及所用预测数学模型对提高STLF预测精度至关重要。目前,短期电力负荷预测主要分为两大类:一类是以时间序列、灰色预测为主的常规回归方法;另一类是以神经网络、机器学习为代表的智能预测方法,如人工神经网络(ArtificialNeuralNetwork,ANN)等方法。近年来,由于支持向量回归(SupportVectorRegression,SVR)具有泛化能力较强、自定义核函数等优点,国内外学者将其作为电力负荷预测的研究热点。然而,SVR预测模型的最终预测精度受其算法本身和输入特征的选择影响较大,输入特征、核函数以及优化算法的选取往往需要经过复杂的预实验。作为新兴机器学习方法的随机森林回归(RandomForestRegression,RFR)可望解决上述问题。RFR通过Bootstrap重抽样方法组合回归树进行预测,具有预测精度高、收敛速度快等优点,在许多预测领域已被广泛研究。此外,RFR建模无需复杂的特征选择算法,所有特征均可用于建立预测模型,但是RFR的预测性能受其模型参数影响较大。
技术实现思路
针对现有短期负荷需求预测技术存在的受其算法本身和输入特征的选择影响较大、以及输入特征、核函数和优化算法的选取往往需要经过复杂的预实验等缺陷,本专利技术提出了基于随机森林回归和多步寻优的短期负荷需求预测方法,以有效提高短期电力负荷需求预测精度。本专利技术提供的基于随机森林回归和多步寻优的短期负荷需求预测方法,包括:S100提供原始数据集,包括历史负荷特征数据、历史负荷需求数据以及预测日负荷特征数据;所述负荷特征数据指负荷需求相关的特征数据;将历史负荷特征数据和历史负荷需求数据作为训练集,将预测日负荷特征数据作为预测集;S200将历史负荷特征数据和历史负荷需求数据分别作为负荷特征样本与负荷样本,分别计算各维负荷特征与负荷间的相关系数,从训练集和预测集中剔除相关系数绝对值小于预设阈值的负荷特征数据,对相关系数绝对值不大于预设阈值的负荷特征数据,将相关系数与自然数1之差的绝对值作为该维负荷特征的衰减权重;预设阈值为经验值;S300基于训练集训练随机森林回归模型,对随机森林回归模型参数进行多步寻优,得短期负荷需求预测模型;参数包括回归树的数量m和深度d;所述对随机森林回归模型参数进行多步寻优具体为:S310利用网格搜索法为每个参数设置相应的搜索间隔后构成高维搜索向量,遍历高维搜索向量计算各搜索区域的适应度,适应度小于预设适应度阈值的搜索区域即局部优化域;S320以局部优化域作为果蝇优化法的参数选取区域,将最佳参数当作果蝇最佳位置,利用果蝇优化法进行多步寻优搜索最佳参数;S400以预测集为输入,利用短期负荷需求预测模型获得负荷需求预测值,将负荷需求预测值及对应的负荷特征数据加入训练集,作为预测下一个预测点的负荷需求值时的历史负荷需求数据和历史负荷特征数据。进一步的,所述历史负荷特征数据和所述预测日负荷特征数据分别至少包括历史日和预测日的日期数据、气象数据、以及相似日负荷值;所述相似日负荷值,指与当前日负荷特征的欧氏距离最小的历史负荷特征所对应历史日的电力负荷值。所述气象数据和所述日期数据均通过中国气象数据网提供的API接口实时获取。进一步的,所述历史负荷需求数据从智能电能表采集的用户电力信息数据中获取。进一步的,S200中,各维负荷特征与负荷间的相关系数其中,rxy表示负荷特征与负荷间的相关系数;Sxy表示负荷特征样本与负荷样本的协方差;Sx和Sy分别表示负荷特征样本和负荷样本的标准差;xj和yj分别表示负荷特征样本和负荷样本中第j个样本,n表示样本数;xavg和yavg分别表示负荷特征样本和负荷样本的平均值。作为优选,在执行步骤S300前,对步骤S200处理后的数据集进行缺失值处理和标准化。进一步的,S300中,基于训练集训练随机森林回归模型具体为:采用Bootstrap重抽样方法从训练集中选取m个子集,利用每个子集分别训练得到一颗回归树,基于损失最小化原则集成回归树,获得随机森林回归模型。进一步的,S410中计算各搜索区域的适应度,进一步为:将训练集随机等分为若干组,其中一组作为测试集,其余组作为子训练集;采用各组子训练集分别训练当前随机森林回归模型,每次训练后采用训练后的随机森林回归模型预测测试集对应的预测负荷值;训练完毕,分别计算各搜索区域的适应度其中,为第p次训练后利用测试集获得的预测负荷值,P为子训练集数;ξp为测试集对应的实际负荷值。进一步的,S420进一步包括:(1)初始化最大迭代次数maxgen,种群大小sizepop和果蝇初始位置(X_axis,Y_axis),将果蝇位置看作模型参数,采用二进制编码构造参数;(2)在参数选取区域内对果蝇个体赋予随机飞行距离和方向,获得果蝇个体更新后的位置;(3)基于果蝇个体当前位置计算气味浓度值,并对其进行二进制编码,气味浓度值为果蝇个体到原点距离的倒数;判断气味浓度值代入sigmoid函数的结果是否大于0.5,若是,将气味浓度值解码为十进制值,即优化后的模型参数;若不是,执行步骤(2),对果蝇个体位置做下一次迭代更新;(4)每次迭代通过果蝇个体的新位置生成新的气味浓度值,基于新的气味浓度值执行步骤(3);当迭代次数大于maxgen或新的气味浓度值小于历史最佳浓度值,则迭代结束,当前模型参数即最佳参数;否则,返回步骤(2)继续更新果蝇位置。作为优选,上述短期负荷需求预测方法中,基于滚动时域预测法预测负荷需求预测值,即以预设时间间隔为时域进行滚动预测;每次预测完成,将每次预测的负荷需求预测值及对应的负荷特征数据加入训练集中,用来在下一次预测前对随机森林回归模型进行训练和多步寻优。和现有技术相比,本专利技术具有以下特点和有益效果:(1)对影响短期负荷需求预测的特征因子中,不再仅仅局限于考虑单一因素对短期负荷的作用,而是采用多负荷特征及融合特征来综合考虑各因素作为电力负荷特征,相比于其它预测技术考虑更为全面;(2)对负荷相关性较小的特征进行剔除,以提高预测模型性能,同时也对多重共线性特征进行相应的权重衰减,降低共线性特征对预测模型的影响;(3)Bootstrap重抽样方法组合回归树进行预测,将多个弱学习器组合起来形成强学习器,强学习器具有预测精度高、收敛速度快等优点,使得预测模型可以很好地处理具有多种来源的数据组成或是异构数据集,此外,预测模型的最终预测精度不再受算法本身和输入特征的选择影响,输入特征、核函数以及优化算法的选取无需经过复杂的预实验,在实际应用中可以有效提高短期电力负荷需求的预测精度;(4)在影响本文档来自技高网
...

【技术保护点】
1.基于随机森林回归和多步寻优的短期负荷需求预测方法,其特征是,包括:S100提供原始数据集,包括历史负荷特征数据、历史负荷需求数据以及预测日负荷特征数据;所述负荷特征数据指负荷需求相关的特征数据;将历史负荷特征数据和历史负荷需求数据作为训练集,将预测日负荷特征数据作为预测集;S200将历史负荷特征数据和历史负荷需求数据分别作为负荷特征样本与负荷样本,分别计算各维负荷特征与负荷间的相关系数,从训练集和预测集中剔除相关系数绝对值小于预设阈值的负荷特征数据,对相关系数绝对值不大于预设阈值的负荷特征数据,将相关系数与自然数1之差的绝对值作为该维负荷特征的衰减权重;预设阈值为经验值;S300基于训练集训练随机森林回归模型,对随机森林回归模型参数进行多步寻优,得短期负荷需求预测模型;参数包括回归树的数量m和深度d;所述对随机森林回归模型参数进行多步寻优具体为:S310利用网格搜索法为每个参数设置相应的搜索间隔后构成高维搜索向量,遍历高维搜索向量计算各搜索区域的适应度,适应度小于预设适应度阈值的搜索区域即局部优化域;S320以局部优化域作为果蝇优化法的参数选取区域,将最佳参数当作果蝇最佳位置,利用果蝇优化法进行多步寻优搜索最佳参数;S400以预测集为输入,利用短期负荷需求预测模型获得负荷需求预测值,将负荷需求预测值及对应的负荷特征数据加入训练集,作为预测下一个预测点的负荷需求值时的历史负荷需求数据和历史负荷特征数据。...

【技术特征摘要】
1.基于随机森林回归和多步寻优的短期负荷需求预测方法,其特征是,包括:S100提供原始数据集,包括历史负荷特征数据、历史负荷需求数据以及预测日负荷特征数据;所述负荷特征数据指负荷需求相关的特征数据;将历史负荷特征数据和历史负荷需求数据作为训练集,将预测日负荷特征数据作为预测集;S200将历史负荷特征数据和历史负荷需求数据分别作为负荷特征样本与负荷样本,分别计算各维负荷特征与负荷间的相关系数,从训练集和预测集中剔除相关系数绝对值小于预设阈值的负荷特征数据,对相关系数绝对值不大于预设阈值的负荷特征数据,将相关系数与自然数1之差的绝对值作为该维负荷特征的衰减权重;预设阈值为经验值;S300基于训练集训练随机森林回归模型,对随机森林回归模型参数进行多步寻优,得短期负荷需求预测模型;参数包括回归树的数量m和深度d;所述对随机森林回归模型参数进行多步寻优具体为:S310利用网格搜索法为每个参数设置相应的搜索间隔后构成高维搜索向量,遍历高维搜索向量计算各搜索区域的适应度,适应度小于预设适应度阈值的搜索区域即局部优化域;S320以局部优化域作为果蝇优化法的参数选取区域,将最佳参数当作果蝇最佳位置,利用果蝇优化法进行多步寻优搜索最佳参数;S400以预测集为输入,利用短期负荷需求预测模型获得负荷需求预测值,将负荷需求预测值及对应的负荷特征数据加入训练集,作为预测下一个预测点的负荷需求值时的历史负荷需求数据和历史负荷特征数据。2.如权利要求1所述的短期负荷需求预测方法,其特征是:所述历史负荷特征数据和所述预测日负荷特征数据分别至少包括历史日和预测日的日期数据、气象数据、以及相似日负荷值;所述相似日负荷值,指与当前日负荷特征的欧氏距离最小的历史负荷特征所对应历史日的电力负荷值。3.如权利要求2所述的短期负荷需求预测方法,其特征是:所述气象数据和所述日期数据均通过中国气象数据网提供的API接口实时获取。4.如权利要求1所述的短期负荷需求预测方法,其特征是:所述历史负荷需求数据从智能电能表采集的用户电力信息数据中获取。5.如权利要求1所述的短期负荷需求预测方法,其特征是:S200中,各维负荷特征与负荷间的相关系数其中,rxy表示负荷特征与负荷间的相关系数;Sxy表示负荷特征样本与负荷样本的协方差;Sx和Sy分别表示负荷特征样本和负荷样本的标准差;xj和yj...

【专利技术属性】
技术研发人员:孔政敏吕何付卓林王碟张成刚杨玉杰
申请(专利权)人:武汉数澎科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1