当前位置: 首页 > 专利查询>中南大学专利>正文

一种XGBoost在短期负荷预测中的应用制造技术

技术编号:18895805 阅读:35 留言:0更新日期:2018-09-08 11:35
本发明专利技术设计一种基于信息熵聚类和ATTENTION机制的循环神经网络短期负荷预测方法,包括以下步骤:分析影响电力负荷的特征;使用xgboost算法计算所有特征对负荷的信息熵;使用聚类算法对预测地区的历史数据进行基于各特征信息熵为权重的聚类分析;在聚类结果中选取预测日权重距离最近的簇,并依据距离预测时间由远到近组成时间序列T;时间序列T作为ATTENTION循环神经网络的编码器(Encoder),并由解码器(Decoder)获得预测结果。与现有技术相比,本发明专利技术具有预测精度高、自适应性好等优点。

Application of XGBoost in short term load forecasting

The invention designs a cyclic neural network short-term load forecasting method based on information entropy clustering and ATTEENTION mechanism, which includes the following steps: analyzing the characteristics affecting the power load; calculating the information entropy of all features to the load by using xgboost algorithm; and using clustering algorithm to predict the historical data of the area based on each feature letter. Cluster analysis with information entropy as weight; select the cluster with the closest prediction day weight distance from the clustering results, and form time series T according to the distance prediction time from far to near; time series T is used as Encoder of ATTENTION cyclic neural network, and the prediction results are obtained by decoder. Compared with the existing technology, the invention has the advantages of high prediction accuracy and good adaptability.

【技术实现步骤摘要】
一种XGBoost在短期负荷预测中的应用
本专利技术涉及一种XGBoost在短期负荷预测中的应用。
技术介绍
短期负荷预测在电力控制、安全、市场运作和电网合理调度计划中都起到重要性作用。短期电力负荷预测主要用于预知未来几小时,一天或者一周左右电力负荷使用情况。高精度的短期负荷预测有利于缩减电网运营经济成本,电力系统设备调度与安全。由于电力负荷受各种因素的影响,在实际生产过程中很难实现高精度的负荷预测。在已经主要应用的短期负荷预测模型中,主要分为传统方法和人工智能方法。传统方法是基于数学模型来构造的,包括多元线性回归,随机时间序列,指数平滑和基于先验知识的方法。负荷预测是一个非线性问题,因此传统方法较难实现高精度的预测。人工智能方法主要采用人工神经网络,支持向量机,专家系统模型,模糊逻辑方法和贝叶斯神经网络等方法。由于负荷受到众多特征属性以及未知因素的影响,没有哪种方法能够保证在所有情况下都能保证高精度的预测结果。此外,随着智能电表的普及和各自然因素、社会因素数据的不断健全,如何从庞大的历史数据中选取最有效的部分也成为研究的热点。
技术实现思路
本专利技术的目的在于克服现有技术中存在的上述不足,而提供一种结构设计合理,XGBoost在短期负荷预测中的应用。本专利技术解决上述问题所采用的技术方案是:一种XGBoost在短期负荷预测中的应用,具体包括以下步骤:步骤1:对电力负荷数据进行预处理,确定预测模型的输入特征变量和输出目标;步骤2:使用极端梯度提升算法(xgboost)计算影响电力负荷各输入特征的信息熵,并归一化各特征的信息熵,以适配聚类算法对数据的要求;步骤3:以各特征的信息熵作为重要性启发信息构造基于特征权重的聚类,即样本间距离采用加权欧氏距离衡量,调整聚类参数,使得聚类算法得到与要预测时间段负荷使用情况最相似的历史日;步骤4:依据距离预测时间由远到近将相似的历史日组成时间序列T;步骤5:时间序列T作为ATTENTION循环神经网络的编码器(Encoder)输入序列,训练预测模型;步骤6:判断训练模型是否收敛,如果尚未收敛则返回步骤5,否则由解码器(Decoder)获得负荷预测结果。作为优选:步骤1中xgboost算法的输入特征包括:季节、温度(℃)、湿度(%)、风速(m/s)、降雨量、星期类型、法定节假日、日前负荷峰值、前七天的负荷平均、七天前负荷值、去年同时段负荷值,输出目标为以上各特征对于负荷值得信息熵(重要度)。作为优选:步骤2中,步骤2.1:构建算法的目标函数为:第一部分是训练误差,而第二部分是每棵树的复杂度的和,其中IJ={i|q(xi)=j}被定义为每个叶子上面样本集合表示每个数据点的在误差函数上的一阶导数和二阶导数,定义步骤2.2:将转化为如何求一个一维二次函数的最小值的问题,即:步骤2.3:其中特征信息熵计算公式如下:将得到的m个特征的信息熵记为{w1,w2,...,wm}。作为优选:步骤3中,基于特征权重的聚类算法具体步骤为:步骤3.1对于历史日集合X={x1,x2,...,xi,...,xn},其中对于每一个xi都有对应的m个特征,即xi={xi1,xi2,...,xim},先将所有的特征数据归一化处理;步骤3.2选择要预测日的特征向量作为第一个初始聚类中心u0,从历史集合里选择与u0距离最远的历史日作为u1,从历史集合里选择与{u0,u1}距离最远的历史日作为u2,......,直到找到K个初始聚类中心{u0,u1,...,uj,...,uk};步骤3.3对于每个历史日,选取最近的中心点,归为该类,距离计算公式为:步骤3.4更新聚类中心点为每类的均值;步骤3.5重复计算步骤3.3和3.4直到聚类中心不再发生改变。作为优选:步骤5中,用于预测短期负荷的序列到序列(sequence2sequence)的体系结构。该架构由两个LSTM(长短期记忆网络)网络组成:编码器和解码器,编码器的任务是转换可变长度的输入序列并将其编码为固定长度向量,然后将其用作解码器的输入状态,解码器产生长度为n的预测序列,在Encoder输入相似历史日的负荷值y={y0,y1,...,ym-1}和特征向量f={f0,f1,...,fm},而注意力机制让解码器在每一步输出时参与到预测输出的不同部分,由模型Decoder部分预测负荷值实现短期负荷的高精度预测。为了提高预测精度,这里循环神经网络用的是长短期记忆网络(LSTM)结构。本专利技术与现有技术相比,具有以下优点和效果:与现有技术相比,本专利技术采用XGBoost在短期负荷预测中的应用,最大程度上挖掘了预测日的用电规律,剔除了与预测日特征相似度较小的负荷曲线,通过选取聚类后与要预测时间段负荷使用情况最相似的历史日进行预测模型训练,可有效提高短期负荷预测的精度,此外,本专利技术还采用了具有ATTENTION机制的LSTM循环神经网络建立预测模型,能够更有效的反应历史数据的负荷曲线,从而进一步提高负荷预测精度。附图说明图1为本专利技术的流程图;图2为一种XGBoost在短期负荷预测中的应用的流程图。具体实施方式下面结合附图并通过实施例对本专利技术作进一步的详细说明,以下实施例是对本专利技术的解释而本专利技术并不局限于以下实施例。参见图1-图2,本实施例主要基于数据预处理,确定输入特征变量。由于电力负荷的大小受到很多因素的影响,除了需要负荷数据外,季节、温度(℃)、湿度(%)、风速(m/s)、降雨量、星期类型、法定节假日等特征都起到影响作用。而在数据分析过程中又分析了日前负荷峰值、前七天的负荷平均、七天前负荷值、去年同时段负荷值与预测日的关系系数都呈现一定相关性。同时为了保证训练样本足够大,本实例采集的是十年内每天24小时整点时刻的负荷数据,再综合以上十个特征形成样本集。步骤1:对电力负荷数据进行预处理,确定预测模型的输入特征变量和输出目标;步骤2:使用极端梯度提升算法(xgboost)计算影响电力负荷各输入特征的信息熵,并归一化各特征的信息熵,以适配聚类算法对数据的要求;步骤3:以各特征的信息熵作为重要性启发信息构造基于特征权重的聚类,即样本间距离采用加权欧氏距离衡量,调整聚类参数,使得聚类算法得到与要预测时间段负荷使用情况最相似的历史日;步骤4:依据距离预测时间由远到近将相似的历史日组成时间序列T;步骤5:时间序列T作为ATTENTION循环神经网络的编码器(Encoder)输入序列,训练预测模型;步骤6:判断训练模型是否收敛,如果尚未收敛则返回步骤5,否则由解码器(Decoder)获得负荷预测结果。其中步骤1中xgboost算法的输入特征包括:季节、温度(℃)、湿度(%)、风速(m/s)、降雨量、星期类型、法定节假日、日前负荷峰值、前七天的负荷平均、七天前负荷值、去年同时段负荷值,输出目标为以上各特征对于负荷值得信息熵(重要度)。其中步骤2中,步骤2.1:构建算法的目标函数为:第一部分是训练误差,而第二部分是每棵树的复杂度的和,其中IJ={i|q(xi)=j}被定义为每个叶子上面样本集合表示每个数据点的在误差函数上的一阶导数和二阶导数,定义步骤2.2:将转化为如何求一个一维二次函数的最小值的问题,即:步骤2.3:其中特征信息熵计算公式如下:将得到的m个特征的信息熵记为{w1,w2,.本文档来自技高网...

【技术保护点】
1.一种XGBoost在短期负荷预测中的应用,其特征在于:具体包括以下步骤:步骤1:对电力负荷数据进行预处理,确定预测模型的输入特征变量和输出目标;步骤2:使用极端梯度提升算法(xgboost)计算影响电力负荷各输入特征的信息熵,并归一化各特征的信息熵,以适配聚类算法对数据的要求;步骤3:以各特征的信息熵作为重要性启发信息构造基于特征权重的聚类,即样本间距离采用加权欧氏距离衡量,调整聚类参数,使得聚类算法得到与要预测时间段负荷使用情况最相似的历史日;步骤4:依据距离预测时间由远到近将相似的历史日组成时间序列T;步骤5:时间序列T作为ATTENTION循环神经网络的编码器(Encoder)输入序列,训练预测模型;步骤6:判断训练模型是否收敛,如果尚未收敛则返回步骤5,否则由解码器(Decoder)获得负荷预测结果。

【技术特征摘要】
1.一种XGBoost在短期负荷预测中的应用,其特征在于:具体包括以下步骤:步骤1:对电力负荷数据进行预处理,确定预测模型的输入特征变量和输出目标;步骤2:使用极端梯度提升算法(xgboost)计算影响电力负荷各输入特征的信息熵,并归一化各特征的信息熵,以适配聚类算法对数据的要求;步骤3:以各特征的信息熵作为重要性启发信息构造基于特征权重的聚类,即样本间距离采用加权欧氏距离衡量,调整聚类参数,使得聚类算法得到与要预测时间段负荷使用情况最相似的历史日;步骤4:依据距离预测时间由远到近将相似的历史日组成时间序列T;步骤5:时间序列T作为ATTENTION循环神经网络的编码器(Encoder)输入序列,训练预测模型;步骤6:判断训练模型是否收敛,如果尚未收敛则返回步骤5,否则由解码器(Decoder)获得负荷预测结果。2.根据权利要求1所述的一种XGBoost在短期负荷预测中的应用,其特征在于:步骤1中xgboost算法的输入特征包括:季节、温度(℃)、湿度(%)、风速(m/s)、降雨量、星期类型、法定节假日、日前负荷峰值、前七天的负荷平均、七天前负荷值、去年同时段负荷值,输出目标为以上各特征对于负荷值得信息熵(重要度)。3.根据权利要求1所述的一种XGBoost在短期负荷预测中的应用,其特征在于:步骤2中,步骤2.1:构建算法的目标函数为:第一部分是训练误差,而第二部分是每棵树的复杂度的和,其中IJ={i|q(xi)=j}被定义为每个叶子上面样本集合表示每个数据点的在误差函数上的一阶导数和二阶导数,定义步骤2.2:将转化为如何求一个一维二次函数的最小值的问题,即:步骤2.3:其中特征信息熵计算公式如下:将得到的m...

【专利技术属性】
技术研发人员:廖力清刘洋
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1