一种变量选择与高斯过程回归的短期负荷预测方法技术

技术编号：15864590 阅读：103 留言：0更新日期：2017-07-23 11:00

本发明专利技术公开一种基于变量选择与高斯过程回归的短期负荷预测方法，包括以下步骤：1)对样本数据进行坏数据剔除、补充以及归一化预处理；2)从历史负荷、温度和湿度、预测日日期类型等角度选取候选输入变量，通过随机森林算法计算各变量重要性评分并排序；3)结合高斯过程回归模型，采用序列前向搜索策略确定最优变量集合；4)基于确定的最优变量集合训练高斯过程回归模型，并利用改进粒子群算法优化模型参数；5)在测试集中验证模型的预测性能。本发明专利技术提供的方法有效地提高了预测精度，能够较好地解决电力系统负荷预测问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种变量选择与高斯过程回归的短期负荷预测方法
本专利技术涉及一种电力系统短期负荷预测方法，对电力系统负荷进行预测，属于电力系统

技术介绍
提高电力系统负荷预测精度是有效保障电力系统安全、稳定、经济运行的技术措施之一，不同时间尺度的负荷预测对安排电力生产调度、设备检修计划及中长期电网规划都具有极其重要的意义。实际系统运行积累海量的历史负荷、气象等数据，充分挖掘这些数据蕴含的信息，为提高电力负荷预测精度提供了新的途径。高斯过程回归(Gaussianprocessregression,GPR)以贝叶斯理论和统计学习理论为基础，在处理高维数、非线性等复杂回归问题时具有易编程实现、超参数自适应获取以及输出具有概率分布等优点，在时间序列分析、动态系统模型辨识、系统控制等多领域获得了广泛应用。基于以上优点，本专利技术采用高斯过程回归建立短期负荷预测模型。常用共轭梯度(conjugategradient,CG)方法求解高斯过程回归模型超参数，但该方法存在易陷入局部最优解、优化性能受初值选取影响大、迭代次数难以确定等缺点。因此，在建立高斯过程回归短期负荷预测模型过程中，需要采取措施对模型参数进行优化处理。短期负荷预测建模过程中，输入变量的选取对模型预测结果有很大影响。常通过经验选取输入变量，但该做法依赖技术人员主观经验，缺乏理论依据。同时，人工选择的输入变量维数过高，容易引入冗余变量，增加模型训练复杂度，降低了预测性能。选择少量输入变量时，又难以获得足够的信息表征输出特性。因此，在训练模型前需要建立最优变量集合以克服人工经验选取的不足。
技术实现思路
专利技术目的：本...
一种变量选择与高斯过程回归的短期负荷预测方法

【技术保护点】
一种基于变量选择与高斯过程回归的短期负荷预测方法，其特征在于：包括以下步骤：(1)获取电力系统负荷预测所需的基本数据：历史负荷数据、温度和湿度气象数据、预测日日期类型数据；(2)对样本数据进行坏数据剔除、补充以及归一化预处理，将样本数据尺度变换到区间[0,1]内；(3)从历史负荷、温度和湿度、预测日日期类型等角度选取候选输入变量，通过随机森林算法计算各变量重要性评分并排序；(4)设置初始最优变量集合为空集，通过逐一添加重要性评分最高的输入变量并利用高斯过程回归模型计算其预测准确率，由预测误差最小可确定最优变量集合；(5)基于确定的最优变量集合训练高斯过程回归模型，并利用改进粒子群算法优化模型参数；(6)在测试集中验证模型的预测性能。

【技术特征摘要】
1.一种基于变量选择与高斯过程回归的短期负荷预测方法，其特征在于：包括以下步骤：(1)获取电力系统负荷预测所需的基本数据：历史负荷数据、温度和湿度气象数据、预测日日期类型数据；(2)对样本数据进行坏数据剔除、补充以及归一化预处理，将样本数据尺度变换到区间[0,1]内；(3)从历史负荷、温度和湿度、预测日日期类型等角度选取候选输入变量，通过随机森林算法计算各变量重要性评分并排序；(4)设置初始最优变量集合为空集，通过逐一添加重要性评分最高的输入变量并利用高斯过程回归模型计算其预测准确率，由预测误差最小可确定最优变量集合；(5)基于确定的最优变量集合训练高斯过程回归模型，并利用改进粒子群算法优化模型参数；(6)在测试集中验证模型的预测性能。2.如权利要求1所述的基于变量选择与高斯过程回归的短期负荷预测方法，其特征在于：步骤(3)中候选输入变量包括历史负荷数据如：预测日前一日负荷、前两日负荷、前三日负荷、前七日负荷、前八日负荷、前十四日负荷、去年同期同时刻负荷；温度数据包括：预测日温度、前一日温度、前两日温度、前三日温度、前七日温度、前八日温度、前十四日温度、去年同期同时刻温度；湿度数据包括：预测日湿度、前一日湿度、前两日湿度、前三日湿度、前七日湿度、前八日湿度、前十四日湿度、去年同期同时刻湿度；候选输入变量同时包括预测日日期类型。3.如权利要求1所述的基于变量选择与高斯过程回归的短期负荷预测方法，其特征在于：步骤(3)中采用随机森林算法给出各输入变量重要性评分，所述方法具体过程为：3.1假定电力负荷数据训练集(X,y)含n个观测值，输入变量维数为M，利用bootstrap方法有放回的从原始训练数据集合中重复抽取b个子样本集，每个子集样本数为n，由此可构建b颗回归树；未被选择的观测值构成袋外数据；3.2构造第bi颗回归树时，从M维输入变量中随机选取固定数量为mtry(可取mtry＝M/3)的输入变量集作为该颗回归树的特征空间，分裂过程采用方差最小作为分支优度准则来选取分裂变量，即式中，n为训练样本数，Xk为变量k的样本值，为变量k的样本均值，I即为此次最优分裂变量；3.3通过袋外数据预测准确度评价模型的预测性能，即式中，nOOB为袋外数据样本数量，yi为真实负荷值，为随机森林模型预测结果；3.4利用袋外数据对b颗回归树进行测试，得到均方残差分别为：MSE1,MSE2,L,MSEb；变量Xk在b个袋外数据集中使用随机扰动方法置换，形成新袋外测试集；利用新的袋外数据对b颗回归树重新进行测试，构成随机置换后的均方误差矩阵为

【专利技术属性】
技术研发人员：孙国强，梁智，卫志农，臧海祥，
申请(专利权)人：河海大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人