当前位置: 首页 > 专利查询>河海大学专利>正文

一种变量选择与高斯过程回归的短期负荷预测方法技术

技术编号:15864590 阅读:103 留言:0更新日期:2017-07-23 11:00
本发明专利技术公开一种基于变量选择与高斯过程回归的短期负荷预测方法,包括以下步骤:1)对样本数据进行坏数据剔除、补充以及归一化预处理;2)从历史负荷、温度和湿度、预测日日期类型等角度选取候选输入变量,通过随机森林算法计算各变量重要性评分并排序;3)结合高斯过程回归模型,采用序列前向搜索策略确定最优变量集合;4)基于确定的最优变量集合训练高斯过程回归模型,并利用改进粒子群算法优化模型参数;5)在测试集中验证模型的预测性能。本发明专利技术提供的方法有效地提高了预测精度,能够较好地解决电力系统负荷预测问题。

【技术实现步骤摘要】
一种变量选择与高斯过程回归的短期负荷预测方法
本专利技术涉及一种电力系统短期负荷预测方法,对电力系统负荷进行预测,属于电力系统

技术介绍
提高电力系统负荷预测精度是有效保障电力系统安全、稳定、经济运行的技术措施之一,不同时间尺度的负荷预测对安排电力生产调度、设备检修计划及中长期电网规划都具有极其重要的意义。实际系统运行积累海量的历史负荷、气象等数据,充分挖掘这些数据蕴含的信息,为提高电力负荷预测精度提供了新的途径。高斯过程回归(Gaussianprocessregression,GPR)以贝叶斯理论和统计学习理论为基础,在处理高维数、非线性等复杂回归问题时具有易编程实现、超参数自适应获取以及输出具有概率分布等优点,在时间序列分析、动态系统模型辨识、系统控制等多领域获得了广泛应用。基于以上优点,本专利技术采用高斯过程回归建立短期负荷预测模型。常用共轭梯度(conjugategradient,CG)方法求解高斯过程回归模型超参数,但该方法存在易陷入局部最优解、优化性能受初值选取影响大、迭代次数难以确定等缺点。因此,在建立高斯过程回归短期负荷预测模型过程中,需要采取措施对模型参数进行优化处理。短期负荷预测建模过程中,输入变量的选取对模型预测结果有很大影响。常通过经验选取输入变量,但该做法依赖技术人员主观经验,缺乏理论依据。同时,人工选择的输入变量维数过高,容易引入冗余变量,增加模型训练复杂度,降低了预测性能。选择少量输入变量时,又难以获得足够的信息表征输出特性。因此,在训练模型前需要建立最优变量集合以克服人工经验选取的不足。
技术实现思路
专利技术目的:本专利技术针对现有电力系统负荷预测技术中存在的问题,如应用高斯过程回归建立负荷预测模型时,传统的共轭梯度方法求解模型超参数存在易陷入局部最优解、优化性能受初值选取影响大、迭代次数难以确定等缺点,导致预测结果准确度不高的缺陷,提供一种基于改进粒子群优化高斯过程回归的短期负荷预测方法,即PSO-GPR负荷预测方法。同时,利用随机森林算法给出输入变量重要性评分,结合高斯过程回归模型选择最优变量集合,提高了预测精度。技术方案:一种基于变量选择与高斯过程回归的短期负荷预测方法,包括以下步骤:1)获取电力系统短期负荷预测所需的基本数据:历史负荷数据和原始气象数据;其中历史负荷数据为历史日每日间隔1h的整点时刻负荷数据,原始气象数据包括整点时刻环境温度、湿度、预测日日期类型等影响因素;2)数据预处理:对训练和测试样本集数据中坏数据进行剔除和补充,并对数据进行归一化处理,将样本数据尺度变换到区间[0,1]内;3)考虑历史负荷值、温度、湿度因素及其累积效应对预测日负荷大小的影响,选取一定数量的备选输入变量,利用随机森林算法计算各输入变量重要性评分并进行排序;4)设置初始最优变量集合为空集,利用序列前向搜索策略逐一添加重要性评分最高的输入变量并利用高斯过程回归模型计算其预测准确率,直至遍历所有输入变量,由预测误差最小可确定最优变量集合。5)基于确定的最优变量集合训练高斯过程回归模型,并利用改进粒子群算法优化模型参数;6)在测试集中验证模型的预测性能。有益效果:本专利技术的电力系统短期负荷预测方法利用随机森林方法给出各输入变量重要性评分并排序,采用序列前向搜索策略结合高斯过程回归模型确定最优变量集合,避免人工经验选取输入变量的不足,提高了模型预测性能。同时,采用改进粒子群算法优化高斯过程回归模型参数,进而改善预测模型的精度和泛化能力。附图说明图1为利用随机森林算法选取最优变量集合流程图;图2为变量重要性评分及其预测误差曲线;图3为高斯过程回归模型对数似然函数迭代曲线;图4为测试的PSO-GPR预测模型连续7日负荷预测曲线与实际曲线。具体实施方式下面结合具体实施例,进一步阐明本专利技术,应理解这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等价形式的修改均落于本申请所附权利要求所限定的范围。本专利技术的思路是将随机森林算法用于电力系统短期负荷预测建模输入变量选择中,利用随机森林算法给出各输入变量重要性评分并排序,由此结合高斯过程回归模型并基于序列前向搜索策略确定最优输入变量集合,其预测误差最小即对应着最优变量集合。同时,采用改进粒子群(particleswarmoptimization,PSO)算法优化高斯过程回归模型参数,进一步增强了模型预测性能,避免传统共轭梯度方法易陷入局部最优解的缺点。短期负荷预测建模过程中,输入变量的选取对模型预测结果有很大影响。本专利技术采用随机森林算法选取最优变量集合并建立高斯过程回归短期负荷预测模型。随机森林(randomforest,RF)利用随机重采样技术bootstrap构建多个子样本数据集,在每个子样本集中随机选取部分输入变量并通过分支优度准则选取最佳分裂点,由各回归树构建鲁棒性能强的集成模型。假定电力负荷数据训练集(X,y)含n个观测值,输入变量维数为M,利用bootstrap方法有放回的从原始训练数据集合中重复抽取b个子样本集,每个子集样本数为n,由此可构建b颗回归树;抽取第bi个子集时,未被选择的观测值构成袋外数据(out-of-bag,OOB);构造第bi颗回归树时,从M维输入变量中随机选取固定数量为mtry(可取mtry=M/3)的输入变量集作为该颗回归树的特征空间。对于回归问题,分裂过程采用方差最小作为分支优度准则来选取分裂变量,即式中,n为训练样本数,Xk为变量k的样本值,为变量k的样本均值,I即为此次最优分裂变量。每棵回归树采用无剪枝策略从根节点自顶向下递归分支,设定叶节点最小尺寸作为回归树生长终止条件。b颗回归树生长完成后,即可构建完整的RF回归模型。最后,通过袋外数据预测准确度评价模型的预测性能,即式中,nOOB为袋外数据样本数量,yi为真实负荷值,为RF模型预测结果。RF模型以变量重要性评分评价各输入变量对负荷的影响程度,通过均方残差减小量计量各输入变量重要性评分并排序。利用袋外数据对b颗回归树进行测试,得到均方残差分别为:MSE1,MSE2,L,MSEb。变量Xk在b个袋外数据集中使用随机扰动方法置换,形成新袋外测试集。利用新的袋外数据对b颗回归树重新进行测试,构成随机置换后的均方误差矩阵为第k个输入变量重要性评分即为:将MSE1,MSE2,L,MSEb与均方误差矩阵第k行对应相减并取b颗回归树平均值,最后除以b颗回归树标准误差SE,得到变量Xk的均方残差平均减小量。由此得到各输入变量重要性评分公式为GPR用于短期负荷预测建模时,训练集合为D={(xi,yi)|i=1,2,3,…,n}=(X,y),其中:xi∈Rm为m维输入向量,m×n维输入矩阵则可表示为X=[x1,x2,…,xn],n表示训练样本点数量,yi∈R为对应于xi的输出标量。用数学语言描述GPR负荷预测过程为:定义函数空间f(x)=Φ(x)Tω,f(x(1))、f(x(2))、…、f(x(n))构成随机变量的一个集合,且服从联合高斯分布,高斯过程模型就可以表示为式中:独立高斯白噪声服从均值为0,方差为的高斯分布,记做ε:δij为Kroneckerdelta函数,当i=j时,函数δij=1;m(x)为有限维分布族的均值本文档来自技高网...
一种变量选择与高斯过程回归的短期负荷预测方法

【技术保护点】
一种基于变量选择与高斯过程回归的短期负荷预测方法,其特征在于:包括以下步骤:(1)获取电力系统负荷预测所需的基本数据:历史负荷数据、温度和湿度气象数据、预测日日期类型数据;(2)对样本数据进行坏数据剔除、补充以及归一化预处理,将样本数据尺度变换到区间[0,1]内;(3)从历史负荷、温度和湿度、预测日日期类型等角度选取候选输入变量,通过随机森林算法计算各变量重要性评分并排序;(4)设置初始最优变量集合为空集,通过逐一添加重要性评分最高的输入变量并利用高斯过程回归模型计算其预测准确率,由预测误差最小可确定最优变量集合;(5)基于确定的最优变量集合训练高斯过程回归模型,并利用改进粒子群算法优化模型参数;(6)在测试集中验证模型的预测性能。

【技术特征摘要】
1.一种基于变量选择与高斯过程回归的短期负荷预测方法,其特征在于:包括以下步骤:(1)获取电力系统负荷预测所需的基本数据:历史负荷数据、温度和湿度气象数据、预测日日期类型数据;(2)对样本数据进行坏数据剔除、补充以及归一化预处理,将样本数据尺度变换到区间[0,1]内;(3)从历史负荷、温度和湿度、预测日日期类型等角度选取候选输入变量,通过随机森林算法计算各变量重要性评分并排序;(4)设置初始最优变量集合为空集,通过逐一添加重要性评分最高的输入变量并利用高斯过程回归模型计算其预测准确率,由预测误差最小可确定最优变量集合;(5)基于确定的最优变量集合训练高斯过程回归模型,并利用改进粒子群算法优化模型参数;(6)在测试集中验证模型的预测性能。2.如权利要求1所述的基于变量选择与高斯过程回归的短期负荷预测方法,其特征在于:步骤(3)中候选输入变量包括历史负荷数据如:预测日前一日负荷、前两日负荷、前三日负荷、前七日负荷、前八日负荷、前十四日负荷、去年同期同时刻负荷;温度数据包括:预测日温度、前一日温度、前两日温度、前三日温度、前七日温度、前八日温度、前十四日温度、去年同期同时刻温度;湿度数据包括:预测日湿度、前一日湿度、前两日湿度、前三日湿度、前七日湿度、前八日湿度、前十四日湿度、去年同期同时刻湿度;候选输入变量同时包括预测日日期类型。3.如权利要求1所述的基于变量选择与高斯过程回归的短期负荷预测方法,其特征在于:步骤(3)中采用随机森林算法给出各输入变量重要性评分,所述方法具体过程为:3.1假定电力负荷数据训练集(X,y)含n个观测值,输入变量维数为M,利用bootstrap方法有放回的从原始训练数据集合中重复抽取b个子样本集,每个子集样本数为n,由此可构建b颗回归树;未被选择的观测值构成袋外数据;3.2构造第bi颗回归树时,从M维输入变量中随机选取固定数量为mtry(可取mtry=M/3)的输入变量集作为该颗回归树的特征空间,分裂过程采用方差最小作为分支优度准则来选取分裂变量,即式中,n为训练样本数,Xk为变量k的样本值,为变量k的样本均值,I即为此次最优分裂变量;3.3通过袋外数据预测准确度评价模型的预测性能,即式中,nOOB为袋外数据样本数量,yi为真实负荷值,为随机森林模型预测结果;3.4利用袋外数据对b颗回归树进行测试,得到均方残差分别为:MSE1,MSE2,L,MSEb;变量Xk在b个袋外数据集中使用随机扰动方法置换,形成新袋外测试集;利用新的袋外数据对b颗回归树重新进行测试,构成随机置换后的均方误差矩阵为

【专利技术属性】
技术研发人员:孙国强梁智卫志农臧海祥
申请(专利权)人:河海大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1