基于互相关熵门控循环单元的短期电量预测方法技术

技术编号:33444565 阅读:22 留言:0更新日期:2022-05-19 00:30
本发明专利技术公开了基于互相关熵门控循环单元的短期电量预测方法,包括:数据预处理,对历史用电量数据中的缺失数据补充后构建训练样本集,并构建预测模型的特征输入,最后进行数据标准化;利用最大相关最小冗余算法进行特征选择;选用门控循环单元GRU模型对小时用电量进行预测,使用互相关熵对应的最大相关熵准则MCC代替门控循环单元中的均方误差准则作为预测模型的代价函数;通过K

【技术实现步骤摘要】
基于互相关熵门控循环单元的短期电量预测方法


[0001]本专利技术属于电力系统的电量预测
,涉及基于互相关熵门控循环单元的短期电量预测方法。
技术背景
[0002]在电力系统规划角度,用电预测作为在电力系统规划,国民经济运转以及电力调节智能化系统中的依据,同时也作为电力安全运行可靠性供电的必要条件;在电力市场角度,新电力改革下参与电力市场的售电公司交易形式主要包括中长期交易和现货交易,由于当售电公司提前申报企业预计的用户用能量较用户的实际用能量差别巨大的情况下,售电公司需要接受误差考评并向能源交易流程监督管理中心上缴罚金,此外还要在现货市场重面临利润风险,因此售电公司对用户用能量的预估需保证准确来提高核心竞争性,减少售电风险程度。基于此采用合理适当的电量预测方法来提高预测精度,规避其风险有重要工程应用价值。
[0003]传统的电量预测问题主要针对大区域,历史数据多,而且预测技术已交完善;新电改下的电量预测问题主要是针对多个或单个用户,预测区域小,预测时间间隔小,从而受随机因素影响较大体现出较强的随机性、非线性、时变性、以及数据分布的非高斯性。针对电量预测,国内外学者做了很多研究,其模型主要可分为两类:传统预测模型与机器学习模型。传统预测模型包括AR综合模型、移动平均模型、自回归时间序列模型灰色预测模型等,这些模型的理论基础是线性模型,其对时间序列的平稳性要求高,对数据回归能力弱。机器学习算法因可以很好的处理各种影响因素和非线性数据,在电量预测中得到了广泛的应用。传统机器算法的损失函数为均方根误差,均方根误差仅仅对误差分布的二阶矩进行了分析考虑,对含高斯特性的数据有很高的的预测准确度。然而电量预测的数据和误差往往具有非高斯、非线性特性,因此该算法应用于售电量预测问题时,具有一定的局限性。

技术实现思路

[0004]本专利技术的目的是提出基于互相关熵门控循环单元的短期电量预测方法,解决了现有预测技术对非高斯非线性售电数据预测精度不高,难以满足售电公司进行电力交易时对售电量预测精度需求的问题。
[0005]本专利技术采用的技术方案是,基于互相关熵门控循环单元的短期电量预测方法,按照以下步骤实施:
[0006]步骤1、数据的预处理
[0007]先对历史小时用电量以及该时所对应的温度的数据进行收集,同时补充其中的缺失数据,对数据进行标准化处理;
[0008]步骤2、将步骤1标准化后数据中影响用户用电量的特征向量利用mrmr算法进行进一步提取,选出信息冗余小,信息包含量大的特征;
[0009]步骤3、选用门控循环单元GRU模型对小时用电量进行预测,针对售电量预测误差
的非高斯特征,使用互相关熵对应的最大相关熵准则MCC代替门控循环单元中的均方误差准则作为预测模型的代价函数;
[0010]步骤4、通过K

折交叉验证与网格寻优方法对互相关熵门控循环单元模型的关键参数p、核宽度θ进行优化,利用网格寻优进行参数搜索:根据步骤2中选取的信息冗余小,信息包含量大的特征,给出参数p、θ可能的取值范围,再从参数p、θ的取值范围内取若干取值,并两两组合形成关于参数p、θ的参数对,从而选择令最大相关熵值最大的参数对;利用K

折交叉验证法衡量参数的泛化能力:将已有的数据集分为K个子集,令每个子集分别做一次测试集,其他子集做训练集进行K次验证参数的泛化能力;
[0011]步骤5、用互相关熵门控循环单元预测模型对小时时间尺度的售电量进行预测,得到预测结果;采用均方根误差RMSE和平均绝对百分比误差MAPE两个指标作为模型的评价指标。
[0012]本专利技术的特点还在于,
[0013]步骤1具体如下:
[0014]收集数据,并对售电用户历史用电量数据中的缺失数据进行补充,构建训练样本集,以历史小时用电量以及该时所对应的温度作为预测模型的训练样本集,数据标准化,具体过程是:
[0015]电量预测模型中主要用到的数据有历史小时用电量数据以及该时所对应的温度数据,为了减少两种数据数量级相差较大对预测结果造成的影响,故对两种数据进行标准化处理,标准化公式如式(1):
[0016][0017]其中,x
min
为该类数据的最小值,x
max
为该类数据的最大值,x
i
为数据真实值。
[0018]步骤2具体如下:
[0019]特征的选择是通过特征和类变量之间的相关性最大化和特征之间冗余度最小化来实现的:
[0020]最大相关
[0021]式中,x
i
为第i个特征,i的范围[i1~ip],c={c1,c2,

,c
L
}为类变量,L为类别总个数,S为特征子集;
[0022]最小冗余
[0023]从信息的角度来看,特征选择是选择输出变量尽可能多、维数最小的特征子集,即需要同时经过式(2)与式(3)进行检验,满足其要求:
[0024]信息差maxΦ(D,R),Φ=D

R
ꢀꢀ
(4)
[0025]信息熵
[0026]步骤3具体如下:
[0027]选用门控循环单元GRU模型对小时用电量进行预测,针对售电量预测误差的非高
斯特征,使用互相关熵对应的最大相关熵准则MCC代替门控循环单元中的均方误差准则作为预测模型的代价函数:
[0028]最大相关熵对应的最大相关熵准则的表达式见(6):
[0029][0030]其中,k
θ
是核函数,N是样本个数;
[0031]GRU网络是一种深度学习模型,其网络前馈过程如下:
[0032][0033]其中,x
t
为t时刻的输入;W,U为对应的权重;σ为Sigmoid激活函数;z
t
,r
t
分别为更新门和复位门的输出;W
z
,U
z
为更新门对应的权重;W
r
,U
r
为复位门对应的权重;分别表示更新门,复位们以及预测输出的各权重,h
t
为t时刻网络隐含状态,也是t+1时刻的输入,具有短期记忆功能;分别为细胞状态,具有长期记忆功能;y
t
为t时刻预测输出;
[0034]从而得到门控循环单元网络中各权重参数的更新公式:
[0035][0036]其中,C是惩罚系数,θ是核宽度,t
t
为时间步、d
t
是模型实际值,W,U为对应的权重;σ为Sigmoid激活函数;z
t
,r
t
分别为更新门和复位门的输出;h
t
为t时刻网络隐含状态,也是t+1时刻的输入,具有短期记忆功能;分别为细胞状态,具有长期记忆功能;y
t
为t时刻预测输出;
[0037]利用公式(8)表示出来的权重参数,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于互相关熵门控循环单元的短期电量预测方法,具体操作过程包括如下步骤:步骤1、数据的预处理先对历史小时用电量以及该时所对应的温度的数据进行收集,同时补充其中的缺失数据,对数据进行标准化处理;步骤2、将步骤1标准化后数据中影响用户用电量的特征向量利用mrmr算法进行进一步提取,选出信息冗余小,信息包含量大的特征;步骤3、选用门控循环单元GRU模型对小时用电量进行预测,针对售电量预测误差的非高斯特征,使用互相关熵对应的最大相关熵准则MCC代替门控循环单元中的均方误差准则作为预测模型的代价函数;步骤4、通过K

折交叉验证与网格寻优方法对互相关熵门控循环单元模型的关键参数p、核宽度θ进行优化,利用网格寻优进行参数搜索:根据步骤2中选取的信息冗余小,信息包含量大的特征,给出参数p、θ可能的取值范围,再从参数p、θ的取值范围内取若干取值,并两两组合形成关于参数p、θ的参数对,从而选择令最大相关熵值最大的参数对;利用K

折交叉验证法衡量参数的泛化能力:将已有的数据集分为K个子集,令每个子集分别做一次测试集,其他子集做训练集进行K次验证参数的泛化能力;步骤5、用互相关熵门控循环单元预测模型对小时时间尺度的售电量进行预测,得到预测结果;采用均方根误差RMSE和平均绝对百分比误差MAPE两个指标作为模型的评价指标。2.根据权利要求1所述的基于互相关熵门控循环单元的短期电量预测方法,其特征在于:步骤1具体如下:收集数据,并对售电用户历史用电量数据中的缺失数据进行补充,构建训练样本集,以历史小时用电量以及该时所对应的温度作为预测模型的训练样本集,数据标准化,具体过程是:电量预测模型中主要用到的数据有历史小时用电量数据以及该时所对应的温度数据,为了减少两种数据数量级相差较大对预测结果造成的影响,故对两种数据进行标准化处理,标准化公式如式(1):其中,x
min
为该类数据的最小值,x
max
为该类数据的最大值,x
i
为数据真实值。3.根据权利要求1所述的基于互相关熵门控循环单元的短期电量预测方法,其特征在于,步骤2具体如下:特征的选择是通过特征和类变量之间的相关性最大化和特征之间冗余度最小化来实现的:式中,x
i
为第i个特征,i的范围[i1~ip],c={c1,c2,

,c
L
}为类变量,L为类别总个数,S为特征子集;
从信息的角度来看,特征选择是选择输出变量尽可能多、维数最小的特征子集,即需要同时经过式(2)与式(3)...

【专利技术属性】
技术研发人员:段建东郎霄剑方帅王鹏马文涛
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1