一种采用加权残差聚类的天然气负荷预测区间估计方法技术

技术编号:34485931 阅读:27 留言:0更新日期:2022-08-10 09:03
本发明专利技术提出了一种采用加权残差聚类的天然气负荷预测区间估计方法。该方法使用敏感性分析量化了模型输入对输出的影响程度,并根据得到的影响程度对模型输入进行加权聚类,针对异常残差采用了一种基于核密度估计的异常残差剔除方法,最后根据各个聚类簇中的残差分布计算模型的预测区间。本发明专利技术提出了完整的天然气负荷预测和区间估计流程,可以量化天然气负荷预测模型的不确定度,解决了天然气负荷预测由于随机性强导致的区间估计难题。本发明专利技术不对残差分布做出任何假设,可用于估计任何基于数据驱动预测模型的天然气负荷预测不确定性。据驱动预测模型的天然气负荷预测不确定性。据驱动预测模型的天然气负荷预测不确定性。

【技术实现步骤摘要】
一种采用加权残差聚类的天然气负荷预测区间估计方法


[0001]本专利技术属于负荷预测、区间估计领域,涉及基于深度学习的建模技术和预测区间估计技术,特别是涉及一种采用加权残差聚类的天然气负荷预测区间估计方法及应用

技术介绍

[0002]随着我国能源结构转型的不断深入,天然气的需求量逐年上涨。可靠的天然气供应管理对燃气企业平稳安全运行至关重要,而准确的天然气用气量预测是实现可靠的天然气供应的基础。目前关于用气量预测的方法大多为基于深度学习的点预测(给出预测值),但是在实际中,点预测的结果受限于数据噪声和模型局限性等原因往往存在不确定性,从而降低了基于点预测的天然气系统安全运行的可靠性,而安全性是燃气企业运行管理最重要的指标。针对这一问题,可以使用预测区间估计方法来描述点预测的不确定性,这一方法在电力和建筑负荷预测等领域有所研究,但是在天然气预测领域未见相关研究。因此,针对天然气负荷预测领域开发一种区间估计方法具有重要意义。
[0003]预测区间是指一个范围,实际负荷将以一定概率落在该范围内。预测区间估计算法有贝叶斯方法、蒙特卡洛法、重采样法以及下上限估计法等。其中下上限估计法一般指训练神经网络学习模型输入与预测区间上下界的关系,根据前人的研究,这种区间估计算法较为优秀。但是它计算规模大,需要较长的训练时间。另外,也可以通过预测模型在训练集上的残差分布来计算实际预测时的预测区间。这类方法具有更高的计算效率,更加契合实时预测这种应用场景。该方法需要计算预测模型在训练集上的残差分布,而不同工况有着不同的残差分布,因此得到准确且合理的残差分布是解决此类问题的关键。

技术实现思路

[0004]本专利技术能够克服现有技术的不足,提出了一种采用加权残差聚类的天然气负荷预测区间估计方法。
[0005]有鉴于此,本专利技术采用加权残差聚类的天然气负荷预测区间估计方法,其具体包括以下步骤:
[0006]一种采用加权残差聚类的天然气负荷预测区间估计方法,其包括如下步骤:
[0007]S1、按照S11~S19进行模型残差聚类,具体步骤如下:
[0008]S11、获取天然气历史负荷数据;
[0009]S12、选择与天然气负荷最为相关的多个变量作为深度学习模型的输入特征,选择天然气负荷作为深度学习模型的输出,对所述天然气历史负荷数据进行降维筛选,从而得到天然气历史负荷数据集,用于作为实时预测天然气负荷的深度学习模型的训练数据;
[0010]S13、对所述历史天然气负荷数据集进行数据预处理,同时对预处理后的数据进行归一化处理,得到处理后的历史天然气负荷数据集;
[0011]S14、把所述处理后的历史天然气负荷数据集中的所有训练样本划分为训练集和验证集,利用训练集对深度学习模型进行训练,并根据验证集预测值与实际值的均方根误
差对深度学习模型的超参数进行优化,得到一组最优超参数值;
[0012]S15、将以最优超参数值训练后的所述深度学习模型重新对所述训练集进行预测,得到各训练样本的预测值和残差e,残差的计算公式为:
[0013][0014]式中,e为模型残差,y为天然气负荷的实际值,为天然气负荷的模型预测值;
[0015]S16、用敏感性分析方法求得模型中每个输入特征的敏感性指数I;
[0016]S17、对所述训练集中的每一个训练样本,在训练样本的每个输入特征值乘上对应输入特征的敏感性指数,更新训练样本中的输入特征值,同时将对应的残差e加入训练样本中形成残差样本,所有残差样本构成加权后的训练集;
[0017]S18、针对加权后的训练集中的所有残差样本,利用K

means算法划分成若干聚类簇,并计算每一个聚类簇的聚类中心;
[0018]S19、针对每一个聚类簇,采用核密度估计算法计算残差概率密度分布,并根据残差概率密度分布计算每一个残差样本的概率密度值,剔除概率密度值低于设定概率密度阈值的残差样本;所述残差概率密度分布的计算公式为:
[0019][0020]式中,P(.)是聚类簇内的概率密度分布函数,e
i
是聚类簇内第i个残差样本,b是带宽,K(.)是核函数;
[0021]S2、按照S21~S25进行预测区间估计,具体步骤如下:
[0022]S21、获取与所述训练集相同时间间隔的实时天然气负荷数据;
[0023]S22、从所述实时天然气负荷数据中提取深度学习模型的输入特征所需的变量值并构成实时输入特征;
[0024]S23、对所述实时输入特征进行所述归一化处理,得到归一化输入特征;
[0025]S24、将所述归一化输入特征输入以最优超参数值训练后的所述深度学习模型中,利用深度学习模型预测未来目标时刻的天然气负荷
[0026]S24、计算所述归一化输入特征与各聚类簇的聚类中心之间的欧几里得距离,确定欧几里得距离最小的目标聚类簇C,进而利用下式计算未来目标时刻的天然气负荷所在的预测区间上界与下界:
[0027][0028][0029]式中,U和L分别为预测区间的上下界,为模型预测值,Q
x
为目标聚类簇C内的名义置信水平为x的残差百分位数,γ为该残差簇中小于0的残差的占比,100
×
(1

α)%为名义置信水平。
[0030]基于上述技术方案,还可以进一步提供如下优选方式,其中:
[0031]作为优选,所述天然气负荷为瞬时标况流量。
[0032]作为优选,所述天然气负荷数据由数据采集与监视控制系统(SCADA)系统获取。
[0033]作为优选,所述S12中,选择的与天然气负荷最为相关的多个变量包括温度、历史用气负荷和时间变量,所述时间变量为预测时刻处于一天中的第几个小时、一周中的第几天、一年中的第几月、是否节假日这些变量中的一个或多个。
[0034]作为优选,所述S13中,进行数据预处理时使用3σ准则识别所述天然气负荷数据中的异常值,并剔除异常和缺失的数据;进行归一化处理时使用最大最小规范化方法对所述历史天然气负荷数据集进行归一化。
[0035]作为优选,所述S14中,使用贝叶斯优化算法对深度学习模型的超参数进行寻优,获得最优超参数。
[0036]作为优选,所述超参数包括激活函数、学习率、训练轮次和神经元数量。
[0037]作为优选,所述S14中,将所述处理后的历史天然气负荷数据集以8:2的比例划分为训练集和验证集。
[0038]作为优选,所述敏感性分析方法中,每个输入特征的敏感性指数I计算公式为:
[0039][0040]式中,I(x
i
)为输入特征x
i
的无量纲敏感性指数,f(x1,

,x
n
)为所有的输入特征都取基准值时的模型输出,n为输入特征x
i
的总数,f((x
i
+KΔx
i
))为输入特征x
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种采用加权残差聚类的天然气负荷预测区间估计方法,其特征在于,包括如下步骤:S1、按照S11~S19进行模型残差聚类,具体步骤如下:S11、获取天然气历史负荷数据;S12、选择与天然气负荷最为相关的多个变量作为深度学习模型的输入特征,选择天然气负荷作为深度学习模型的输出,对所述天然气历史负荷数据进行降维筛选,从而得到天然气历史负荷数据集,用于作为实时预测天然气负荷的深度学习模型的训练数据;S13、对所述历史天然气负荷数据集进行数据预处理,同时对预处理后的数据进行归一化处理,得到处理后的历史天然气负荷数据集;S14、把所述处理后的历史天然气负荷数据集中的所有训练样本划分为训练集和验证集,利用训练集对深度学习模型进行训练,并根据验证集预测值与实际值的均方根误差对深度学习模型的超参数进行优化,得到一组最优超参数值;S15、将以最优超参数值训练后的所述深度学习模型重新对所述训练集进行预测,得到各训练样本的预测值和残差e,残差的计算公式为:式中,e为模型残差,y为天然气负荷的实际值,为天然气负荷的模型预测值;S16、用敏感性分析方法求得模型中每个输入特征的敏感性指数I;S17、对所述训练集中的每一个训练样本,在训练样本的每个输入特征值乘上对应输入特征的敏感性指数,更新训练样本中的输入特征值,同时将对应的残差e加入训练样本中形成残差样本,所有残差样本构成加权后的训练集;S18、针对加权后的训练集中的所有残差样本,利用K

means算法划分成若干聚类簇,并计算每一个聚类簇的聚类中心;S19、针对每一个聚类簇,采用核密度估计算法计算残差概率密度分布,并根据残差概率密度分布计算每一个残差样本的概率密度值,剔除概率密度值低于设定概率密度阈值的残差样本;所述残差概率密度分布的计算公式为:式中,P(.)是聚类簇内的概率密度分布函数,e
i
是聚类簇内第i个残差样本,b是带宽,K(.)是核函数,n为聚类簇内的残差样本数量;S2、按照S21~S25进行预测区间估计,具体步骤如下:S21、获取与所述训练集相同时间间隔的实时天然气负荷数据;S22、从所述实时天然气负荷数据中提取深度学习模型的输入特征所需的变量值并构成实时输入特征;S23、对所述实时输入特征进行所述归一化处理,得到归一化输入特征;S24、将所述归一化输入特征输入以最优超参数值训练后的所述深度学习模型中,利用深度学习模型预测未来目标时刻的天然气负荷S24、计算所述归一化输入特征与各聚类簇的聚类中心之间的欧几里得距离,确定欧几里得距离最小的目标聚类簇C,进而利用下式计算未来目标时刻的天然气负荷所在的预测
区间上界与下界:区间上界与下界:式中,U和L分别为预测区间的上界和下界,为模型预测值,Q
x
为目标聚类簇C内的名义置信水平为x的残差百分位数,γ为该残差簇中...

【专利技术属性】
技术研发人员:吕海舟王涛吴昀周凯马鹏岳章超波王云龙王舰董志徐能
申请(专利权)人:浙江能源天然气集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1