基于长短期时间序列网络的换热站超短期热负荷预测方法技术

技术编号:29082726 阅读:37 留言:0更新日期:2021-06-30 09:44
本发明专利技术公开了一种换热站超短期热负荷预测的方法。首先利用随机森林算法对特征进行筛选降维;然后对数据进行标准化处理;接着建立基于长短期时间序列网络的热负荷预测模型,模型通过卷积层和循环层捕捉长短期的特征信息,然后引入循环跳跃层这一概念,捕捉更长期的特征信息,同时利用自回归算法为模型添加线性处理能力,增强了模型的鲁棒性。该方法利用逐时负荷自身的周期特性来解决神经网络在处理长序列数据时信息丢失的问题,从而提高了模型预测的性能。测的性能。测的性能。

【技术实现步骤摘要】
基于长短期时间序列网络的换热站超短期热负荷预测方法


[0001]本专利技术涉及集中供热
,尤其涉及一种换热站超短期热负荷预测的方法。本专利技术是基于数据驱动的方法在集中供热过程热负荷预测领域的具体应用。

技术介绍

[0002]随着中国经济社会的不断发展,城镇化水平的不断提升,集中供热在中国北方城市与农村逐渐覆盖。据国家统计局公布,截止2018年,我国城市集中供热面积已达87.80亿平方米,较2017年底,增长5.67%。集中供热消耗的化石燃料会造成严重的环境污染和雾霾,为实现节能环保,避免供热不均,热负荷预测成为重要的研究问题。并且通过调研一家供热公司得知,该供热公司供热面积约350万平方米,如果在供热过程中降低0.5℃,则可以节省近千万元。所以分别从节能环保和经济效益的角度出发,热负荷预测都具有非常重要的现实意义。集中供热系统是一个非线性、大之后系统,其中包含诸多的阀门和泵,很难建立精准的数学模型,因此,基于数据驱动的方法更适用于热负荷预测领域。
[0003]本专利技术主要为换热站超短期热负荷预测任务而设计。换热站直接连接热用户,并对热量进行分配和配送,而且供热公司直接进行调控的也是换热站。在现实生活中,换热站与小区热用户距离较近,其供热的滞后周期接近于1小时。所以,以换热站和超短期分别作为研究的对象和时间维度将具有较好地现实意义。
[0004]传统的热负荷预测方法主要有灰色预测、时间序列预测和回归等方法,随着智能算法的不断发展,也有很多机器学习和神经网络的算法应用到该领域来,比如:支持向量回归(Support Vector Regression,SVR)、循环神经网络(Recurrent Neural Network,RNN)、长短期记忆神经网络(Long Short

Term Memory,LSTM)等。但以上方法均是从热负荷的时序特性上出发的,当输入的序列较长时候,由于梯度消失,很容易造成信息的丢失,故而会丢失较长期信息的相关性,预测的精度有待提升。

技术实现思路

[0005]为了解决神经网络在处理长序列信息容易丢失较长期信息的问题,本专利技术提供一种长短期时间序列网络(Long Short

term Time

series Network,LSTNet)模型,来应对该问题。热负荷是典型的时间序列问题,而且逐时热负荷带有周期性。本专利技术提供的长短期时间序列网络模型利用这一特性,引入循环跳跃的思想,可以有效解决信息丢失的问题。模型首先利用随机森林(Random Forest,RF)算法对特征进行筛选降维;然后建立基于长短期时间序列网络的热负荷预测模型,通过卷积层和循环层捕捉长短期的特征信息,然后引入循环跳跃层这一概念,捕捉更长期的特征信息,同时利用自回归算法为模型添加线性处理能力,增强了模型的鲁棒性。
[0006]本专利技术采用了如下的技术方案及实现步骤:
[0007]S1选取一定时间段的气象数据和供热数据,构建数据集作为输入变量X
n

[0008]S2对数据进行预处理,其中包括对缺失值、离群值的识别与修正,并对数据进行标
准化处理;
[0009]S3采用RF方法对输入变量进行筛选,对数据集进行降维操作得到X
m
,并将数据集以8:2的比例分为训练集和测试集;
[0010]S4将训练集逐条输入到LSTNet模型中,训练模型的权重和偏置:
[0011]S401首先采用卷积层捕捉短期局部的特征信息;
[0012]S402接着利用循环层捕捉长期宏观信息,输出为h
tR
;同时循环跳跃层利
[0013]用序列的周期特性,捕捉更长期的信息,输出为h
tS

[0014]S403然后通过全连接层的方式,连接循环层和循环跳跃层的输出,得到输出为y
tD

[0015]S404然后结合AR过程的输出,为预测添加线性成分,同时使模型可以捕捉到输入的尺度变化,增强模型的鲁棒性,得到输出为y
tA

[0016]S405输出模块是将神经网络部分的输出和AR模型的输出进行了整合,得到最终的预测模型。
[0017]S5将测试集逐条输入到训练好的LSTNet模型中,得到预测值
[0018]有益效果
[0019]与现有技术相比,本专利技术充分考虑了超短期热负荷的周期特性,通过引入循环跳跃层的概念,来弥补常规神经网络由于梯度下降造成的信息丢失的问题。不同于传统的神经网络算法,本专利技术充分考虑了逐时热负荷的周期特性,该特性更具有代表性,可以更好的完成对超短期热负荷的预测任务。
附图说明
[0020]图1为本专利技术模型结构图;
[0021]图2为本专利技术模拟热负荷数据展示图;
[0022]图3为本专利技术LSTNet模型预测结果展示图;
具体实施方式
[0023]下面结合本专利技术的附图和具体实施例对本专利技术技术方案进行详细的描述,以使专利技术的技术特征和优点更为明显。
[0024]S1选取尽可能多的相关特征变量数据,其中可包括气象数据、运行工况数据和热负荷数据等,以构建热负荷数据集,得到X
n
={x1,x2,

,x
n
},其中n为特征变量的数量;
[0025]S2在构建完数据集后,对数据进行预处理操作:
[0026]S201对缺失值,即数据为0或空的值进行补偿,采用下式来计算:
[0027]x
i
=0.4x
i
‑1+0.4x
i+1
+0.2x
i+2
ꢀꢀ
(1)
[0028]式中x
i
为当前缺失值,x
i
‑1、x
i+1
和x
i+2
分别为上一时刻、下一时刻、下二时刻的值;
[0029]S202针对离群值,即超过规定范围3倍以上的值,将该值作为缺失值处理;
[0030]S203对每一维输入变量进行标准化处理,采用的计算公式为:
[0031][0032]式中y
i
为标准化后的值;x
i
为原始值;和s分别代表原始数据的均值和方差。标准
化后的数据均值为0,方差为1,且无量纲。
[0033]S3利用RF算法对特征变量进行筛选降维,利用随机森林进行特征重要性评估的思想比较简单,主要是看每个特征在随机森林中的每棵树上做了多大的贡献,然后取平均值,最后比较不同特征之间的贡献大小。其中某个特征x的重要性表示为IMP,其计算方法如下:
[0034]S301对于随机森林中的每一个决策树,使用相应的袋外数据(Out Of Bag,OOB)来计算它的袋外数据误差,记为OOBError1,其计算公式如下所示:
[0035][0036]其中O为袋外数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于长短期时间序列网络的换热站超短期负荷预测方法,其特征在于所述方法步骤为:S1:选取一定时间段的气象数据和供热数据,构建数据集作为输入变量X
n
;S2:对数据进行预处理,其中包括对缺失值、离群值的识别与修正,并对数据进行标准化处理;S3:采用RF方法对输入变量进行筛选,对数据集进行降维操作得到X
m
,并将数据集以8:2的比例分为训练集和测试集;S4:将训练集逐条输入到LSTNet模型中,训练模型的权重和偏置,得到训练好的网络模型;S5:将测试集逐条输入到训练好的LSTNet模型中,得到预测值2.根据权利要求1所述基于长短期时间序列网络的换热站超短期负荷预测方法,其特征在于,所述步骤S2进行了数据的预处理,其步骤为:S201:针对缺失值,可采用下式来计算:x
i
=0.4x
i
‑1+0.4x
i+1
+0.2x
i+2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式中x
i
为当前缺失值,x
i
‑1、x
i+1
和x
i+2
分别为上一时刻、下一时刻、下二时刻的值;S202:针对离群值,即超过规定范围3倍以上的值,将该值作为缺失值处理;S203:对每一维数据进行标准化,标准化的公式为:式中y
i
为标准化后的值;x
i
为原始值;和s分别代表原始数据的均值和方差;标准化后的数据均值为0,方差为1,且无量纲。3.根据权利要求1所述基于长短期时间序列网络的换热站超短期负荷预测方法,其特征在于,所述步骤S3降维操作的方法包括:S301:计算随机森林中每一棵决策树的袋外数据误差;使用相应的袋外数据(Out Of Bag,OOB)来计算它的袋外数据误差,记为OOBError1,其计算公式如下所示:其中O为袋外数据总数,以袋外数据作为输入,带入随机森林分类器,利用分类器给这O条数据进行分类比较,统计分类错误的数目,设为X;S302:对特征x加入噪声干扰,再次计算随机森林中每一棵决策树的袋外数据误差;S303:计算每个特征的重...

【专利技术属性】
技术研发人员:刘旭东李硕范青武
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1