建筑能耗预测方法、存储介质、装置和系统制造方法及图纸

技术编号:20945119 阅读:38 留言:0更新日期:2019-04-24 02:39
本发明专利技术涉及一种建筑能耗预测方法、存储介质、装置和系统。主要包括:获取实际能耗数据,利用DBN对实际能耗数据进行特征提取,获得输出状态表示值;将输出状态表示值输入强化学习Q‑learning算法,利用强化学习Q‑learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据。上述方法可较为准确的预测建筑能耗数据。

Building Energy Consumption Prediction Method, Storage Media, Devices and Systems

The invention relates to a building energy consumption prediction method, a storage medium, a device and a system. It mainly includes: obtaining actual energy consumption data, using DBN to extract features of actual energy consumption data, obtaining output state representation value; inputting output state representation value into reinforcement learning Q learning algorithm, using reinforcement learning Q learning algorithm to obtain the optimal prediction strategy, using the optimal prediction strategy to predict building energy consumption data. The above methods can accurately predict building energy consumption data.

【技术实现步骤摘要】
建筑能耗预测方法、存储介质、装置和系统
本专利技术涉及建筑能耗监测预测领域,特别是涉及建筑能耗预测方法、存储介质、装置和系统。
技术介绍
目前,随着经济的快速发展与城镇化的不断推进,人们的生活水平不断提高,对于城市公共建筑的使用率正不断提高。城市公共建筑在运行过程中所消耗的电力、淡水、燃气的规模也越来越大。对于城市管理者迫切需要知道现有以及未来一段时间的能耗数据,以便采取相应措施达到节能减排的目的。但目前的用于监测和预测能耗数据的方法和相关系统不够智能化,且预测精度不高。
技术实现思路
基于此,有必要针对传统的建筑能耗预测方法精度不高的问题,提供一种预测精度较高的建筑能耗预测方法。一种建筑能耗预测方法,包括:获取实际能耗数据,利用DBN对实际能耗数据进行特征提取,获得输出状态表示值;将输出状态表示值输入强化学习Q-learning算法,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据。上述建筑能耗预测方法得到的建筑能耗预测数据精度较高,也就是更接近建筑能耗实际数据。在其中一个实施例中,所述将输出状态表示值输入强化学习Q-learning算法,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据的具体步骤包括:将建筑能耗问题建模为一个马尔可夫决策过程,并定义其中的状态、动作、状态转移函数以及立即奖赏函数,建立回报值函数模型,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据。在其中一个实施例中,所述将建筑能耗问题建模为一个马尔可夫决策过程,并定义其中的状态、动作、状态转移函数以及立即奖赏函数的具体步骤包括:状态:用s表示,每隔m个小时,获取一次实际能耗数据,通过DBN对实际能耗数据进行特征提取,获得输出状态表示值,s={vi-nvi-n+1,vi-n+2…,vi},所述s为所测得的最新能耗数据之前n个数据经过DBN特征提取后的状态集合,其中vi为最近一个DBN所输出的状态表示值;动作:用a表示,所述动作表示预测下一个时刻的能耗数据,第i个时间步预测获得的能耗预测数据用Ei+1表示,这个能耗预测数据在某一个范围内,则动作表示为:ai=Ei+1;状态转移:第i次获取的状态为si,则第i+1次状态表示为si={vi-nvi-n+1,vi-n+2…,vi}->si+1={vi-n+1vi-n+2,vi-n+3…,vi+1};立即奖赏函数:用r表示,下一个时刻的能耗预测数据用Et+1表示,下一时刻的实际的能耗数据用et+1,则两者之间的差值为E=|Et+1-et+1|,奖赏被建模为一个负值的变量,相当于预测结果的惩罚值,相应的立即奖赏函数为:r=-E。在其中一个实施例中,所述建立回报值函数模型的具体步骤为:建立回报值函数模型,设R(s,a)表示在状态s下采取动作a的回报值,值函数Q(s,a)是关于R(s,a)的期望,则Q(s,a)=E[R(s,a)]。在其中一个实施例中,所述利用强化学习Q-learning算法获得最优预测策略的具体步骤为:每获取一次实际能耗数据记为一次情节,每次状态转移即预测一次下一时刻的能耗数据记为一个时间步t,重复以下步骤直到s收敛:采取动作a,获得r和下一个状态s’,通过ε-greedy策略从Q根据s’选择下一个动作a’,Q(s,a)←Q(s,a)+α[r+γmaxQ(s′,a′)-Q(s,a)],s←s',a←a',其中γ为折扣因子,是一个0到1的值,根据实际收敛情况而定,α为学习速率。一种建筑能耗预测系统,包括:能耗数据采集模块,所述能耗数据采集模块用于获得实际能耗数据;能耗数据处理模块,所述能耗数据处理模块利用DBN对实际能耗数据进行特征提取,获得输出状态表示值;预测模块,所述预测模块将输出状态表示值输入强化学习Q-learning算法,获得最优预测策略,利用最优预测策略预测能耗数据。在其中一个实施例中,所述将输出状态表示值输入强化学习Q-learning算法,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据的具体步骤包括:将建筑能耗问题建模为一个马尔可夫决策过程,并定义其中的状态、动作、状态转移函数以及立即奖赏函数,建立回报值函数模型,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据。一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行所述的建筑能耗预测方法对应的操作。一种计算机装置,包括:处理器、存储器、通信接口和通信总线,所述处理器、存储器和通信接口通过所述通信总线完成相互间的通信,所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行所述的建筑能耗预测方法对应的操作。一种建筑能耗监测预测系统,包括:能耗数据采集模块,所述能耗数据采集模块用于获得实际能耗数据;能耗数据处理模块,所述能耗数据处理模块用于监测和处理能耗数据采集模块以及预测模块产生的数据,其中,所述处理包括所述能耗数据处理模块利用DBN对实际能耗数据进行特征提取,获得输出状态表示值;预测模块,所述预测模块将输出状态表示值输入强化学习Q-learning算法,获得最优预测策略,利用最优预测策略预测能耗数据;数据存储模块,用于将能耗数据采集模块以及预测模块产生的数据进行存储。附图说明图1为DBN框架图。图2为本专利技术的实施例的系统的示意图。图3为2017年9月共30天的能耗数据图。图4为2017年9月23日至9月29日共一周7天的能耗数据图。图5为基于DBN的Q-learning算法对一个星期的建筑能耗预测值与实际值的对比图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本专利技术。但是本专利技术能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似改进,因此本专利技术不受下面公开的具体实施例的限制。需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。本专利技术的实施例提供了一种建筑能耗预测方法,包括:获取实际能耗数据,利用DBN对实际能耗数据进行特征提取,获得输出状态表示值;将输出状态表示值输入强化学习Q-learning算法,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据。上述建筑能耗预测方法得到的建筑能耗预测数据精度较高,也就是更接近建筑能耗实际数据。进一步的是,在建筑能耗预测数据的基础上,还可根据实际检测数据对相关模型进行修正,例如使用误差反向传播算法来优化模型。以使预测准确率更高。具体的,如图1所示,DBN也就是深本文档来自技高网
...

【技术保护点】
1.一种建筑能耗预测方法,其特征在于,包括:获取实际能耗数据,利用DBN对实际能耗数据进行特征提取,获得输出状态表示值;将输出状态表示值输入强化学习Q‑learning算法,利用强化学习Q‑learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据。

【技术特征摘要】
1.一种建筑能耗预测方法,其特征在于,包括:获取实际能耗数据,利用DBN对实际能耗数据进行特征提取,获得输出状态表示值;将输出状态表示值输入强化学习Q-learning算法,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据。2.根据权利要求1所述的建筑能耗预测方法,其特征在于,所述将输出状态表示值输入强化学习Q-learning算法,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据的具体步骤包括:将建筑能耗问题建模为一个马尔可夫决策过程,并定义其中的状态、动作、状态转移函数以及立即奖赏函数,建立回报值函数模型,利用强化学习Q-learning算法获得最优预测策略,利用最优预测策略预测建筑能耗数据。3.根据权利要求2所述的建筑能耗预测方法,其特征在于,所述将建筑能耗问题建模为一个马尔可夫决策过程,并定义其中的状态、动作、状态转移函数以及立即奖赏函数的具体步骤包括:状态:用s表示,每隔m个小时,获取一次实际能耗数据,通过DBN对实际能耗数据进行特征提取,获得输出状态表示值,s={vi-nvi-n+1,vi-n+2…,vi},所述s为所测得的最新能耗数据之前n个数据经过DBN特征提取后的状态集合,其中vi为最近一个DBN所输出的状态表示值;动作:用a表示,所述动作表示预测下一个时刻的能耗数据,第i个时间步预测获得的能耗预测数据用Ei+1表示,这个能耗预测数据在某一个范围内,则动作表示为:ai=Ei+1;状态转移:第i次获取的状态为si,则第i+1次状态表示为:si={vi-nvi-n+1,vi-n+2…,vi}->si+1={vi-n+1vi-n+2,vi-n+3…,vi+1};立即奖赏函数:用r表示,下一个时刻的能耗预测数据用Et+1表示,下一时刻的实际的能耗数据用et+1,则两者之间的差值为E=|Et+1-et+1|,奖赏被建模为一个负值的变量,相当于预测结果的惩罚值,相应的立即奖赏函数为:r=-E。4.根据权利要求2所述的建筑能耗预测方法,其特征在于,所述建立回报值函数模型的具体步骤为:建立回报值函数模型,设R(s,a)表示在状态s下采取动作a的回报值,值函数Q(s,a)是关于R(s,a)的期望,则Q(s,a)=E[R(s,a)]。5.根据权利要求2所述的建筑能耗预测方法,其特征在于,所述利用强化学习Q-learning算法...

【专利技术属性】
技术研发人员:傅启明钱徐浩然钟珊陈建平傅朝阳
申请(专利权)人:苏州科技大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1