基于生成对抗网络的空调互动末端能耗预测方法及空调技术

技术编号:32119345 阅读:24 留言:0更新日期:2022-01-29 19:05
本发明专利技术公开了基于生成对抗网络的空调互动末端能耗预测方法及空调,属于空调设备技术领域。由于空调系统能耗受室外温度影响较大,现有的预测模型很难准确预测空调系统能耗。本发明专利技术的一种基于生成对抗网络的空调互动末端能耗预测方法,利用生成对抗网络将真实能耗样本生成新的经验样本,并经验样本输入到主体agent学习系统,进行训练,形成测试集样本;然后构建空调互动末端能耗预测模型,利用强化学习算法,通过当前时刻空调互动末端能耗以及前序若干个时刻的空调互动末端能耗数据预测下一时刻空调互动末端能耗;进而实现对空调互动末端能耗的准确预测,从而提高空调互动末端能耗管理效率,有效降低空调互动末端的能耗。有效降低空调互动末端的能耗。有效降低空调互动末端的能耗。

【技术实现步骤摘要】
基于生成对抗网络的空调互动末端能耗预测方法及空调


[0001]本专利技术涉及基于生成对抗网络的空调互动末端能耗预测方法及空调,属于空调设备


技术介绍

[0002]在总空调互动末端能耗中,空调系统的空调互动末端能耗量占到了60%,而在空调系统诸多设备中,空调末端设备的空调互动末端能耗量占到了近30%,因此,实现空调节能是实现节能减排的有效手段,而实现空调节能的重要途径之一能准确预测空调互动末端能耗。
[0003]空调互动末端能耗预测技术不仅可以发现空调互动末端能耗异常,从而采用有效的节能方案;还可以为空调互动末端能耗系统的在线控制和优化提供指导。因此,实现空调互动末端能耗准确预测方案具有巨大的经济效益。
[0004]进一步,中国专利技术(公开号CN112686442A)公开了一种基于运行多样性空调末端能耗预测方法,包括步骤:获取待预测建筑的典型气象年的天气数据;对所述天气数据进行预处理;根据所述待预测建筑的分类,将预处理后的天气数据输入至预先训练的、与所述待预测建筑类型对应的能耗预测模型,得到待预测建筑在典型气象年空调末本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于生成对抗网络的空调互动末端能耗预测方法,其特征在于,包括以下步骤:第一步,获取空调互动末端实际产生的真实能耗样本;第二步,利用第一步中的真实能耗样本,训练生成对抗网络;第三步,利用第二步中的生成对抗网络生成新的经验样本;第四步,将第三步中的经验样本输入到主体agent学习系统,进行训练,形成测试集样本;第五步,将第四步中测试集样本以时间序列排序,并利用强化学习算法,构建空调互动末端能耗预测模型,实现空调互动末端能耗的预测。2.如权利要求1所述的一种基于生成对抗网络的空调互动末端能耗预测方法,其特征在于,所述第一步中,当真实能耗样本的数据存在缺失或异常时,采用前一天以及后一天的同一时刻的空调互动末端能耗数据,对缺失数据以及异常数据进行填充;填充公式如下表示:T(d,t)=β1*T(d1,t)+β2*T(d2,t)其中,T(d,t)为第d天的t时刻的缺失数据,T(d1,t)、T(d2,t)分别为第d天相邻的相同日期的t时刻空调互动末端能耗数据,β1、β2为各自对应的数值权重。3.如权利要求1所述的一种基于生成对抗网络的空调互动末端能耗预测方法,其特征在于,所述第二步中,生成对抗网络包括判别器模型D、生成器模型G,其具体计算公式如下:所述判别器模型D为最大化值函数,所述生成器模型G为最小化值函数,生成器模型G与判别器模型D利用微分函数来表示,它们各自的输入分别为随机噪声z和真实数据x;设置输入噪音变量P
z
(z),用于学习真实数据x的分布P
data
;G(z)表示由生成器模型G生成的尽量服从真实数据分布的样本;判别器模型D的目标是对数据来源进行判别:如果判别器模型D判别出输入来自于真实数据,则标注为1,如果输入来自生成器模型G,则标注为0;在不断优化的过程中,对于生成器模型G而言,其目标是使所生成伪数据G(z)在判别器模型D上的标注D(G(z)和真实数据x在判别器模型D上的标注D(x)一致;同时训练生成器模型G,最小化log(1

D(G(z))以提高生成相似样本的能力。4.如权利要求1所述的一种基于生成对抗网络的空调互动末端能耗预测方法,其特征在于,所述第三步中,经验样本包括状态动作对、后续状态奖赏对,状态动作对包括状态s、动作a;
上一时刻状态s与相应的动作a对应;后续状态奖赏对包括后续状态s'、奖赏r;下一时刻迁移至状态s',并获得立即奖赏r;经验样本计算公式如下所示:G(z)=[(s
z
,a
z
),(s
z
',r
z
)]=[G1(z),G2(z)]其中,s
z
表示z时刻状态;a
z
表示z时刻动作;s`
z
表示z时刻后续状态;r
z
表示z时刻立即奖赏;G1(z)表示生成的状态动作对;G2(z)表示生成的后续状态奖赏对;结合生成的样本G1(z)以及互信息I,构建基于深度神经网络的关系修正单元,关系修正单元将输入的状态动作对G1(z)转换成后续状态与奖赏对G(z)',并输出,实现所生成的后续状态奖赏对G2(z)与构建的后续状态奖赏对G2(z)'之间具有较高的相似性;并利用相对熵表示G2(z)与G2(z)'之间的相似性,如公式(5)所示:其中,p(i)表示数据的真实分布,q(i)表示数据的理论分布,P表示生成的后续状态与奖赏对G2(z),Q表示构建的后续状态与奖赏对G2(z)'。5.如权利要求4所述的一种基于生成对抗网络的空调互动末端能耗预测方法,其特征在于,所述第四步中,主体agent学习系统用于训练动作值函数网络,寻找最优策略;动作值函数为Q
π
(s,a),用于表示主体agent学习系统在当前状态s执行动作a,并且一直遵循策略π到情节终止时刻,在这个过程中主体agent学习系统获得的累积奖赏值如公式(7)所示:Q
π
(s,a)=E[R
t
|s
t
=s,a
t
=a,π](7)其中:R
t
表示总奖赏,E表示数学期望;对于所有的状态动作对,当策略π*的期望回报大于或者等于其他所有策略的期望回报时,称策略π*为最优策略;最优策略至少包括一个,其共享同一个动作值函数,动作值函数的计算公式如下所示:同时动作值函数遵循贝尔曼最优方程,其计算公式如下所示:
其中,γ表示折扣因子;a`表示下一时刻的选择动作;E
s`~S
表示数学期望;所述测试集样本包括训练样本集、动作空间集、奖赏样本集;所述训练样本集包括k个前i个时刻的空调互动末端能耗数据t,其为X={(t1,t2,

,t
i
),(t2,t3,

,t
i+1
),

,(t
k
,t
k+1
,

,t
k+i
...

【专利技术属性】
技术研发人员:李磊王朝亮肖涛刘炜陆春光李亦龙宋磊
申请(专利权)人:国网浙江省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1