一种建筑多区域温度的预测方法、设备及介质技术

技术编号:38582532 阅读:17 留言:0更新日期:2023-08-26 23:26
本申请公开了一种建筑多区域温度的预测方法、设备及介质,用以解决现有技术无法简单、高效的得到建筑多区域温度的预测值的问题。方法包括:确定建筑多区域内的待测区域和相邻区域,并分别建立教师网络得到对应教师预测模型;获取多个教师预测模型对应的预测结果并对多个预测结果进行线性拟合得到教师预测结果;为待测区域建立学生模型并获取学生预测结果;根据教师预测结果和预设的目标预测结果计算教师损失,并根据教师预测结果及学生预测结果计算学生损失;根据教师损失和学生损失计算建筑多区域内的总温度损失以完成对学生预测模型的训练,并通过训练好的学生模型确定待测区域对应的温度预测值。域对应的温度预测值。域对应的温度预测值。

【技术实现步骤摘要】
一种建筑多区域温度的预测方法、设备及介质


[0001]本申请涉及专门适用于预测目的的数据处理方法
,尤其涉及一种建筑多区域温度的预测方法、设备及介质。

技术介绍

[0002]目前,在建筑能耗中,空调系统是主要的耗能设备,约占总能耗的55%,而建筑系统是一个复杂系统,它具有非线性、大滞后、多变量、耦合严重、变化缓慢等特点。利用建筑系统大滞后的特点能够预测建筑内下一时刻的室内温度,从而根据下一时刻的室内温度指导建筑空调系统的调节,能够在保证用户热舒适性的同时,尽可能的节约建筑能耗。
[0003]建筑室内温度受天气特征、室内环境参数、时间信息等相关因素的影响,特别是建筑内存在多个区域,各区域建筑温度相互影响,使室内各区域温度建模变得更加复杂。近年来,很多研究者将多种影响因素建立温度预测模型,但是建模过程中会耗费大量计算资源,网络结构通常具有冗余性,难以简单、高效的得到建筑多区域温度的预测值。

技术实现思路

[0004]本申请实施例提供了一种建筑多区域温度的预测方法、设备及介质,用以解决现有的建筑室内温度受天气特征、室内环境参数、时间信息等相关因素的影响,无法简单、高效的得到建筑多区域温度的预测值的技术问题。
[0005]一方面,本申请实施例提供了一种建筑多区域温度的预测方法,包括:
[0006]确定建筑内的待测区域及所述待测区域对应的多个相邻区域,并分别为所述待测区域及多个相邻区域建立对应的教师网络,以得到对应的教师模型;
[0007]分别获取多个教师模型对应的多个预测结果,并对所述多个预测结果进行线性拟合,以得到对应的教师预测结果;
[0008]为所述待测区域建立对应的学生模型,并获取所述学生模型输出的学生预测结果;
[0009]根据所述教师预测结果和预设的目标预测结果,计算对应的教师损失,并根据所述教师预测结果及所述学生预测结果,计算对应的学生损失;
[0010]根据所述教师损失和所述学生损失,计算所述建筑内的总温度损失,以完成对学生模型的训练,并通过训练好的学生模型确定所述待测区域对应的温度预测值。
[0011]在本申请的一种实现方式中,所述分别为所述待测区域及多个相邻区域建立对应的教师网络之后,所述方法还包括:
[0012]分别获取所述待测区域和多个相邻区域对应的相关参数以及每个区域的多个历史时刻的温度状态;所述相关参数包括室外温度、室外湿度、区域室内风速、区域室内湿度以及本月天数,所述多个历史时刻的温度状态包括第一历史时刻的温度状态、第二历史时刻的温度状态、第三历史时刻的温度状态和第四历史时刻的温度状态;
[0013]根据所述待测区域和多个相邻区域中任一区域的室外温度、室外湿度、区域室内
风速、区域室内湿度、本月天数,以及所述第一历史时刻的温度状态、第二历史时刻的温度状态、第三历史时刻的温度状态和第四历史时刻的温度状态,确定所述区域的当前时刻对应的温度状态。
[0014]在本申请的一种实现方式中,所述确定所述区域的当前时刻对应的温度状态之后,所述方法还包括:
[0015]确定目标网络的网络参数以及评价网络的网络参数,并根据所述目标网络的网络参数、第一历史时刻的温度状态、第一历史时刻的动作,确定所述评价网络在第一历史时刻的Q值;
[0016]将所述第一历史时刻的Q值与评价网络训练过程中的衰减系数以及第一历史时刻的动作的最大值做乘积,并将所述乘积与当前时刻的固定奖励相加,以及与当前时刻的Q值相减,得到对应的运算结果;
[0017]将所述运算结果和评价网络训练过程中的学习率相乘,并将所述运算结果和学习率对应的乘积,与所述当前时刻的Q值相加,以得到所述评价网络在当前时刻的温度状态下的动作的Q值,完成对深度强化学习的Q值迭代。
[0018]在本申请的一种实现方式中,所述完成对深度强化学习的Q值迭代之后,所述方法还包括:
[0019]获取评价网络在Q值迭代前后对应的Q值,并确定所述Q值迭代前后的Q值对应的时间差分偏差;
[0020]根据所述时间差分偏差,对所述评价网络进行训练,并计算所述评价网络训练过程中的损失函数,以完成对教师网络的训练。
[0021]在本申请的一种实现方式中,所述分别获取多个教师模型对应的多个预测结果,并对所述多个预测结果进行线性拟合,以得到对应的教师预测结果,具体包括:
[0022]确定出建筑内的待测区域,以及所述待测区域对应的多个相邻区域,并基于所述待测区域以及所述多个相邻区域对应的教师模型,分别获取对应的多个预测结果;
[0023]获取教师模型预先设置好的目标预测结果,并基于最小二乘法以及所述目标预测结果,确定所述多个预测结果分别对应的线性函数参数;
[0024]根据每个预测结果对应的线性函数参数,分别对对应的预测结果进行线性拟合,并得到对应的教师预测结果。
[0025]在本申请的一种实现方式中,所述为所述待测区域建立对应的学生模型,并获取所述学生模型输出的学生预测结果,具体包括:
[0026]为所述待测区域建立对应的学生模型,并将所述待测区域输入至所述学生模型中进行训练;
[0027]通过所述学生模型对所述待测区域进行优化,并通过全连接层输出优化后的所述待测区域对应的学生预测结果。
[0028]在本申请的一种实现方式中,所述根据所述教师预测结果和预设的目标预测结果,计算对应的教师损失,并根据所述教师预测结果及所述学生预测结果,计算对应的学生损失,具体包括:
[0029]确定所述待测区域和多个相邻区域对应的区域数,并根据所述区域数、所述多个教师模型对应的教师预测结果,以及预先设置好的所述多个教师模型的目标预测结果,计
算所述多个教师模型对应的均方差损失,以将所述多个教师模型对应的均方差损失作为教师损失;
[0030]根据所述区域数、所述教师损失以及所述学生预测结果,计算所述学生模型对应的均方差损失,并将所述学生模型对应的均方差损失作为学生损失。
[0031]在本申请的一种实现方式中,所述根据所述教师损失和所述学生损失,计算所述建筑内的总温度损失,以完成对学生模型的训练,并通过训练好的学生模型确定所述待测区域对应的温度预测值,具体包括:
[0032]确定待测区域和多个相邻区域对应多个教师模型的加权系数,并根据所述多个教师模型对应的加权系数,确定待测区域对应学生模型的加权系数;
[0033]根据所述多个教师模型对应的加权系数、所述教师损失、所述学生模型对应的加权系数以及所述学生损失,计算所述建筑对应的总温度损失,以完成对学生模型的训练;
[0034]通过训练好的学生模型,确定所述待测区域对应的的温度预测值,以实现对建筑多区域温度的预测。
[0035]另一方面,本申请实施例还提供了一种建筑多区域温度的预测设备,所述设备包括:
[0036]至少一个处理器;
[0037]以及,与所述至少一个处理器通信连接的存储器;
[0038]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建筑多区域温度的预测方法,其特征在于,所述方法包括:确定建筑内的待测区域及所述待测区域对应的多个相邻区域,并分别为所述待测区域及多个相邻区域建立对应的教师网络,以得到对应的教师模型;分别获取多个教师模型对应的多个预测结果,并对所述多个预测结果进行线性拟合,以得到对应的教师预测结果;为所述待测区域建立对应的学生模型,并获取所述学生模型输出的学生预测结果;根据所述教师预测结果和预设的目标预测结果,计算对应的教师损失,并根据所述教师预测结果及所述学生预测结果,计算对应的学生损失;根据所述教师损失和所述学生损失,计算所述建筑内的总温度损失,以完成对学生模型的训练,并通过训练好的学生模型确定所述待测区域对应的温度预测值。2.根据权利要求1所述的一种建筑多区域温度的预测方法,其特征在于,所述分别为所述待测区域及多个相邻区域建立对应的教师网络之后,所述方法还包括:分别获取所述待测区域和多个相邻区域对应的相关参数以及每个区域的多个历史时刻的温度状态;所述相关参数包括室外温度、室外湿度、区域室内风速、区域室内湿度以及本月天数,所述多个历史时刻的温度状态包括第一历史时刻的温度状态、第二历史时刻的温度状态、第三历史时刻的温度状态和第四历史时刻的温度状态;根据所述待测区域和多个相邻区域中任一区域的室外温度、室外湿度、区域室内风速、区域室内湿度、本月天数,以及所述第一历史时刻的温度状态、第二历史时刻的温度状态、第三历史时刻的温度状态和第四历史时刻的温度状态,确定所述区域的当前时刻对应的温度状态。3.根据权利要求2所述的一种建筑多区域温度的预测方法,其特征在于,所述确定所述区域的当前时刻对应的温度状态之后,所述方法还包括:确定目标网络的网络参数以及评价网络的网络参数,并根据所述目标网络的网络参数、第一历史时刻的温度状态、第一历史时刻的动作,确定所述评价网络在第一历史时刻的Q值;将所述第一历史时刻的Q值与评价网络训练过程中的衰减系数以及第一历史时刻的动作的最大值做乘积,并将所述乘积与当前时刻的固定奖励相加,以及与当前时刻的Q值相减,得到对应的运算结果;将所述运算结果和评价网络训练过程中的学习率相乘,并将所述运算结果和学习率对应的乘积,与所述当前时刻的Q值相加,以得到所述评价网络在当前时刻的温度状态下的动作的Q值,完成对深度强化学习的Q值迭代。4.根据权利要求3所述的一种建筑多区域温度的预测方法,其特征在于,所述完成对深度强化学习的Q值迭代之后,所述方法还包括:获取评价网络在Q值迭代前后对应的Q值,并确定所述Q值迭代前后的Q值对应的时间差分偏差;根据所述时间差分偏差,对所述评价网络进行训练,并计算所述评价网络训练过程中的损失函数,以完成对教师网络的训练。5.根据权利要求1所述的一种建筑多区域温度的预测方法,其特征在于,所述分别获取多个教师模型对应的多个预测结果,并对所述多个预测结果进行线性拟合,以得到...

【专利技术属性】
技术研发人员:孙鸿昌翟文文狄传广黄广国于茂津
申请(专利权)人:山东大卫国际建筑设计有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1