控制方法和计算机可读存储介质技术

技术编号:22443108 阅读:15 留言:0更新日期:2019-11-02 03:24
公开了一种控制方法和计算机可读存储介质。通过根据预先获取的初始系统控制模型控制目标建筑中的暖通空调系统,并在控制过程中根据控制暖通空调系统的历史记录在每个周期组更新一次所述系统控制模型。由此,可以实现在对暖通空调系统的过程中不断更新系统控制模型,以适应环境的变化,可以较为精确地对暖通空调系统进行控制。

Control method and computer readable storage medium

【技术实现步骤摘要】
控制方法和计算机可读存储介质
本专利技术涉及空调控制
,尤其涉及一种控制方法和计算机可读存储介质。
技术介绍
现有技术中一般是基于固定逻辑的控制方式实现对建筑中的暖通空调系统的控制,例如:按时间表控制冷机的开启和关闭、按照室外温度的阈值设定供水温度和按照室内温度的温度区间设定风机盘管的挡位。而区间、阈值、时间表等经常是人为根据一定的先验知识主观设定的,因此,对于暖通空调系统的控制很大程度上取决于设定者的经验。然而,由于各种原因(例如外界气候、工作日与休息日等)使得建筑中的需求也是不断变化的,如果设计者的经验不足,很容易造成控制效果不能达到预期效果。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种控制方法和计算机可读存储介质,可以在对暖通空调系统的过程中不断更新系统控制模型,实现对暖通空调系统的精确控制。第一方面,本专利技术实施例提供了一种控制方法,用于控制建筑暖通空调系统,所述暖通空调系统包括冷热源系统和末端风盘系统,所述方法包括:获取初始系统控制模型;在第一周期组的第一个周期内,根据所述初始系统控制模型控制所述暖通空调系统;以及根据控制所述暖通空调系统的历史记录确定每个周期组的系统控制模型,所述历史记录包括控制数据和控制指标,所述控制指标用于表征控制效果;其中,每个周期组包括两个周期,周期组内的第一个周期的系统控制模型根据上一个周期组的历史记录确定,周期组内的第二个周期的系统控制模型根据第一个周期的系统控制模型更新获得。优选地,获取初始系统控制模型包括:确定目标建筑的仿真模型,所述仿真模型包括目标建筑的物理组成以及目标建筑中的暖通空调系统;以及根据所述仿真模型基于输入状态和动作获取所述初始系统控制模型。优选地,所述初始系统控制模型包括第一初始系统控制模型和第二初始系统控制模型,所述第一初始系统控制模型用于控制所述末端风盘系统,所述第二初始系统控制模型用于控制所述冷热源系统;其中,根据所述仿真模型基于输入状态和动作获取所述初始系统控制模型包括:根据所述仿真模型基于第一输入状态和第一动作获取第一初始系统控制模型,所述第一输入状态包括室内温度与目标温度的差值、室外温度与目标温度的差值、冷站供水温度、风盘档位、时间点和日期类型,所述第一动作为选择风盘档位;以及根据所述仿真模型基于第二输入状态和第二动作获取第二初始系统控制模型,所述第二输入状态包括室外温度、瞬时冷流量、供水温度、时间点和日期类型,所述第二动作为选择供水温度和供回水温差。优选地,根据所述仿真模型基于第一输入状态和第一动作获取第一初始系统控制模型包括:确定初始深度强化网络模型;基于深度强化学习算法更新所述初始深度强化网络模型的权重值;以及将控制所述仿真模型中的末端风盘系统的控制指标优于预定阈值时的深度强化网络模型作为第一初始系统控制模型。优选地,基于深度强化学习算法更新所述初始深度强化网络模型的权重值包括:获取第一动作、第一奖励函数和当前时刻第一输入状态;根据所述第一动作和第一奖励函数获取第一奖励值和下一时刻第一输入状态;以及根据当前时刻第一输入状态、第一动作、第一奖励值和下一时刻的输入状态更新所述初始深度强化网络模型的权重值。优选地,所述第一奖励函数为:其中,r1为第一奖励值,d实际温度与目标温度的差值。优选地,根据所述仿真模型基于第二输入状态和第二动作获取第二初始系统控制模型包括:确定初始深度确定性策略梯度网络模型;基于深度确定性策略梯度算法更新所述初始深度确定性策略梯度网络模型的权重值;以及将控制所述仿真模型中的冷热源系统的控制指标优于预定阈值时的深度确定性策略梯度网络模型作为第二初始系统控制模型;其中,所述控制指标用于表征控制效果。优选地,基于深度确定性策略梯度算法更新所述初始深度确定性策略梯度网络模型的权重值包括:获取第二动作、第二奖励函数和当前时刻第二输入状态;根据所述第二动作和第二奖励函数获取第二奖励值和下一时刻第二输入状态;以及根据所述当前时刻第二输入状态、第二动作、第二奖励值和下一时刻第二输入状态更新所述初始深度确定性策略梯度网络模型的权重值。优选地,所述第二奖励函数为:其中,r2为第二奖励值,e为能耗,c为制冷效果,s为制冷效果预定阈值。优选地,所述控制指标包括建筑内的温度在目标温度范围内的时间占比和周期内的平均投诉率中的至少一种。优选地,根据控制所述暖通空调系统的历史记录确定每个周期组的系统控制模型包括:确定当前周期组的第一周期的系统控制模型;在所述第一周期内根据所述第一周期的系统控制模型控制所述暖通空调系统以获取第一周期的控制数据和控制指标;在所述第一周期结束后,根据所述第一周期的控制数据对所述第一周期的系统控制模型进行更新以确定第二周期的系统控制模型;在所述第二周期内,根据所述第二周期的系统控制模型控制所述暖通空调系统以获取第二周期的控制指标;以及根据所述第一周期的控制指标和所述第二周期的控制指标确定下一周期组中第一周期的系统控制模型。优选地,根据所述第一周期的控制指标和所述第二周期的控制指标确定下一周期组中第一周期的系统控制模型包括:响应于所述第一周期的控制指标优于所述第二周期的控制指标,选择所述第一周期的系统控制模型作为下一周期组中第一周期的系统控制模型;以及响应于所述第一周期的控制指标劣于所述第二周期的控制指标,选择所述第二周期的系统控制模型作为下一周期组中第一周期的系统控制模型。第二方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。本专利技术实施例的技术方案通过根据预先获取的初始系统控制模型控制目标建筑中的暖通空调系统,并在控制过程中根据控制暖通空调系统的历史记录在每个周期组更新一次所述系统控制模型。由此,可以实现在对暖通空调系统的过程中不断更新系统控制模型,以适应环境的变化,可以较为精确地对暖通空调系统进行控制。附图说明通过以下参照附图对本专利技术实施例的描述,本专利技术的上述以及其它目的、特征和优点将更为清楚,在附图中:图1是本专利技术实施例的控制方法的流程图;图2是本专利技术实施例的获取初始系统控制模型的流程图;图3是本专利技术实施例的获取初始系统控制模型的流程图;图4是本专利技术实施例的获取第一初始系统控制模型的流程图;图5是本专利技术实施例的更新初始深度强化网络模型的权重值的流程图;图6是本专利技术实施例的深度强化学习算法系统的示意图;图7是本专利技术实施例的获取第二初始系统控制模型的流程图;图8是本专利技术实施例的更新初始深度确定性策略梯度网络模型的权重值的流程图;图9是本专利技术实施例的深度确定性策略梯度算法系统的结构示意图;图10是本专利技术实施例的更新系统控制模型的流程图;图11是本专利技术实施例的周期组的示意图;图12是本专利技术实施例的电子设备的示意图。具体实施方式以下基于实施例对本专利技术进行描述,但是本专利技术并不仅仅限于这些实施例。在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本专利技术。为了避免混淆本专利技术的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。除非上下文明确要求,否则整个说明书和权利本文档来自技高网...

【技术保护点】
1.一种控制方法,用于控制建筑暖通空调系统,所述暖通空调系统包括冷热源系统和末端风盘系统,其特征在于,所述方法包括:获取初始系统控制模型;在第一周期组的第一个周期内,根据所述初始系统控制模型控制所述暖通空调系统;以及根据控制所述暖通空调系统的历史记录确定每个周期组的系统控制模型,所述历史记录包括控制数据和控制指标,所述控制指标用于表征控制效果;其中,每个周期组包括两个周期,周期组内的第一个周期的系统控制模型根据上一个周期组的历史记录确定,周期组内的第二个周期的系统控制模型根据第一个周期的系统控制模型更新获得。

【技术特征摘要】
1.一种控制方法,用于控制建筑暖通空调系统,所述暖通空调系统包括冷热源系统和末端风盘系统,其特征在于,所述方法包括:获取初始系统控制模型;在第一周期组的第一个周期内,根据所述初始系统控制模型控制所述暖通空调系统;以及根据控制所述暖通空调系统的历史记录确定每个周期组的系统控制模型,所述历史记录包括控制数据和控制指标,所述控制指标用于表征控制效果;其中,每个周期组包括两个周期,周期组内的第一个周期的系统控制模型根据上一个周期组的历史记录确定,周期组内的第二个周期的系统控制模型根据第一个周期的系统控制模型更新获得。2.根据权利要求1所述的方法,其特征在于,获取初始系统控制模型包括:确定目标建筑的仿真模型,所述仿真模型包括目标建筑的物理组成以及目标建筑中的暖通空调系统;以及根据所述仿真模型基于输入状态和动作获取所述初始系统控制模型。3.根据权利要求2所述的方法,其特征在于,所述初始系统控制模型包括第一初始系统控制模型和第二初始系统控制模型,所述第一初始系统控制模型用于控制所述末端风盘系统,所述第二初始系统控制模型用于控制所述冷热源系统;其中,根据所述仿真模型基于输入状态和动作获取所述初始系统控制模型包括:根据所述仿真模型基于第一输入状态和第一动作获取第一初始系统控制模型,所述第一输入状态包括室内温度与目标温度的差值、室外温度与目标温度的差值、冷站供水温度、风盘档位、时间点和日期类型,所述第一动作为选择风盘档位;以及根据所述仿真模型基于第二输入状态和第二动作获取第二初始系统控制模型,所述第二输入状态包括室外温度、瞬时冷流量、供水温度、时间点和日期类型,所述第二动作为选择供水温度和供回水温差。4.根据权利要求3所述的方法,其特征在于,根据所述仿真模型基于第一输入状态和第一动作获取第一初始系统控制模型包括:确定初始深度强化网络模型;基于深度强化学习算法更新所述初始深度强化网络模型的权重值;以及将控制所述仿真模型中的末端风盘系统的控制指标优于预定阈值时的深度强化网络模型作为第一初始系统控制模型。5.根据权利要求4所述的方法,其特征在于,基于深度强化学习算法更新所述初始深度强化网络模型的权重值包括:获取第一动作、第一奖励函数和当前时刻第一输入状态;根据所述第一动作和第一奖励函数获取第一奖励值和下一时刻第一输入状态;以及根据当前时刻第一输入状态、第一动作、第一奖励值和下一时刻的输入状态更新所述初始深度强化网络模型的权重值。6.根据权利要求5所述的方法,其特征在于,所述第一奖励函数为:其中,r1为第一奖励值,...

【专利技术属性】
技术研发人员:孙一凫陈毅兴吴若飒沈启孟芦陈海阳
申请(专利权)人:北京上格云技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1