【技术实现步骤摘要】
基于迁移强化学习的空调系统冷却塔能耗优化方法
[0001]本专利技术涉及空调系统优化领域,具体涉及一种基于迁移强化学习的空调系统冷却塔能耗优化方法。
技术介绍
[0002]当前基于强化学习的空调系统优化控制方法,大部分都是针对单一系统进行研究,对同一场景不同系统做优化控制时,也常要从零开始设计、学习、优化,降低了效率。以上技术未考虑利用系统之间的相似性,若实施适当的迁移学习,这将充分利用已训练智能体的经验,来引导新智能体对新系统的学习。
技术实现思路
[0003]为克服上述现有技术的不足,本专利技术提供一种基于迁移强化学习的空调控制系统冷却塔优能耗化方法。旨在解决现有的方法中无法利用成熟的、已训练的智能体的经验,导致学习效率低的问题。
[0004]为达到上述目的,本专利技术通过以下技术方案实现:
[0005]本专利技术提供一种基于迁移强化学习的空调控制系统冷却塔能耗优化方法,包括:
[0006]步骤S1:跟据当前时刻系统总冷冻负荷及冷机名义总功率计算冷机负荷率,与冷机开启台数构成系统状 ...
【技术保护点】
【技术特征摘要】
1.一种基于迁移强化学习的空调控制系统冷却塔能耗优化方法,其特征在于,包括:步骤S1:跟据当前时刻系统总冷冻负荷及冷机名义总功率,计算冷机负荷率与冷机开启台数构成系统状态;步骤S2:将所述系统状态作为输入,输入至训练后和新建的强化学习智能体中,且二者分别输出百分比动作和对应的动作值;步骤S3:根据百分比动作与冷却塔台数和其频率的可控范围,计算出具体冷却塔设置台数与设置频率,并作为控制动作输出;步骤S4:利用梯度赌博机算法,计算两个控制动作的置信度,公式如下:式中,π(a)是对a的置信度,a表示选择哪一种智能体的决定,H(a)为当前的偏好函数;步骤S5:根据置信度随机选取任一个控制动作,作为输出;步骤S6:当系统接收输出控制后,获取系统稳定后的能效值,与上一时刻的系统状态、百分比动作和当前系统状态组成一个样本,存入两个智能体的经验池中,供两个智能体使用深度Q学习方...
【专利技术属性】
技术研发人员:张智权,汪德龙,钱乔睿,李铮伟,
申请(专利权)人:上海碳索能源服务股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。