基于迁移强化学习的空调系统冷却塔能耗优化方法技术方案

技术编号：37983025 阅读：26 留言：0更新日期：2023-06-30 09:57

一种基于迁移强化学习的空调系统冷却塔能耗优化方法，以系统冷冻负荷和冷机开启台数为系统状态输入，以对冷却塔台数以及其频率为控制动作输出；使用现有已训练的强化学习智能体，引导其他空调系统冷却塔的优化；该引导通过对比已训练的强化学习智能体和新建强化学习智能体对动作值的预测准确性，分配不同的置信度给两个智能体，再根据置信度随机选择模型输出控制动作，并将形成的样本供两个智能体学习，以完成已训练智能体在新建智能体上的迁移。本发明专利技术在上线控制系统后立即根据每个时刻的冷冻负荷以及室外湿球温度控制冷却塔立即得到合适的出塔水温，以调节冷机、冷却塔能耗，很快达到节能目的。很快达到节能目的。很快达到节能目的。

全部详细技术资料下载

【技术实现步骤摘要】
基于迁移强化学习的空调系统冷却塔能耗优化方法

[0001]本专利技术涉及空调系统优化领域，具体涉及一种基于迁移强化学习的空调系统冷却塔能耗优化方法。

技术介绍

[0002]当前基于强化学习的空调系统优化控制方法，大部分都是针对单一系统进行研究，对同一场景不同系统做优化控制时，也常要从零开始设计、学习、优化，降低了效率。以上技术未考虑利用系统之间的相似性，若实施适当的迁移学习，这将充分利用已训练智能体的经验，来引导新智能体对新系统的学习。

技术实现思路

[0003]为克服上述现有技术的不足，本专利技术提供一种基于迁移强化学习的空调控制系统冷却塔优能耗化方法。旨在解决现有的方法中无法利用成熟的、已训练的智能体的经验，导致学习效率低的问题。
[0004]为达到上述目的，本专利技术通过以下技术方案实现：
[0005]本专利技术提供一种基于迁移强化学习的空调控制系统冷却塔能耗优化方法，包括：
[0006]步骤S1：跟据当前时刻系统总冷冻负荷及冷机名义总功率计算冷机负荷率，与冷机开启台数构成系统状态；
[00本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于迁移强化学习的空调控制系统冷却塔能耗优化方法，其特征在于，包括：步骤S1：跟据当前时刻系统总冷冻负荷及冷机名义总功率，计算冷机负荷率与冷机开启台数构成系统状态；步骤S2：将所述系统状态作为输入，输入至训练后和新建的强化学习智能体中，且二者分别输出百分比动作和对应的动作值；步骤S3：根据百分比动作与冷却塔台数和其频率的可控范围，计算出具体冷却塔设置台数与设置频率，并作为控制动作输出；步骤S4：利用梯度赌博机算法，计算两个控制动作的置信度，公式如下：式中，π(a)是对a的置信度，a表示选择哪一种智能体的决定，H(a)为当前的偏好函数；步骤S5：根据置信度随机选取任一个控制动作，作为输出；步骤S6：当系统接收输出控制后，获取系统稳定后的能效值，与上一时刻的系统状态、百分比动作和当前系统状态组成一个样本，存入两个智能体的经验池中，供两个智能体使用深度Q学习方...

【专利技术属性】
技术研发人员：张智权，汪德龙，钱乔睿，李铮伟，
申请(专利权)人：上海碳索能源服务股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人