一种基于强化学习的末端精密空调优化控制方法及系统技术方案

技术编号：28476635 阅读：63 留言：0更新日期：2021-05-15 21:45

本发明专利技术提出了一种基于强化学习的末端精密空调优化控制方法及系统，涉及机房空调控制领域。一种基于强化学习的末端精密空调优化控制方法包括：获取预设时间内数据中心机房设备样本数据，根据获取到的样本数据，提取子样本序列集合；通过样本数据构建热负载和制冷设备之间的关系模型，生成热平衡方程；根据子样本序列集合，利用EM算法对热平衡方程进行求解得到系统热平衡的作用系数；定义优化目标函数，并利用强化学习方法求解空调的控制参数。此外本发明专利技术还提出了一种基于强化学习的末端精密空调优化控制系统，包括：数据收集及子样本序列提取模块、热平衡方程生成模块、热平衡方程求解模块以及优化目标函数定义及空调控制参数求解模块。数求解模块。数求解模块。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习的末端精密空调优化控制方法及系统

[0001]本专利技术涉及机房空调控制领域，具体而言，涉及一种基于强化学习的末端精密空调优化控制方法及系统。

技术介绍

[0002]数据中心机房需要借助精密空调将温度控制在适当的范围内，才能保证服务器和存储器机架正常工作。精密空调是指能够充分满足机房环境条件要求的机房专用精密空调机，精密空调系统的设计是为了使机房温度保持在适宜的区间内，并且具有高可靠性、可维修性、组装灵活性和冗余性，可以保证空调在一年四季都可正常运行。
[0003]现有技术主要通过空调自身的PID控制来调整输出以更好的控制环境温度。一般的，是根据回风道温感温度来结合PID参数，对于风机和水阀的参数进行控制，主要存在以下几点问题：（1）PID控制存在滞后性，对冷热点响应慢，无法及时根据机房温度变化对空调进行调整；（2）PID控制只是基于单一测温点进行控制，没有考虑机房全局情况，难以达到预期调控效果；（3）PID参数需要人频范调整，且为了预留一定的波动空间，通常对于风量和冷冻水存在着过量使用的情况，造成了能源的浪费。

技术实现思路

[0004]本专利技术的目的在于提供一种基于强化学习的末端精密空调优化控制方法，其能够根据求解到空调的控制参数对末端精密空调进行优化控制，避免人工干预，实现自动化控制，保障机房设备正常运行的同时最大限度的降低空调能耗，满足数据中心运营要求。
[0005]本专利技术的另一目的在于提供一种基于强化学习的末端精密空调优化控制系统，其能够运行一种基于强化...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的末端精密空调优化控制方法，其特征在于，包括：获取预设时间内数据中心机房设备样本数据，根据获取到的样本数据，提取子样本序列集合；通过样本数据构建热负载和制冷设备之间的关系模型，生成热平衡方程；根据子样本序列集合，利用EM算法对热平衡方程进行求解得到系统热平衡的作用系数；定义优化目标函数，并利用强化学习方法求解空调的控制参数。2.如权利要求1所述的一种基于强化学习的末端精密空调优化控制方法，其特征在于，所述获取预设时间内数据中心机房设备样本数据的方法包括以下步骤：通过传感器获取预设时间内数据中心机房设备的设备控制参数和温度数据。3.如权利要求1所述的一种基于强化学习的末端精密空调优化控制方法，其特征在于，所述根据获取到的样本数据，提取子样本序列集合方法包括以下步骤：根据获取到的样本数据，取每个时刻向前预设时间段内的数据，生成子样本序列集合。4.如权利要求1所述的一种基于强化学习的末端精密空调优化控制方法，其特征在于，所述热平衡方程表达式包括：其中，t表示当前时刻；x表示发热设备，如机柜等的发热情况；u表示制冷设备的制冷情况；A
k
、B
k
分别表示过去T时间段内的各个时刻发热设备、制冷设备对于系统热平衡的作用系数；X
t
表示当前时刻机房内热量变化情况，即表示当前时刻机房内热量变化是过去T时间段内制冷系统与发热设备共同作用的结果。5.如权利要求1所述的一种基于强化学习的末端精密空调优化控制方法，其特征在于，所述根据子样本序列集合，利用EM算法对热平衡方程进行求解得到系统热平衡的作用系数包括以下步骤：核心似然函数定义如下其中，p表示概率，l表示似然函数，θ为待求解的A
k
、B
k
（1≤k≤T），y、z分别表示相对T时间段内的第k个时刻的发热或制冷设备对应的设备控制参数、设备温度；N为第N个子样本序列。6.如权利要求1所述的一种基...

【专利技术属性】
技术研发人员：杨鹏，杨波，
申请(专利权)人：南京群顶科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人