当前位置: 首页 > 专利查询>内蒙古电力集团有限责任公司内蒙古电力经济技术研究院分公司专利>正文

基于深度Q网络的数据中心空调系统优化控制方法、系统、存储介质及设备技术方案

技术编号：41204566 阅读：2 留言：0更新日期：2024-05-07 22:30

基于深度Q网络的数据中心空调系统优化控制方法、系统、存储介质及设备，属于数据中心空调系统控制技术领域。为了解决现有的数据中心空调系统的控制方法存在制冷资源的浪费、整体能耗高。本发明专利技术首先获取数据中心的监测数据，并将监测数据作为温度预测模型的输入，预测得到机柜出风温度；基于机柜出风温度结果，采用DQN网络实现数据中心空调系统的优化控制，DQN网络中，第k个控制周期的状态为上一时刻温度预测的机柜出风温度，动作为由空调送风温度、空调回风温度和冷冻水温度构成的向量，奖励由空调送风温度、空调回风温度、冷冻水温度达到目标温度三个奖励函数构成，在控制过程中选择具有最高Q值的动作作为当前时刻的控制动作。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于数据中心空调系统控制，具体涉及数据中心空调系统优化控制方法、系统、存储介质及设备。

技术介绍

1、经济的快速增长对自然环境造成了巨大压力，绿色低碳发展已成为全球发展的重要趋势，与社会、经济、政治等各个领域不断深化融合。数据中心是公认的高耗能行业，人工智能技术的快速发展需要海量的计算资源和能源支持。如今，研究工作的重点之一是将数据中心转变为绿色数据中心，以降低能源消耗。数据中心耗电设施包括it设备、制冷系统、不间断电源(ups)系统和其余基础设备。其中，it设备和制冷系统是最主要的耗电设施，因此，数据中心的高效设计和优化至关重要。

2、目前，大多数制冷系统采用的传统控制方式受制于控制板的接口容量，无法接入大量传感器，传感器的分布不能满足精确采集气流温度的要求，一般根据经验值来设置相关参数。此外，制冷机组中的控制器采用传统的控制算法，缺乏机器学习的智能性，无法达到精确控制的目的，造成制冷资源的浪费，增加了制冷系统的整体能耗；尤其是是在同一个数据中心机房内，多个制冷机组“各走各的路”，缺乏整体的智能化控制，更加剧了这种情况。

技术实现思路

1、本专利技术为了解决现有的数据中心空调系统的控制方法存在制冷资源的浪费、整体能耗高。

2、基于深度q网络的数据中心空调系统优化控制方法，首先获取数据中心的监测数据x1,...,xm，m为监测数据的类型数量；将监测数据作为温度预测模型patchtst的输入，预测得到机柜出风温度

3、基于机柜出风温度结果

4、状态空间：第k个控制周期的状态为上一时刻温度预测的机柜出风温度，即

5、dqn网络中的动作：第k个控制周期的动作a[k]＝[tsup[k]，vsup[k]，tchw[k]]；其中，tsup[k]、vsup[k]、tchw[k]分别为时间步长为k处的空调送风温度、空调回风温度和冷冻水温度；

6、dqn网络中的奖励函数：第k个控制周期的奖励如下

7、rtotal[k]＝racstemp[k]+racrtemp[k]+rfwtemp[k]

8、racstemp[k]＝αacstemp(racscur[k]-racstar[k])

9、racrtemp[k]＝αacrtemp(racrcur[k]-racrtar[k])

10、rfwtemp[k]＝αfwtemp(rfwcur[k]-rfwtar[k])

11、其中，racstemp[k]、racrtemp[k]、rfwtemp[k]分别是空调送风温度、空调回风温度、冷冻水温度达到目标温度时的奖励函数，racscur[k]、racrcur[k]、rfwcur[k]分别是当前的数据中心空调送风温度、空调回风温度、冷冻水温度，racstar[k]、racrtar[k]、rfwtar[k]是设定的空调送风温度、空调回风温度、冷冻水温度，αacstemp、αacrtemp、αfwtemp是对应的目标奖励系数；

12、所述dqn网络包括一个目标q网络和一个当前q网络，即target q-network和online q-network；当前q网络用于评估当前状态-动作的函数，即q函数；目标q网络用来计算最大q值；当前q网络的输出表示为q(s,a|θ)，s、a和θ分别表示为状态、动作和网络参数；目标q网络输出的最大值表示为maxa′q(s′,a′|θ～)；建立q函数的深度神经网络将状态映射到每个可能动作的q值；q值表示在给定状态下采取某个动作的预期累积奖励；dqn网络使用经验回放机制来存储和重用先前的经验；

13、采用dqn网络实现数据中心空调系统的优化控制的过程中，dqn网络选择具有最高q值的动作作为当前时刻的控制动作。

14、进一步地，建立q函数的深度神经网络采用三个隐藏层，每个隐藏层均有128个神经元，隐藏层之间使用relu非线性激活函数。

15、进一步地，所述的监测数据包括冷通道温度、热通道温度、机柜负载、冷却功耗、it功耗以及机柜平均出风温度。

16、进一步地，述机柜平均出风温度如下：

17、

18、其中，ti′是第i′个机柜的温度；hi′是第i′个机柜的散热负荷；n是机柜的数量。

19、基于深度q网络的数据中心空调系统优化控制系统，包括：

20、监测数据获取单元：获取数据中心的监测数据x1,...,xm，m为监测数据的类型数量；

21、机柜出风温度预测单元：将监测数据作为温度预测模型patchtst的输入，利用patchtst预测得到机柜出风温度

22、dqn网络控制单元：基于机柜出风温度结果采用dqn网络实现数据中心空调系统的优化控制，所述的dqn网络如下：

23、状态空间：第k个控制周期的状态为上一时刻温度预测的机柜出风温度，即

24、dqn网络中的动作：第k个控制周期的动作a[k]＝[tsup[k]，vsup[k]，tchw[k]]；其中，tsup[k]、vsup[k]、tchw[k]分别为时间步长为k处的空调送风温度、空调回风温度和冷冻水温度；

25、dqn网络中的奖励函数：第k个控制周期的奖励如下

26、rtotal[k]＝racstemp[k]+racrtemp[k]+rfwtemp[k]

27、racstemp[k]＝αacstemp(racscur[k]-racstar[k])

28、racrtemp[k]＝αacrtemp(racrcur[k]-racrtar[k])

29、rfwtemp[k]＝αfwtemp(rfwcur[k]-rfwtar[k])

30、其中，racstemp[k]、racrtemp[k]、rfwtemp[k]分别是空调送风温度、空调回风温度、冷冻水温度达到目标温度时的奖励函数，racscur[k]、racrcur[k]、rfwcur[k]分别是当前的数据中心空调送风温度、空调回风温度、冷冻水温度，racstar[k]、racrtar[k]、rfwtar[k]是设定的空调送风温度、空调回风温度、冷冻水温度，αacstemp、αacrtemp、αfwtemp是对应的目标奖励系数；

31、所述dqn网络包括一个目标q网络和一个当前q网络，即target q-network和online q-network；当前q网络用于评估当前状态-动作的函数，即q函数；目标q网络用来计算最大q值；当前q网络的输出表示为q(s,a|θ)，s、a和θ分别表示为状态、动作和网络参数；目标q网络输出的最大值表示为maxa′q(s′,a′|θ～)；建立q函数的深度神经网络将状态映射到每个可能动作的q值；q值表示在给定状态下采取某个动作的预期累积奖励；dqn网络使用经验回放机制来存储和本文档来自技高网...

【技术保护点】

1.基于深度Q网络的数据中心空调系统优化控制方法，其特征在于，首先获取数据中心的监测数据x1,...,xM，M为监测数据的类型数量；将监测数据作为温度预测模型PatchTST的输入，预测得到机柜出风温度

2.根据权利要求1所述的基于深度Q网络的数据中心空调系统优化控制方法，其特征在于，建立Q函数的深度神经网络采用三个隐藏层，每个隐藏层均有128个神经元，隐藏层之间使用ReLU非线性激活函数。

3.根据权利要求1或2所述的基于深度Q网络的数据中心空调系统优化控制方法，其特征在于，所述的监测数据包括冷通道温度、热通道温度、机柜负载、冷却功耗、IT功耗以及机柜平均出风温度。

4.根据权利要求3所述的基于深度Q网络的数据中心空调系统优化控制方法，其特征在于，所述机柜平均出风温度如下：

5.基于深度Q网络的数据中心空调系统优化控制系统，其特征在于，包括：

6.根据权利要求5所述的基于深度Q网络的数据中心空调系统优化控制系统，其特征在于，建立Q函数的深度神经网络采用三个隐藏层，每个隐藏层均有128个神经元，隐藏层之间使用ReLU非线性激活函数。

7.根据权利要求5或6所述的基于深度Q网络的数据中心空调系统优化控制系统，其特征在于，所述的监测数据包括冷通道温度、热通道温度、机柜负载、冷却功耗、IT功耗以及机柜平均出风温度。

8.根据权利要求7所述的基于深度Q网络的数据中心空调系统优化控制系统，其特征在于，所述机柜平均出风温度计算方式如下：

9.一种计算机存储介质，其特征在于，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并运行如权利要求5至8任意一项所述的基于深度Q网络的数据中心空调系统优化控制系统。

10.一种基于深度Q网络的数据中心空调系统优化控制设备，其特征在于，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由处理器加载并运行如权利要求5至8任意一项所述的一种基于深度Q网络的数据中心空调系统优化控制系统。

...

【技术特征摘要】

1.基于深度q网络的数据中心空调系统优化控制方法，其特征在于，首先获取数据中心的监测数据x1,...,xm，m为监测数据的类型数量；将监测数据作为温度预测模型patchtst的输入，预测得到机柜出风温度

2.根据权利要求1所述的基于深度q网络的数据中心空调系统优化控制方法，其特征在于，建立q函数的深度神经网络采用三个隐藏层，每个隐藏层均有128个神经元，隐藏层之间使用relu非线性激活函数。

3.根据权利要求1或2所述的基于深度q网络的数据中心空调系统优化控制方法，其特征在于，所述的监测数据包括冷通道温度、热通道温度、机柜负载、冷却功耗、it功耗以及机柜平均出风温度。

4.根据权利要求3所述的基于深度q网络的数据中心空调系统优化控制方法，其特征在于，所述机柜平均出风温度如下：

5.基于深度q网络的数据中心空调系统优化控制系统，其特征在于，包括：

6.根据权利要求5所述的基于深度q网络的数据中心空调系统优化控制系统，其特...

【专利技术属性】
技术研发人员：杨希斌，王伟，靳博，王旭，王芳，李晨霞，
申请(专利权)人：内蒙古电力集团有限责任公司内蒙古电力经济技术研究院分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人