当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于随机概率加权复合采样策略的暖通空调控制方法技术

技术编号:42803114 阅读:25 留言:0更新日期:2024-09-24 20:48
本发明专利技术属于暖通空调领域,提出了一种基于随机概率加权复合采样策略的暖通空调控制方法,工作流程下:步骤101,构建并初始化智能体,将初始探索率设为1;步骤102,获取当前暖通空调系统的状态,判断当前探索率是否小于开始采用概率加权采样的设定值;步骤103,使用随机概率加权复合采样策略选择动作;步骤104,执行动作对应的控制指令,更新Q表;步骤105,随训练设定周期减小探索率;步骤106,判断智能体训练是否达到结束标准,若未达到则继续训练,否则将状态参数输入训练好的智能体中。本方法能够有效改善暖通空调系统的性能、降低运行成本、增强系统的稳定性,具有一定应用前景。

【技术实现步骤摘要】

本专利技术涉及供热、供燃气、通风及空调工程,为建筑设备控制技术,具体为一种基于随机概率加权复合采样策略的q-learning算法暖通空调节能控制方法。


技术介绍

1、现有技术简介:目前暖通空调系统采用q-learning优化控制时的动作选择通常采取蒙特卡洛采样策略,是一种基于随机性的探索与利用的平衡方法。该采样方法通过从环境状态的不同动作中进行随机选择来进行探索,在训练初期,代理程序会以一定的概率随机选择动作;随着训练的进行,探索率逐渐减小,代理程序更加倾向于根据训练经验进行动作选择。这种动作采样可以在训练初期进行广泛的探索,以发现更多的状态-动作对,并逐渐减小探索率,使得在训练后期更加侧重于利用已学到的知识。

2、现有技术问题:传统的暖通空调系统控制方法通常基于蒙特卡洛动作采样在q-learning中通过随机选择动作来进行探索,无法适应系统的动态变化和复杂性。随机选择动作可能导致控制策略不稳定,不适合当前的系统状态,同时也无法充分利用历史训练数据中动作的经验信息,可能导致在训练过程中重复选择不良动作或忽略已知的优秀动作;在训练后期,蒙特卡洛采本文档来自技高网...

【技术保护点】

1.一种基于随机概率加权复合采样策略的暖通空调控制方法,其特征在于,工作流程下:

2.如权利要求1所述一种基于随机概率加权复合采样策略的暖通空调控制方法,其特征在于,步骤S101中,智能体的构造方法如下:

3.如权利要求1所述一种基于随机概率加权复合采样策略的暖通空调控制方法,其特征在于,步骤S101中,智能体初始化方法如下:

4.如权利要求1所述一种基于随机概率加权复合采样策略的暖通空调控制方法,其特征在于,步骤S103中,所述随机概率加权复合采样策略具体如下:

5.如权利要求4所述一种基于随机概率加权复合采样策略的暖通空调控制方法,其特...

【技术特征摘要】

1.一种基于随机概率加权复合采样策略的暖通空调控制方法,其特征在于,工作流程下:

2.如权利要求1所述一种基于随机概率加权复合采样策略的暖通空调控制方法,其特征在于,步骤s101中,智能体的构造方法如下:

3.如权利要求1所述一种基于随机概率加权复合采样策略的暖通空调控制方法,其特征在于,步骤s...

【专利技术属性】
技术研发人员:陈文嘉毛晨楠李铮伟
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1