基于强化学习和注意力机制的暖通空调节能减排方法及系统技术方案

技术编号:43317084 阅读:29 留言:0更新日期:2024-11-15 20:18
本方案公开了一种基于强化学习和注意力机制的暖通空调节能减排方法及系统,推理阶段包括B1.训练后的强化学习模型根据当前状态预测多个控制组合;B2.使用奖励函数选择前K个最高奖励的控制动作组合;B3.对所选的每个控制动作组合,预测执行该动作后的新状态;B4.对每个新状态预测新的控制动作组合,选择累积奖励最高的K个控制动作组合;B5.重复B3‑B4,直到找到最优的动作序列;B6.将累积奖励最高的动作序列作为最终决策。本方案利用强化学习进行暖通空调节能减排的控制,能够实现更精确的暖通控制,并且利用强化学习的环境学习能力使控制系统能够根据实时反馈自动调整控制策略以适应系统变化和外部条件的不确定性,从而不断提高系统贴合现实的控制能力。

【技术实现步骤摘要】

本专利技术属于暖通控制,尤其是涉及一种基于强化学习和注意力机制的暖通空调节能减排方法及系统


技术介绍

1、大型工业暖通空调能耗高,覆盖区域广,一年总能源账单普遍在上百万至千万量级。

2、传统的暖通空调控制系统多采用pid(比例-积分-微分)控制器,它是一种简单、成熟的控制方法,广泛应用于工业过程控制中,然而也存在着具诸多局限,如单一因素计算控制,依赖经验的粗放式调试,静态规则设定,震荡调试控制等。随着人工智能技术的发展,特别是机器学习算法的应用,暖通空调控制领域出现了许多创新方法,如,任春盛、乌日汗提出的“人工智能在暖通空调中的最新应用与展望”,美的提出的“绿色数智未来”都提及利用机器学习算法来实现暖通空调的节能减排控制。

3、但是,在暖通空调控制中,环境条件是在不断变化的,如室内外温湿度、占用率等,一般的机器学习算法难以适应不断变化的环境条件,从而导致控制效果不佳。而且,在暖通空调控制领域,我们是希望通过自动控制能够优化长期的能效和舒适度,一般的机器学习算法只能满足短期的控制效果,无法满足暖通空调控制的长期优化目标需求。为此,有本文档来自技高网...

【技术保护点】

1.一种基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,包括:

2.根据权利要求1所述的基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,当根据状态预测的控制动作组合中包含无动作的控制动作组合时,认为已找到最优的动作序列;

3.根据权利要求2所述的基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,推理阶段,在最终决策的最后一个动作执行完毕之前,重新执行步骤B1-B5做出下一阶段的最终决策;

4.根据权利要求1所述的基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,所述的历史数据为连续的s-a序列组合,包含了从状...

【技术特征摘要】

1.一种基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,包括:

2.根据权利要求1所述的基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,当根据状态预测的控制动作组合中包含无动作的控制动作组合时,认为已找到最优的动作序列;

3.根据权利要求2所述的基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,推理阶段,在最终决策的最后一个动作执行完毕之前,重新执行步骤b1-b5做出下一阶段的最终决策;

4.根据权利要求1所述的基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,所述的历史数据为连续的s-a序列组合,包含了从状态到动作再到新状态的状态转移信息,以使强化学习模型在训练过程中学习根据状态预测动作的能力,同时学习根据旧状态和执行动作预测新动作的能力;

5.根据权利要求1所述的基于强化学习和注意力机制的暖通空调节能减排方法,其特征在于,所述的状态s包括室内平均温度、室内平均湿度、送风温度、送风湿度、送风机电流频率;

6.根据权利...

【专利技术属性】
技术研发人员:徐叶琛吴永尚张玄远徐霄宇陈圣超季星佑乔方圆
申请(专利权)人:宁波草船科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1