基于改进强化学习算法的公共建筑供能系统调度方法技术方案

技术编号：44511275 阅读：20 留言：0更新日期：2025-03-07 13:07

本发明专利技术公开了一种基于改进强化学习算法的公共建筑供能系统调度方法，解决了现有技术的不足，包括以下步骤：步骤1，定义公共建筑供能系统的能量管理系统为智能体，公共建筑供能系统中的可控单元的动作输出构成智能体的动作空间；步骤2，将动作空间划分为内外两层，通过强化学习算法模型直接输出外层动作，通过二次规划算法模型计算内层动作；步骤3，将外层动作和内层动作组合作为智能体在时刻t的动作，能量管理系统根据动作对公共建筑供能系统中的各个子系统进行能量调度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及综合能源系统，尤其是指基于改进强化学习算法的公共建筑供能系统调度方法。

技术介绍

1、随着分布式新能源发电技术的快速发展，公共建筑供能系统中广泛配备了分布式新能源发电装置，这一方面提升了新能源的消纳率，同时也使得公共建筑供能系统由传统的能源消费者转变为能源产消者，公共建筑供能系统和主电网之间可以实现能量的双向流动，既可以从主电网中购买电能，也可以主动参与电力市场出售电能获取效益。

2、并网型公共建筑供能系统含有风电、光伏、柴油发电机、储能系统、电动汽车等多种可控设备，由于可控设备的多样化和复杂化，对于并网型公共建筑供能系统的调度方法中，强化学习的输出动作也越来越多，动作空间维度也随之增大，强化学习难以训练，导致并网型公共建筑供能系统的调度方法效率下降，经济收益也随之降低。

技术实现思路

1、本专利技术的目的是克服现有技术中的并网型公共建筑供能系统的调度方法中，强化学习的输出动作也越来越多，动作空间维度也随之增大，强化学习难以训练，导致并网型公共建筑供能系统的调度方...

【技术保护点】

1.基于改进强化学习算法的公共建筑供能系统调度方法，其特征是，包括以下步骤：

2.根据权利要求1所述的基于改进强化学习算法的公共建筑供能系统调度方法，其特征是，所述的动作空间表示如下：

3.根据权利要求2所述的基于改进强化学习算法的公共建筑供能系统调度方法，其特征是，所述的外层动作中，储能系统在时刻t的动作为离散动作，具体如下：

4.根据权利要求2或3所述的基于改进强化学习算法的公共建筑供能系统调度方法，其特征是，所述的二次规划算法模型具体如下：

5.根据权利要求4所述的基于改进强化学习算法的公共建筑供能系统调度方法，其特征是，所述的智能体...

【技术特征摘要】

1.基于改进强化学习算法的公共建筑供能系统调度方法，其特征是，包括以下步骤：

2.根据权利要求1所述的基于改进强化学习算法的公共建筑供能系统调度方法，其特征是，所述的动作空间表示如下：

4.根据权利要求2或3所述的基...

【专利技术属性】
技术研发人员：姚诚，单卡迪，马伟阳，贾冠青，朱海钦，朱斌清，朱俊宇，于家庆，姜国峰，黄恺，马军燕，
申请(专利权)人：浙江八达电子仪表有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人