一种基于交互式模仿学习的微电网能源管理实时调度方法技术

技术编号：40776222 阅读：6 留言：0更新日期：2024-03-25 20:22

本发明专利技术公开了一种基于交互式模仿学习的微电网能源管理实时调度方法，涉及微电网调度技术领域，包括以下步骤：构建微电网深度策略神经网络以及交互仿真环境；将深度策略神经网络与交互仿真环境进行交互；通过数学规划求解器对数学规划模型进行求解，得到当前时刻的最优动作；对当前观测状态和当前时刻的最优动作进行采样，得到最优动作数据集；通过最优动作数据集对深度策略神经网络进行训练；将最优深度策略神经网络部署至微电网能源管理系统，对微电网实时能源管理进行调度。本发明专利技术采用交互式的模仿学习方法，能够使训练与测试过程中的状态数据分布匹配，减少复合误差问题。利用数学规划求解器生成大量最优动作数据，具有很高的数据利用效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及微电网调度，特别是涉及一种基于交互式模仿学习的微电网能源管理实时调度方法。

技术介绍

1、随着微电网和可持续能源的发展，分布式光伏、风力发电的渗透率不断提高，储能系统成为可持续微电网不可或缺的能源组件，在平抑新能源发电波动、削峰填谷、需求侧响应等任务中发挥着重要作用。另外，在建筑微电网中，空调系统的能源消耗占据了总能源消耗的可观比例。基于物联网技术和智能电表技术的发展，为了提高可再生能源发电利用率，减少微电网从主电网输入电能的电费支出，同时保证微电网中用户舒适度，需要对微电网进行能源管理，对储能系统的充放电和可控负荷的功率进行实时优化控制。

2、可再生能源发电、用电负荷、实时电价、环境温度的不确定性为微电网储能系统和空调系统的实时优化调度带来了巨大的挑战。现有方法中，基于预测的日前调度方法需要对未来的不确定性因素进行预测，基于预测信息进行日前的优化问题求解，进行日前的能源管理安排，如s.aslam等人在文献“towards efficient energy management in smartgrids considering microgrids with day-ahead energy forecasting”(electricpower systems research，2020)中提出的方法，此类方法面临预测精度差、控制策略固定的问题，难以满足实时调度的要求且难以应对未知的不确定性扰动。采用模型预测控制的方法需要基于系统的模型和对未来的预测信息，在每一个时间步进行预测和优化求解，并采取当前时

3、综上，现有的微电网实时能源管理方法存在着因训练与测试状态数据不匹配，导致出现复合误差，而且数据利用效率低的问题。

技术实现思路

1、本专利技术提供了一种基于交互式模仿学习的微电网能源管理实时调度方法，解决了现有的微电网实时能源管理方法需要额外预测器，训练与测试状态数据不匹配导致复合误差，而且数据利用效率低的问题。

2、本专利技术提供一种基于交互式模仿学习的微电网能源管理实时调度方法，包括以下步骤：

3、构建微电网各能源部件的数学模型以及交互仿真环境；

4、根据微电网各能源部件的数学模型以及能源管理任务构建数学规划模型；

5、基于微电网的历史数据构建深度策略神经网络，并获取当前时刻的观测状态；

6、将深度策略神经网络与交互仿真环境进行交互，在交互过程中通过数学规划求解器对数学规划模型进行求解，得到当前时刻的最优动作；

7、对当前时刻的观测状态和当前时刻的最优动作进行采样，得到最优动作数据集；

8、通过最优动作数据集对深度策略神经网络进行训练；

9、对上述交互、采样以及训练过程进行下一时刻的循环，并对循环后的深度策略神经网络进行验证，得到最优深度策略神经网络；

10、将最优深度策略神经网络部署至微电网能源管理系统中，作为智能控制模块对微电网实时能源管理进行调度。

11、优选的，所述微电网各能源部件的数学模型如下：

12、所述微电网各能源部件包括分布式可再生能源发电、储能系统、可控负荷、不可控负荷以及主电网；

13、储能系统能量状态的动力学方程如下所示：

14、ebess(t+1)＝ebess(t)+scdpch(t)δtηch-(1-scd)pdis(t)δt/ηdis

15、其中，

16、

17、式中，ebess(t+1)是储能系统在t+1时刻的能量状态，ebess(t)是储能系统在t时刻的能量状态，δt是时间间隔，ηch与ηdis分别是充、放电效率，scd是一个二元状态变量，用于指示储能系统的充、放电模式，pch(t)是t时刻的充电功率，pdis(t)是t时刻的放电功率；

18、储能系统功率如下所示：

19、pbess(t)＝pch(t)-pdis(t)

20、式中，pbess(t)是储能系统功率；

21、储能系统的能量状态与充、放电功率均受到上下限物理约束：

22、

23、

24、

25、式中，是储能系统的最小能量状态，是储能系统的最大能量状态，是最大充电功率，是最大放电功率；

26、室内温度的一阶近似热力学方程如下所示：

27、tin(t+1)＝∈tin(t)+(1-∈)[tout(t)+shc(t)ph(t)ηhr-(1-shc(t))pc(t)ηcr]

28、其中，

29、

30、式中，tin(t+1)是t+1时刻的室内温度，tin(t)是t时刻的室内温度，∈是系统内在参数，r是系统的热阻，ηh与ηc分别是空调系统的制热、制冷效率，shc是一个二元变量，用于指示空调系统的制冷、制热模式，tout(t)是环境温度，pc(t)是空调系统制冷功率，ph(t)是空调系统制热功率；

31、空调系统功率如下所示：

32、phvac(t)＝ph(t)+pc(t)

33、式中，phvac(t)空调系统的功率；

34、空调系统的制冷、制热功率需要满足上下限物理约束：

35、

36、

37、式中，是最大制热功率，是最大制冷功率；

本文档来自技高网...

【技术保护点】

1.一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，所述微电网各能源部件的数学模型如下：

3.如权利要求1所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，所述数学规划模型的优化目标为最小化当前时间间隔的电费支出以及用户的舒适度损失，其数学表示如下所示：

4.如权利要求3所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，当前时间间隔的电费支出如下所示：

5.如权利要求2所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，所述当前时刻的观测状态包括过去24小时的不可控用电负荷序列、分布式可再生能源发电功率序列、实时电价序列和环境温度序列以及当前时刻的用电负荷、分布式可再生能源发电、实时电价、环境温度、储能系统能量状态和微网建筑的室内温度。

6.如权利要求5所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，所述深度策略神经网络的输入

7.如权利要求6所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，将深度策略神经网络与交互仿真环境进行交互，包括以下步骤：

8.如权利要求7所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，在交互过程中通过数学规划求解器对数学规划模型进行求解，得到当前时刻的最优动作，包括以下步骤：

9.如权利要求1所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，通过最优动作数据集对深度策略神经网络进行训练，包括以下步骤：

...

【技术特征摘要】

1.一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，所述微电网各能源部件的数学模型如下：

4.如权利要求3所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，当前时间间隔的电费支出如下所示：

5.如权利要求2所述的一种基于交互式模仿学习的微电网能源管理实时调度方法，其特征在于，所述当前时刻的观测状态包括过去24小时的不可控用电负荷序列、分布式可再生能源发电功率序列、实时电价序列和环境温度序列以及当前时刻的用电负荷、分布式可再生能源发电、实时电价、环境温度、储能系...

【专利技术属性】
技术研发人员：司刚全，巩甲辉，丁志强，曲凯，王倩月，山子涵，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人