一种用于日前市场优化调度的系统及方法技术方案

技术编号：40661998 阅读：3 留言：0更新日期：2024-03-18 18:55

本发明专利技术公开一种用于日前市场优化调度的系统，其包括环境组件、第一优化组件以及多个并行的第二优化组件。其中环境组件用于基于输入的储能系统的充电、放电功率以及约束参数计算收益并更新状态。第一优化组件基于第二优化组件的累计本地梯度更新第一、第二优化组件参数。第二优化组件基于奖励及更新后的状态确定累计本地梯度。第二优化组件的结构与第一优化组件相同，包括策略模块以及评估模块。其中策略模块用于根据状态确定动作，评估模块用于计算优势函数以更新策略模块，且策略模块及评估模块均包括残差结构。该系统可在储能系统的连续动作空间中寻找到最优的申报策略，实现最优充、放电功率的调度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及储能调度，特别涉及一种用于日前市场优化调度的系统及方法。

技术介绍

1、随着能源结构转型、以及诸如风力发电和太阳能发电等可再生能源的快速普及和发展，输出电量的不稳定性成为电力系统调度的一个挑战。储能系统作为一种调度资源，其一方面可以作为动态的电力储备，解决可再生能源的不确定性和间歇性给电力系统带来的挑战，另一方面还可以优化电力负荷曲线、平衡供应和需求之间的差距、减少电力系统的闲置和过载，从而提高电力系统的稳定性和可靠性。此外，储能系统还可以作为一种柔性资源参与电力现货市场调度，从而增加市场竞争，提高市场运行效率，为市场提供更多的能源选择，进而推动电力定价的合理性，保障市场的公正和透明性。

2、传统的储能调度优化模型通常需要依赖准确的环境模型和参数，例如系统的动力学模型、变量的约束条件等。在复杂的实际情况下，获取准确的环境模型往往是困难的，模型的不确定性可能导致调度结果的不准确性。同时传统的储能调度优化模型无法灵活地应对动态环境，如事先制定好的固定规则和参数不能及时适应环境的变化，再加上会受到大量人工的干预，因此其很难在不断变化的电力市场环境中学习并做出最优的调度决策，最终的效果往往会出现效率低下，且结果不准确的问题。

3、具体而言，现有的电力市场中的储能调度优化模型主要包括枚举法、数学优化算法与智能优化算法。其中枚举法也称为穷举法，是一种通过枚举所有可能情况来解决问题的方法。这种方法通常应用于问题规模较小或者可能的解决方案数量有限的情况。枚举法的基本思想是通过一个循环遍历所有可能的解，然后根

技术实现思路

1、针对现有技术中的部分或全部问题，本专利技术第一方面提供用于日前市场优化调度的系统，其通过引入强化学习算法中的异步优势动作评价算法(asynchronous advantageactor-critic，a3c)模型，结合策略学习以及值函数学习两种学习方式有效地调整储能系统的状态，从而实现自适应调度和优化控制，以合理利用资源、助力节能减排，所述系统包括：

2、环境组件(environment)，其包括约束参数，所述环境组件用于基于输入的动作(action)以及所述约束参数计算奖励(reward)并更新状态，其中所述动作包括储能系统的充电、放电功率，以及所述奖励包括储能系统收益；

3、第一优化组件，其用于基于第二优化组件发送的累计本地梯度更新组件参数，并同步至各第二优化组件，所述第一优化组件包括第一策略模块(actor)以及第一评估模块(critic)；

4、多个并行的第二优化组件，其中每个第二优化组件与所述第一优化组件可通信地连接，以将基于奖励及更新后的状态确定得到的累计本地梯度发送至所述第一优化组件，且每个第二优化组件的结构与所述第一优化组件相同，包括：

5、第二策略模块，其用于根据所述环境组件提供的状态(state)确定动作(action)，其中所述第二策略模块包括残差结构；以及

6、第二评估模块，其用于基于所述奖励(reward)及更新的状态确定优势函数(advantage)，并反馈至第二策略模块以更新所述第二策略模块，其中所述第二评估模块包括残差结构。

7、进一步地，所述环境组件的数量与所述第二优化组件相同。

8、进一步地，所述约束参数包括储能系统的最大能量值(state of charge，soc)、最小能量值、起始能量值、结束能量值、充电效率、放电效率、额定容量、充放电的最大功率值、充放电的最小功率值、储能系统进行满功率放电的时刻、输配电价、政府基金及附加、每日24个时刻点的日前出清价格、以及补偿价格。

9、进一步地，所述系统的初始化状态为一维列表，所述一维列表包括时刻t及所述时刻t对应的储能系统的能量状态。

10、进一步地，所述第一优化组件采用过往充、放电时刻出现的频率作为权重来更新所述组件参数。

11、基于如前所述的用于日前市场优化调度的系统，本专利技术第二方面提供一种用于日前市场优化调度的方法，包括：

12、确定环境组件的约束参数，其中所述环境组件包括n个相同的环境组件，n为电脑cpu的最大线程数；

13、构建并初始化优化组件，其中所述优化组件包括一个第一优化组件以及n个第二优化组件，所述n个第二优化组件与n个环境组件一一对应；

14、每个第二优化组件根据初始状态确定动作，并分别发送至与其对应的环境组件；

15、所述环境组件根据所述动作更新状态，并计算奖励值发送至第二优化组件；

16、所述第二优化组件更新累计本地梯度发送至所述第一优化组件，同时计算优势函数以更新策略模块；

17、所述第一优化组件根据各第二优化组件发送的累计本地梯度，更新组件参数并下发至所述第二优化组件；

18、基于更新后的参数更新所述第一优化组件及第二优化组件，并重复如前所述的动作确定至组件更新的本文档来自技高网...

【技术保护点】

1.一种用于日前市场优化调度的系统，其特征在于，包括

2.如权利要求1所述的系统，其特征在于，所述环境组件的数量与所述第二优化组件相同。

3.如权利要求1所述的系统，其特征在于，所述约束参数包括储能系统的最大能量值、最小能量值、起始能量值、结束能量值、充电效率、放电效率、额定容量、充放电的最大功率值、充放电的最小功率值、储能系统进行满功率放电的时刻、输配电价、政府基金及附加、每日24个时刻点的日前出清价格、以及补偿价格。

4.如权利要求1所述的系统，其特征在于，所述系统的初始化状态包括一维列表，所述一维列表包括时刻t及所述时刻t对应的储能系统的能量状态。

5.如权利要求1所述的系统，其特征在于，所述第一优化组件采用过往充、放电时刻出现的频率作为权重来更新所述组件参数。

6.一种用于日前市场优化调度的方法，其特征在于，采用如权利要求1至5任一所述的系统进行日前市场优化调度，所述方法包括步骤：

7.如权利要求6所述的方法，其特征在于，所述时刻t对应的储能系统的能量状态根据所述储能系统的t时刻的能量值与额定容量计算得到。

8.如权利要求6所述的方法，其特征在于，所述动作包括多个连续时刻的储能系统的充、放电功率值，其中所述充、放电功率值的精度为0.01。

9.如权利要求6所述的方法，其特征在于，所述奖励值根据如下公式计算得到：

10.如权利要求6所述的方法，其特征在于，所述迭代结束要求包括迭代次数达到预设值。

11.一种用于日前市场优化调度的电子设备，其特征在于，包括存储器以及处理器，其中所述存储器被配置为存储计算机程序，所述计算机程序在所述处理器运行时执行如权利要求1至10任一所述的日前市场优化调度的方法。

...

【技术特征摘要】

1.一种用于日前市场优化调度的系统，其特征在于，包括

2.如权利要求1所述的系统，其特征在于，所述环境组件的数量与所述第二优化组件相同。

4.如权利要求1所述的系统，其特征在于，所述系统的初始化状态包括一维列表，所述一维列表包括时刻t及所述时刻t对应的储能系统的能量状态。

5.如权利要求1所述的系统，其特征在于，所述第一优化组件采用过往充、放电时刻出现的频率作为权重来更新所述组件参数。

6.一种用于日前市场优化调度的方法...

【专利技术属性】
技术研发人员：沈山山，谭江浩，罗益军，徐峰，李志勇，石良君，
申请(专利权)人：广州汇电云联数科能源有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人