基于深度强化学习的配电网智能体群协同调控方法及系统技术方案

技术编号：42688827 阅读：48 留言：0更新日期：2024-09-10 12:37

本发明专利技术提出了基于深度强化学习的配电网智能体群协同调控方法及系统，包括：在有源配电网中，将电网节点或者控制单元作为智能体；获取电网中不同智能体的实时状态信息，至少包括电压、电流、功率；基于实时状态信息，通过神经网络表示Q值函数来评估在给定智能电网状态下采取负载管理动作的预期累计奖励，其中，单个智能体通过最大化Q值函数获得最优能量分配策略；构建的马尔代夫网络通信模型，基于该通信模型多个智能体之间实现信息交换；由多个智能体组成的智能体群使用深度确定性策略梯度算法决策电网能量分配。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于配电网调控，尤其涉及基于深度强化学习的配电网智能体群协同调控方法及系统。

技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。

2、随着电力系统复杂性的不断增加，传统的单一智能体控制已经无法满足对系统的高效管理和稳定运行的需求，多智能体协同调控技术逐渐成为电力系统管理的关键手段。

3、通过多智能体之间的合作和协作，实现电力系统的智能化管理和优化控制。然而这样的系统主要依赖于人工规则制定和经验积累，在面对日益复杂的电力系统和快速变化的负荷需求时存在一些局限性。为了避免传统方法的局限性，人工智能依靠其自学习和自适应性等特点，被应用于多智能体协同调控中。

4、常见协同调控方法有分布式控制、博弈论方法、群体智能算法等方法。基于分布式控制策略的多智能体协同调控方法是将整个系统分解为多个子系统或智能体，并为每个子系统或智能体分配相应的控制任务。这些智能体根据各自的任务和角色，独立地进行控制和决策，通过通信或协作机制实现整体系统的协同调控。基于博弈论方法的多智能体...

【技术保护点】

1.基于深度强化学习的配电网智能体群协同调控方法，其特征是，包括：

2.如权利要求1所述的基于深度强化学习的配电网智能体群协同调控方法，其特征是，采用深度Q网络强化学习模型将电网中的实时状态信息存储到经验存储器内，从存储器中随机选择批量样本更新模型参数。

3.如权利要求1所述的基于深度强化学习的配电网智能体群协同调控方法，其特征是，所述深度Q网络强化学习模型使用单独的目标网络生成反映电网能量稳定的目标Q值，在学习过程中，模型采用延迟更新的方法，每C步将当前电网节点的实时状态值复制到目标网络中，用以更新目标节点的实时状态；

4.如权利要求1所述的基于深度...

【技术特征摘要】

1.基于深度强化学习的配电网智能体群协同调控方法，其特征是，包括：

2.如权利要求1所述的基于深度强化学习的配电网智能体群协同调控方法，其特征是，采用深度q网络强化学习模型将电网中的实时状态信息存储到经验存储器内，从存储器中随机选择批量样本更新模型参数。

3.如权利要求1所述的基于深度强化学习的配电网智能体群协同调控方法，其特征是，所述深度q网络强化学习模型使用单独的目标网络生成反映电网能量稳定的目标q值，在学习过程中，模型采用延迟更新的方法，每c步将当前电网节点的实时状态值复制到目标网络中，用以更新目标节点的实时状态；

4.如权利要求1所述的基于深度强化学习的配电网智能体群协同调控方法，其特征是，针对深度q网络强化学习模型，在训练过程中用深度卷积神经网络拟合最优动作值函数，该函数服从bellman方程；

5.如权利要求1所述的基于深度强化学习的配电网智...

【专利技术属性】
技术研发人员：李万彬，周在彦，刘奕敏，李龙潭，封国栋，吕天光，张宇昊，韩立群，刘璇，马歆哲，郑雅男，
申请(专利权)人：国网山东省电力公司德州供电公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人