一种负荷协同控制方法及装置制造方法及图纸

技术编号：38010897 阅读：23 留言：0更新日期：2023-06-30 10:31

本公开涉及一种负荷协同控制方法及装置，其中负荷协同控制方法包括建立用于计算电力成本的成本模型；将成本模型表示为分布式部分可观测马尔科夫决策过程。基于所建立的分布式部分可观测马尔科夫决策过程利用强化学习方法进行训练，以获得各第一用户和各第二用户对应的目标策略，以便优化电力成本和奖赏；以及在目标场景下，基于各目标策略确定出各个第一用户和各个第二用户的负荷协同控制的动作。本公开的方法在决策时刻，仅需要用户在其动作空间选取动作进行状态转移，而不需要获取用户具体的用电隐私信息，并且能够求解得到负荷协同控制的目标动作，在满足用户用点需求的前提下，降低电网的操作成本。降低电网的操作成本。降低电网的操作成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种负荷协同控制方法及装置

[0001]本公开涉及微电网
，更具体地，涉及一种负荷协同控制方法及装置。

技术介绍

[0002]现有的技术中，以直接负荷控制方法为代表的需求响应已经在削峰填谷、降低成本等方面发挥了重要作用。然而，传统的直接负荷控制方法需要提前获知负荷的详细信息，这给用户隐私带来了威胁。例如，控制空调需要感知用户的空调使用时间以及室内温度；控制可转移负荷(电动汽车、洗碗机、干衣机等)需要获知其可调度时间范围，如电动汽车的到达时间和离开时间，而该时间往往包含了用户的位置隐私和行为隐私；此外，很多情况下用户自己也无法给出准确的时间点。因此，需要发展隐私保护的住宅负荷控制方法，在无需住宅用户的隐私信息的情况下，可以实现住宅负荷的协同控制。

技术实现思路

[0003]旨在提供一种负荷协同控制方法及装置，在不需要获取用户行为隐私的情况下，实现住宅负荷的协同控制。
[0004]在第一方面，本公开的实施例提供了一种负荷协同控制方法，用于包含多个第一用户和至少一个第二用户的孤岛电网，所述孤岛电网中的发电设备和储能设备在所述至少一个第二用户的控制下为所述多个第一用户供电，所述负荷协同控制方法包括：
[0005]建立用于计算电力成本的成本模型，所述电力成本包括所述发电设备的发电成本和储能设备的储能成本；
[0006]将所述成本模型表示为分布式部分可观测马尔科夫决策过程，其中所述分布式部分可观测马尔科夫决策过程包含第一用户的观测空间、第二用户的观测空间、所有用户的动作空间、所有用户...

【技术保护点】

【技术特征摘要】
1.一种负荷协同控制方法，用于包含多个第一用户和至少一个第二用户的孤岛电网，所述孤岛电网中的发电设备和储能设备在所述至少一个第二用户的控制下为所述多个第一用户供电，其特征在于，所述负荷协同控制方法包括：建立用于计算电力成本的成本模型，所述电力成本包括所述发电设备的发电成本和储能设备的储能成本；将所述成本模型表示为分布式部分可观测马尔科夫决策过程，其中所述分布式部分可观测马尔科夫决策过程包含第一用户的观测空间、第二用户的观测空间、所有用户的动作空间、所有用户的状态空间和奖励函数，其中各个第一用户的观测空间包括其自身的观测信息，所述第二用户的观测空间包括其控制下所供电的多个第一用户的总用能偏差的观测信息，在各决策时刻，各第一用户以及各第二用户根据其观测信息在其动作空间中选择动作来转移到目标状态，所述奖励函数用于定义各第一用户以及各第二用户转移到目标状态后的奖赏；基于所建立的分布式部分可观测马尔科夫决策过程利用强化学习方法进行训练，以获得各第一用户和各第二用户对应的目标策略，以便优化电力成本和奖赏；以及在目标场景下，基于各目标策略确定出各个第一用户和各个第二用户的负荷协同控制的动作。2.如权利要求1所述的负荷协同控制方法，其特征在于，各第一用用户以及各第二用户根据其观测信息在其动作空间中选择动作来转移到目标状态具体包括：各第一用户根据其观测信息参考第一策略在其动作空间中选择动作来转移到目标状态，所述第一策略用于定义该第一用户根据当前时刻的观测信息与该第一用户执行的动作之间的关系；各第二用户根据其观测信息参考第二策略在其动作空间中选择动作来转移到目标状态，所述第二策略用于定义该第二用户当前时刻的观测信息与该第二用户执行的动作之间的关系，其中该第二用户当前时刻的观测信息包含各第一用户的总用能偏差。3.如权利要求2所述的负荷协同控制方法，其特征在于，基于所建立的分布式部分可观测马尔科夫决策过程利用强化学习方法进行训练包括：为用户基于强化学习定义全局状态动作值函数，所述全局状态动作值函数用于基于当前时刻各用户的状态和各用户的动作所确定的各个在后时刻的累积折扣奖励来确定期望奖励，其中，所述折扣奖励由所述奖励函数和预设折扣因子来确定，且各用户的动作服从于各自的策略；为所述全局状态动作值函数建立拟合值函数，所述拟合值函数对各用户的局部动作值函数执行累积，并在各用户的局部动作值函数引入各用户的观测历史和各用户当前的观测信息；利用强化学习确定出各用户的目标动作，使得在该目标动作下局部动作值函数的值最大，从而优化拟合值函数。4.如权利要求3所述的负荷协同控制方法，其特征在于，基于所建立的分布式部分可观测马尔科夫决策过程利用强化学习方法进行训练包括：为各用户：获取该用户的观测信息，并基于该用户的观测信息从该用户的动作空间中选取备选动
作；执行所述备选动作来确定该用户下一时刻的观测信息，并依据奖励函数确定当前时刻的奖赏；将该用户的转移过程记录在各用户的记忆池中；在所述记忆池中为各用户选取目标转移过程，并确定各用户转移过程的损失；基于所述损失通过梯度下降法更新各用户的局部动作值函数的参数；执行迭代，以获得目标策略。5.如权利要求4所述的负荷协同控制方法，其特征在于，基于该用户的观测信息从该用户的动作空间中选取备选动作包括：以概率∈在该用户的动作空间随机选取第一动作，否则，以概率1
‑
∈选取使得当前局部动作值函数取得最大...

【专利技术属性】
技术研发人员：秦兆铭，曹军威，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人