【技术实现步骤摘要】
一种基于深度强化学习的多微网频率管理方法
[0001]本专利技术涉及一种基于深度强化学习的多微网频率管理方法,属于微网频率控制领域。
技术介绍
[0002]由于可再生能源的随机性以及规模化接入微电网,对微电网的频率稳定运行带来巨大的挑战。多微电网中频率和联络线功率控制是通过自动发电控制(Automatic Generation Control,AGC)实现的,它是维持频率稳定和微电网经济运行的重要措施之一。随着储能(Energy Storage,ES)成本的降低和用户侧电气化率的提升,更多类型的可调资源被用于响应多微电网的AGC指令。在电源侧方面,胡泽春、李艳君等学者提出了包括变桨矩角控制和转子速度控制在内的有功功率控制策略,将风力发电机纳入自动发电控制以提高频率调节性能。此外,Kashem M.Muttaqi等学者还提出了辅助控制策略,以使混合型ES与风力发电机合作共同协助频率管理。在ES方面,ES提供快速频率响应的价值已被越来越多的人接受。在何星瑭所提出的频率协调控制策略中,利用超级电容器和蓄电池组成的混合型ES具有的快速响应性能来提高频率稳定性。在一些能够独立运行的电力系统中,如美国PJM电网和中国南方电网,鼓励ES参与频率调节,并使ES根据实际调频性能和调频里程获得收益。在用户侧方面,柔性负荷,特别是变频空调、热水器、烘干机、冰箱、电动汽车等,是促进电力系统频率稳定运行的一个有前景的解决方案。惠红勋等学者研究了一种变频空调的电气模型,使其能够参与到频率调节服务中。徐岩等学者提出了一种分层控制框架,使变频空调通 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的多微网频率管理方法,其特征在于,该方法包括以下步骤:1)以实体储能和虚拟储能构建多微网的共享储能聚合平台,并基于共享储能聚合平台构建一种含共享储能聚合平台的孤岛多微网架构及其负荷频率控制模型;2)提出了一种考虑微网综合效益最优的AGC指令分配方法,综合效益兼顾微网运行成本和调频性能两种关键要素;3)提出了一种基于DDPG算法的AGC指令动态分配优化方法,构建了AGC指令动态分配方法的状态、动作和奖励函数。2.根据权利要求1所述的一种基于深度强化学习的多微网频率管理方法,其特征在于,步骤1)中,构建了一种含有共享储能聚合平台(Share Energy Storage Aggregation Platform,sES AP)的孤岛多微网架构。一个孤岛多微网由单域微网通过联络线构成,每个微网都包含可再生能源发电系统、化石能源发电系统(如冷热电联产系统(Combined Cooling Heating and Power,CCHP)、燃气轮机、柴油发电机)和负荷,sES聚合商将自建物理储能通过功率变换器连接到孤岛多微网母线上,同时sES聚合商还通过信息采集控制终端和无线通信实现对微网用户侧可调负荷构成的虚拟储能(如变频空调(AC)、电热泵、机械臂等)的管理。3.根据权利要求1所述的一种基于深度强化学习的多微网频率管理方法,其特征在于,步骤1)中,构建了含有共享储能聚合平台的孤岛多微网负荷频率控制模型。该模型由物理储能频率响应函数、虚拟储能频率响应函数、多微网功率平衡函数、联络线功率函数、区域控制误差函数以及约束条件构成。4.根据权利要求1所述的一种基于深度强化学习的多微网频率管理方法,其特征在于,步骤2)中,频率管理过程具体步骤包括:201)微网运营商从终端收集用户的用能信息和光伏发电信息,并由sES AP将储能的状态信息上报到微网运营商;202)微网运营商实时计算区域控制误差,并由基于深度强化学习的AGC动态分配控制器产生AGC指令;203)AGC指令分别由微网的柴油发电机、共享储能聚合商的蓄电池和变频空调执行。5.根据权利要求1所述的一种基于深度强化学习的多微网频率管理方法,其特征在于,步骤2)中,一种考虑微网综合效益最优的AGC指令分配方法,将单区域微网的AGC指令动态分配目标分解为3部分。第1部分使用最小的共享储能里程补偿和最小的柴油发电机成本来保证微网运行的经济性。第2部分使用最小的AGC指令响应误差来确保不同设备的频率调节性能。第3部分使用最小的区域控制误差来减少源
‑
荷不确定性对微网稳定运行的影响。AGC指令的动态分配目标函数如下所示。f(t)=X1+X2+X
33
式中,c
milI
,M
I
和A
I
分别是频率管理设备I的里程补偿单价,里程和性能指标A
I
=1,I=1时表示柴油发电机,I=2时表示共享储能。G是频率管理设备的种类,G=2。c
fuel
是柴油发电机单位油耗价格。c
ce
是碳排放单价。k
ce
是碳排放惩罚因子。ΔP
I
‑2是频率管理设备I参与二次频率调节的实际输出功率。N=75是控制周期。AGC指令的每个控制周期为4秒。μ是权重系数,k
pr
是比例系数。6.根据权利要求5所述的一种基于深度强化学习的多微网频率管理方法,其特征在于,ΔP
ord
‑
all
是AGC总指令,如下所示。ΔP
ord
‑
a...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。