【技术实现步骤摘要】
基于近端策略优化算法的光储充电站运行优化方法及系统
[0001]本专利技术涉及电动汽车充电站能量调度运行
,具体涉及一种基于近端策略优化算法的光储充电站经济运行优化方法及系统。
技术介绍
[0002]近几年,光伏
‑
储能联合应用的模式得到迅速发展。通过将光伏和储能有机的结合,可以充分发挥其各自的优势。由于光伏发电受外界环境影响较大,出力呈现一定的波动性,因此配置储能系统可进一步加强对电动汽车充电负荷的就地补偿效果,通过管理储能电池的充放电行为实现能量在时间和空间上平移,缓解电网在高峰时段的供电压力,达到平稳配电网负荷波动、减缓配电网扩容压力、提高配电网运行经济性的目的。可见,基于光储充一体化的电动汽车充电站不仅可以实现光伏资源的就地消纳,减少充电站与配网简单连接对配电网造成的冲击影响,同时还提高了可再生能源的渗透率,实现电动汽车充电站与可再生能源的衔接,是应对能源互联网战略的重要举措。
[0003]针对光储充一体化电站的优化调度问题,现有的研究方法多聚焦于传统的数学优化建模方式。例如已有研究提出一种计及光储快充一体站的配电网日前优化调度方法,通过储能的有功和无功优化决策,从而改善充电负荷大规模接入带来的运行问题。针对孤岛式光储充电站的经济调度问题,已有研究建立了基于Stackelberg博弈的双层优化调度模型。
[0004]综合考虑一体化电站内多能源的协调互补问题属于复杂的非线性混合整数规划问题,求解难度大,且新能源的可控性需求与随机特性,大幅度增加了该问题的计算负担与求解难度 ...
【技术保护点】
【技术特征摘要】
1.一种基于近端策略优化算法的光储充电站经济运行优化方法,其特征在于,包括:获取实时的光储充一体站的数据信息;利用预先训练好的运行优化模型,对获取的光储充一体站的数据信息进行处理,得到光储充一体站的最优运行出力决策;其中,将光储充一体站的历史数据信息作为训练集,采用近端策略优化算法进行所述运行优化模型的训练,获得相应决策动作;其中,训练运行优化模型的目标函数为最小化电站运行成本,运行成本包括从电网购电的成本和电储能的充放电折旧成本;约束条件包括电功率平衡约束、主电网交互功率约束、储能设备运行约束、储能荷电状态约束。2.根据权利要求1所述的基于近端策略优化算法的光储充电站经济运行优化方法,其特征在于,采用近端策略优化算法进行所述运行优化模型的训练,获得相应决策动作,包括:由状态空间S、动作空间A、状态转移概率P和回报函数R构成的四元组数据{S、A、P、R},作为训练和学习的基础数据;在Actor
‑
Critic架构下融入动态步长机制和重要性采样技术进行安全约束经济调度决策网络训练学习,通过优势函数的剪切机制限制新旧策略之间的距离,利用梯度更新机制,在奖励函数引导下寻找最优调度策略作为最终的相应决策动作。3.根据权利要求2所述的基于近端策略优化算法的光储充电站经济运行优化方法,其特征在于,安全约束经济调度决策网络的训练包括样本产生与提取、价值网络训练和策略网络训练三部分;在s
t
=[S
load,t
,S
pv,t
,S
soc,t
‑1]的驱动下,基于神经网络的前向传播计算公式,生成一体站内储能系统的实际出力功率a
t
=[a
BES,t
];构造动作向量的多元正态概率分布函数以形成调度策略π,由多元正态概率分布函数抽样获得训练最终的调度计划;基于当前时刻下的经济调度成本计算奖励函数r
t
;生成下一时刻的状态向量s
t+1
,得到训练样本序列<s
t
,a
t
,r
t
,s
t+1
>。4.根据权利要求3所述的基于近端策略优化算法的光储充电站经济运行优化方法,其特征在于,在价值网络训练中,首先从样本池中提取样本序列<s
t
,a
t
,r
t
,s
t+1
>,将状态向量s
t
=[S
load,t
,S
pv,t
,S
soc,t
‑1]输入价值网络,通过前向传播机制计算当前状态s
t
下的价值函数V
μ
(s
t
);通过下式构造价值网络损失函数,对价值网络进行梯度更新:μ=μ
‑
η
μ
▽
L
v
(μ);式中,η
μ
为价值网络的学习率,
▽
L
v
(μ)为价值网络损失函数L
v
(μ)关于参数μ的梯度,L
v
(μ)可由下式计算:式中,E(.)为期望函数,V
μ
(s...
【专利技术属性】
技术研发人员:许寅,段玉戈,刘曌,孙庆凯,王希豪,王小君,和敬涵,王颖,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。