【技术实现步骤摘要】
一种基于深度强化学习的逆变器控制器
本专利技术涉及电力电子逆变器
,具体涉及一种基于深度强化学习的逆变器控制器。
技术介绍
鉴于能源、环保的压力,越来越多的可再生能源通过电力电子发电设备接入电网。作为一种能够将直流电转换为交流电的电能转换设备,逆变器在风电,储能,光伏等领域得到了广泛应用。最早的逆变器控制策略采用了双层的控制结构,即内层为电流环,外层为功率环或者电压环。但这种控制策略的响应速度快,不利于电力系统的频率稳定,也不能根据系统的电压和频率情况自适应调整逆变器的输出功率。随后出现了逆变器的下垂控制策略。这种控制策略虽然能够根据系统的频率和电压自动调整自身的输出有功和无功功率,有利于系统的频率和电压控制,但依然存在响应速度快的缺点。考虑到同步发电机转子的转动惯量在电力系统频率稳定中所起的有益作用,有人提出了虚拟同步发电机(VirtualSynchronousGenerator,VSG)控制技术,其核心思想是在逆变器的控制策略中模拟同步发电机的转子运动方程。但这种技术在降低响应速度、增加电力系统惯性的同时,也继承了同步发电机转子易发生低频振荡的特性。针对此问题,有人从转动惯量J和阻尼系数D的上入手,提出了一系列的控制策略。有人建立了包含VSG的单逆变器并网的小信号模型,利用根轨迹的手段,选取适当的转动惯量J和阻尼系数D,在保证稳定的同时也具有较好地动态特性。但这种线性化手段下设计出的控制器难以适应逆变器所处的复杂的运行工况,一旦运行工况有别于初始的设计条件,就有可能发生失稳或者动态特性变差的风险。也有人从自 ...
【技术保护点】
1.一种基于深度强化学习的逆变器控制器,其特征在于,包括虚拟同步发电机控制模块、深度强化学习控制模块,所述逆变器控制器模拟了同步发电机转子运动方程,并通过深度强化学习控制模块调整虚拟转动惯量,以获得较好的电力系统低频振荡抑制效果。/n
【技术特征摘要】
1.一种基于深度强化学习的逆变器控制器,其特征在于,包括虚拟同步发电机控制模块、深度强化学习控制模块,所述逆变器控制器模拟了同步发电机转子运动方程,并通过深度强化学习控制模块调整虚拟转动惯量,以获得较好的电力系统低频振荡抑制效果。
2.根据权利要求1所述的一种基于深度强化学习的逆变器控制器,其特征在于,所述的虚拟同步发电机控制模块,包括dq变换模块、输出有功无功和端电压有效值计算模块、调制波信号幅值计算模块、模拟转子运动方程模块、dq反变换和PWM调制模块:
——dq变换模块用于将逆变器LC滤波器上电容的三相电压ea、eb、ec和电感上流过的三相电流ia、ib、ic,分解到逆变器的同步旋转坐标系下得到其dq轴分量ud、uq和id、iq;
——输出有功无功和端电压有效值计算模块的计算公式如式(1)所示:
式中,P为有功功率,Q为无功功率,U为输出电压幅值;
——调制波信号幅值计算模块用于计算调制波幅值Eq,所用公式为:
Eq=∫Ke[(Uref-U)-n(Q-Qref)]dt(2)
式中,Uref为逆变器端电压的设定值;Qref为逆变器无功功率的设定值;Ke为放大增益;n为无功电压环节的下垂系数;Eq为逆变器调制波信号中的q轴分量,调制波信号的0轴和d轴分量均为0;
——模拟转子运动方程模块用于计算逆变器虚拟的角频率ω和调制波的相位角δ,计算公式如式(3)(4)所示:
δ=ωn∫ωdt(4)
式中,J为逆变器虚拟转动惯量;m为有功下垂系数;Pref为逆变器输出有功功率的设定值;D为逆变器虚拟阻尼系数;δ为逆变器调制波相位;ωn为角频率基准值;
——dq反变换和PWM调制模块用于将调制波信号幅值计算模块、模拟转子运动方程模块的计算结果经dq反变换后得到调制波信号ua、ub、uc,再根据PWM算法生成PWM控制信号驱动三相逆变桥,实现逆变功能。
3.根据权利要求1所述的一种基于深度强化学习的逆变器控制器,其特征在于,所述深度强化学习控制模块用于调整虚拟转动惯量J,包括以下步骤:
步骤1:确定控制动作集A、状态集合S、奖励函数R、和动作价值函数Qπ(s,a);
步骤2:建立逆变器的数学模型,利用DDPG(deepdeterministicpolicygradient)算法离线预学习,获得初步优化后的控制器参数;
步骤3:将逆变器投入运行,且在运行过程中利用DDPG算法在线应用,进行动作更新策略,以适应电网的复杂运行环境。
4.根据权利要求3所述的一种基于深度强化学习的逆变器控制器,其特征在于,步骤1中所述控制动作集A的表达式如下:
式中,Jmin和Jmax为一组预先设定的虚拟转动惯量上下限的值;
步骤1中所述状态集合S的表达式如下:
S∈{(ΔP,Δω)}(6)
式中,ΔP为逆变器在某时刻的输出有功功率与设定值之差;Δω为该时刻虚拟同步发电机转速偏差,(ΔP,Δω)表示逆变器在该时刻输出功率P和虚拟角频率ω的偏差组合。
5.根据权利要求3所述的一种基于深度强化学习的逆变器控制器,其特征在于,步骤1中所述奖励函数R的表达式如下:
式中,r(st,at)为在t时刻的系统状态st采取动作at后得到的单步奖励值;ap、aω分别为有功功率差、转速偏差所占评价指标的权重系数;step为每...
【专利技术属性】
技术研发人员:张昌华,张坤,徐子豪,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。