【技术实现步骤摘要】
数字DC
‑
DC转换器环路控制方法、系统、设备及介质
[0001]本专利技术属于数字直流
‑
直流(DC
‑
DC)转换器
,特别涉及一种数字DC
‑
DC转换器环路控制方法、系统、设备及介质。
技术介绍
[0002]数字DC
‑
DC转换器作为一种典型的开关电源,在数字电源、高性能电源适配器、微电网等领域被广泛应用,对数字DC
‑
DC转换器进行研究具有重要的实用价值。
[0003]环路补偿是DC
‑
DC转换器的关键步骤,决定了数字DC
‑
DC的动态响应特性;现有技术中,经典的数字DC
‑
DC转换器的环路设计,是由专家根据具体使用场景,手动调整设计的;另外,在一些研究中,为了提高转换器的动态响应特性,采用了动态可调的环路控制方式,诸如模糊控制、滑模控制等技术方案。
[0004]强化学习是机器学习的一个重要分支,通过训练一个智能体(agent)并使其在某 ...
【技术保护点】
【技术特征摘要】
1.一种数字DC
‑
DC转换器环路控制方法,其特征在于,包括以下步骤:基于待控制的数字DC
‑
DC转换器,获取观测值e
t
和e
t
‑1;其中,e
t
为t时刻的输出电压值与参考电压值之差,e
t
‑1为t时刻上一时刻的输出电压值与参考电压值之差;将获取的观测值e
t
和e
t
‑1输入预先训练获取的智能体中,输出用于调整3p3z控制器传递函数的零极点位置;基于所述智能体输出的零极点位置获取更新后的传递函数,3p3z控制器基于更新后的传递函数输出PWM波;所述PWM波用于控制DC
‑
DC转换器中功率管的导通状态,实现DC
‑
DC转换器的输出电压值恒定;其中,所述智能体的数学模型是马尔科夫决策过程,包括状态空间、动作空间和奖励函数;状态空间S表达式为,S=[e
t
,e
t
‑1];动作空间A中智能体的动作为离散的3p3z控制器传递函数的零极点位置;奖励函数R的表达式为,式中E为期望的纹波电压大小,n为轨迹中总步长数;所述预先训练获取的智能体的训练过程中采用Q
‑
Learning算法。2.根据权利要求1所述的一种数字DC
‑
DC转换器环路控制方法,其特征在于,所述采用Q
‑
Learning算法的步骤中,采用的Q
‑
table表示为,Obs1Obs2Obs3
…
ObsnA1Q(Obs1,A1)Q(Obs2,A1)Q(Obs3,A1)
…
Q(Obsn,A1)A2Q(Obs1,A2)Q(Obs2,A2)Q(Obs3,A2)
…
Q(Obsn,A2)A3Q(Obs1,A3)Q(Obs2,A3)Q(Obs3,A3)
…
Q(Obsn,A3)
………………
AnQ(Obs1,An)Q(Obs2,An)Q(Obs3,An)
…
Q(Obsn,An)表中,横栏中的Obs1、Obs2、Obs3至Obsn为马尔科夫决策过程对应的状态空间;竖栏中的A1、A2、A3至An为马尔科夫决策过程对应的动作空间,A1、A2、A3至An为具有不同零极点位置的传递函数,分别对应着不同的相位裕度。3.根据权利要求1所述的一种数字DC
‑
DC转换器环路控制方法,其特征在于,采用Q
‑
Learning算法进行训练的过程中,智能体与环境交互进行数据采集的单个轨迹为,0~T1时刻,输入电压线性从0升至V
in
,在此过程中,数字DC
‑
DC转换器环路控制策略采用软启动方案;在T1时刻,输入电压大小在V
in
电压值附近随机阶跃一次,并在T2时刻,输入电压大小重新阶跃回至V
in
;在T3时刻,负载电流大小在I
out
电流值附近随机阶跃一次,并在T4时刻,负载电流大小重新阶跃回至I
out
;轨迹在T5时刻完成并退出;智能体在单个轨迹内完成数据收集,并进行训练与策略的提升,其期望的目标是DC
‑
DC转换器的输出电压尽可能长时间的稳定在参考电压;所述单个轨迹中,当DC
‑
DC开关频率为k Hz时,轨迹中一共包括T5/k步。4.一种数字DC
‑
DC转换器环路控制系统,其特征在于,包括:观测值获取模块,用于基于待控制的数字DC
‑
DC转换器,获取观测值e
t
和e
t
‑1;其中,e
t
为...
【专利技术属性】
技术研发人员:王红义,王书才,陈晨,吴凯凯,陶韬,范柚攸,王仕祯,翁勋维,张龙,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。