数字DC-DC转换器环路控制方法、系统、设备及介质技术方案

技术编号:37992591 阅读:17 留言:0更新日期:2023-06-30 10:06
本发明专利技术公开了一种数字DC

【技术实现步骤摘要】
数字DC

DC转换器环路控制方法、系统、设备及介质


[0001]本专利技术属于数字直流

直流(DC

DC)转换器
,特别涉及一种数字DC

DC转换器环路控制方法、系统、设备及介质。

技术介绍

[0002]数字DC

DC转换器作为一种典型的开关电源,在数字电源、高性能电源适配器、微电网等领域被广泛应用,对数字DC

DC转换器进行研究具有重要的实用价值。
[0003]环路补偿是DC

DC转换器的关键步骤,决定了数字DC

DC的动态响应特性;现有技术中,经典的数字DC

DC转换器的环路设计,是由专家根据具体使用场景,手动调整设计的;另外,在一些研究中,为了提高转换器的动态响应特性,采用了动态可调的环路控制方式,诸如模糊控制、滑模控制等技术方案。
[0004]强化学习是机器学习的一个重要分支,通过训练一个智能体(agent)并使其在某个环境下自主行动,智本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数字DC

DC转换器环路控制方法,其特征在于,包括以下步骤:基于待控制的数字DC

DC转换器,获取观测值e
t
和e
t
‑1;其中,e
t
为t时刻的输出电压值与参考电压值之差,e
t
‑1为t时刻上一时刻的输出电压值与参考电压值之差;将获取的观测值e
t
和e
t
‑1输入预先训练获取的智能体中,输出用于调整3p3z控制器传递函数的零极点位置;基于所述智能体输出的零极点位置获取更新后的传递函数,3p3z控制器基于更新后的传递函数输出PWM波;所述PWM波用于控制DC

DC转换器中功率管的导通状态,实现DC

DC转换器的输出电压值恒定;其中,所述智能体的数学模型是马尔科夫决策过程,包括状态空间、动作空间和奖励函数;状态空间S表达式为,S=[e
t
,e
t
‑1];动作空间A中智能体的动作为离散的3p3z控制器传递函数的零极点位置;奖励函数R的表达式为,式中E为期望的纹波电压大小,n为轨迹中总步长数;所述预先训练获取的智能体的训练过程中采用Q

Learning算法。2.根据权利要求1所述的一种数字DC

DC转换器环路控制方法,其特征在于,所述采用Q

Learning算法的步骤中,采用的Q

table表示为,Obs1Obs2Obs3

ObsnA1Q(Obs1,A1)Q(Obs2,A1)Q(Obs3,A1)

Q(Obsn,A1)A2Q(Obs1,A2)Q(Obs2,A2)Q(Obs3,A2)

Q(Obsn,A2)A3Q(Obs1,A3)Q(Obs2,A3)Q(Obs3,A3)

Q(Obsn,A3)
………………
AnQ(Obs1,An)Q(Obs2,An)Q(Obs3,An)

Q(Obsn,An)表中,横栏中的Obs1、Obs2、Obs3至Obsn为马尔科夫决策过程对应的状态空间;竖栏中的A1、A2、A3至An为马尔科夫决策过程对应的动作空间,A1、A2、A3至An为具有不同零极点位置的传递函数,分别对应着不同的相位裕度。3.根据权利要求1所述的一种数字DC

DC转换器环路控制方法,其特征在于,采用Q

Learning算法进行训练的过程中,智能体与环境交互进行数据采集的单个轨迹为,0~T1时刻,输入电压线性从0升至V
in
,在此过程中,数字DC

DC转换器环路控制策略采用软启动方案;在T1时刻,输入电压大小在V
in
电压值附近随机阶跃一次,并在T2时刻,输入电压大小重新阶跃回至V
in
;在T3时刻,负载电流大小在I
out
电流值附近随机阶跃一次,并在T4时刻,负载电流大小重新阶跃回至I
out
;轨迹在T5时刻完成并退出;智能体在单个轨迹内完成数据收集,并进行训练与策略的提升,其期望的目标是DC

DC转换器的输出电压尽可能长时间的稳定在参考电压;所述单个轨迹中,当DC

DC开关频率为k Hz时,轨迹中一共包括T5/k步。4.一种数字DC

DC转换器环路控制系统,其特征在于,包括:观测值获取模块,用于基于待控制的数字DC

DC转换器,获取观测值e
t
和e
t
‑1;其中,e
t
为...

【专利技术属性】
技术研发人员:王红义王书才陈晨吴凯凯陶韬范柚攸王仕祯翁勋维张龙
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1