数字DC-DC转换器环路控制方法、系统、设备及介质技术方案

技术编号：37992591 阅读：17 留言：0更新日期：2023-06-30 10:06

本发明专利技术公开了一种数字DC

全部详细技术资料下载

【技术实现步骤摘要】
数字DC
‑
DC转换器环路控制方法、系统、设备及介质

[0001]本专利技术属于数字直流
‑
直流(DC
‑
DC)转换器
，特别涉及一种数字DC
‑
DC转换器环路控制方法、系统、设备及介质。

技术介绍

[0002]数字DC
‑
DC转换器作为一种典型的开关电源，在数字电源、高性能电源适配器、微电网等领域被广泛应用，对数字DC
‑
DC转换器进行研究具有重要的实用价值。
[0003]环路补偿是DC
‑
DC转换器的关键步骤，决定了数字DC
‑
DC的动态响应特性；现有技术中，经典的数字DC
‑
DC转换器的环路设计，是由专家根据具体使用场景，手动调整设计的；另外，在一些研究中，为了提高转换器的动态响应特性，采用了动态可调的环路控制方式，诸如模糊控制、滑模控制等技术方案。
[0004]强化学习是机器学习的一个重要分支，通过训练一个智能体(agent)并使其在某...

【技术保护点】

【技术特征摘要】
1.一种数字DC
‑
DC转换器环路控制方法，其特征在于，包括以下步骤：基于待控制的数字DC
‑
DC转换器，获取观测值e
t
和e
t
‑1；其中，e
t
为t时刻的输出电压值与参考电压值之差，e
t
‑1为t时刻上一时刻的输出电压值与参考电压值之差；将获取的观测值e
t
和e
t
‑1输入预先训练获取的智能体中，输出用于调整3p3z控制器传递函数的零极点位置；基于所述智能体输出的零极点位置获取更新后的传递函数，3p3z控制器基于更新后的传递函数输出PWM波；所述PWM波用于控制DC
‑
DC转换器中功率管的导通状态，实现DC
‑
DC转换器的输出电压值恒定；其中，所述智能体的数学模型是马尔科夫决策过程，包括状态空间、动作空间和奖励函数；状态空间S表达式为，S＝[e
t
,e
t
‑1]；动作空间A中智能体的动作为离散的3p3z控制器传递函数的零极点位置；奖励函数R的表达式为，式中E为期望的纹波电压大小，n为轨迹中总步长数；所述预先训练获取的智能体的训练过程中采用Q
‑
Learning算法。2.根据权利要求1所述的一种数字DC
‑
DC转换器环路控制方法，其特征在于，所述采用Q
‑
Learning算法的步骤中，采用的Q
‑
table表示为，Obs1Obs2Obs3
…
ObsnA1Q(Obs1,A1)Q(Obs2,A1)Q(Obs3,A1)
…
Q(Obsn,A1)A2Q(Obs1,A2)Q(Obs2,A2)Q(Obs3,A2)
…
Q(Obsn,A2)A3Q(Obs1,A3)Q(Obs2,A3)Q(Obs3,A3)
…
Q(Obsn,A3)
………………
AnQ(Obs1,An)Q(Obs2,An)Q(Obs3,An)
…
Q(Obsn,An)表中，横栏中的Obs1、Obs2、Obs3至Obsn为马尔科夫决策过程对应的状态空间；竖栏中的A1、A2、A3至An为马尔科夫决策过程对应的动作空间，A1、A2、A3至An为具有不同零极点位置的传递函数，分别对应着不同的相位裕度。3.根据权利要求1所述的一种数字DC
‑
DC转换器环路控制方法，其特征在于，采用Q
‑
Learning算法进行训练的过程中，智能体与环境交互进行数据采集的单个轨迹为，0～T1时刻，输入电压线性从0升至V
in
，在此过程中，数字DC
‑
DC转换器环路控制策略采用软启动方案；在T1时刻，输入电压大小在V
in
电压值附近随机阶跃一次，并在T2时刻，输入电压大小重新阶跃回至V
in
；在T3时刻，负载电流大小在I
out
电流值附近随机阶跃一次，并在T4时刻，负载电流大小重新阶跃回至I
out
；轨迹在T5时刻完成并退出；智能体在单个轨迹内完成数据收集，并进行训练与策略的提升，其期望的目标是DC
‑
DC转换器的输出电压尽可能长时间的稳定在参考电压；所述单个轨迹中，当DC
‑
DC开关频率为k Hz时，轨迹中一共包括T5/k步。4.一种数字DC
‑
DC转换器环路控制系统，其特征在于，包括：观测值获取模块，用于基于待控制的数字DC
‑
DC转换器，获取观测值e
t
和e
t
‑1；其中，e
t
为...

【专利技术属性】
技术研发人员：王红义，王书才，陈晨，吴凯凯，陶韬，范柚攸，王仕祯，翁勋维，张龙，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人