当前位置: 首页 > 专利查询>四川大学专利>正文

阻抗匹配方法、装置、强化学习控制器和计算机可读存储介质制造方法及图纸

技术编号:31511752 阅读:15 留言:0更新日期:2021-12-22 23:51
本发明专利技术的实施例提供了一种阻抗匹配方法、装置、强化学习控制器和计算机可读存储介质,涉及无线充电技术领域,方法应用于强化学习控制器,强化学习控制器与无线充电系统中的DC

【技术实现步骤摘要】
阻抗匹配方法、装置、强化学习控制器和计算机可读存储介质


[0001]本专利技术涉及无线充电
,具体而言,涉及一种阻抗匹配方法、装置、强化学习控制器和计算机可读存储介质。

技术介绍

[0002]无线充电技术是一种利用电磁感应、磁耦合谐振、微波、激光等方式进行无实体介质的电能传输方式。无线充电的优势在于免去了充电线的烦扰,避免了线路的裸露,从而也减掉了很多安全隐患。同时,在某些场合,在有线供电无法将电线拉到目标位置时,无线充电也可以发挥自身优势,越过障碍物为目标进行供电。近年来,随着科技的进步以及无线电能传输行业的迅速发展,越来越多的大功率设备,例如电瓶车、新能源汽车等也采用无线充电为其提供能源。
[0003]然而,现有技术中无线充电的性能有待改善。

技术实现思路

[0004]本专利技术的目的之一包括,例如,提供了一种阻抗匹配方法、装置、强化学习控制器和计算机可读存储介质,以至少部分地提高无线充电系统的充电性能。
[0005]本专利技术的实施例可以这样实现:
[0006]第一方面,本专利技术提供一种阻抗匹配方法,应用于强化学习控制器,所述强化学习控制器与无线充电系统中的DC

DC变换器连接,该DC

DC变换器用于为负载提供充电电能,所述方法包括:
[0007]获得所述无线充电系统在设定传输效率下的目标负载;
[0008]实时获得所述无线充电系统的当前实际负载;
[0009]根据所述目标负载和当前实际负载,分析得到所述DC

DC变换器当前的目标占空比;
[0010]基于预存的控制策略,将所述DC

DC变换器的占空比调节为所述目标占空比,以使所述无线充电系统中的实际负载为所述目标负载,等效输入阻抗保持不变。
[0011]在可选的实施方式中,所述DC

DC变换器为Boost变换器,当前的目标占空比通过以下公式计算得到:
[0012]R

o
=R
o
·
(1

u)2[0013]其中,R
′0为目标负载;R0为当前实际负载;u为目标占空比。
[0014]在可选的实施方式中,所述设定传输效率为最大传输效率,所述目标负载通过以下公式计算得到:
[0015][0016]其中,R
i

ηmax
为目标负载;R
s
为DC

DC变换器的拓扑结构中的线圈内阻;k为耦合系数;Q为品质因数。
[0017]在可选的实施方式中,所述方法还包括得到控制策略的步骤,该步骤包括:
[0018]获得所述DC

DC变换器在设定传输效率下的期望负载电压;
[0019]获得所述DC

DC变换器的实际负载电压;
[0020]基于所述期望负载电压和实际负载电压之间的误差进行占空比控制的强化学习;
[0021]根据每次强化学习的结果,返回执行获得所述DC

DC变换器的实际负载电压至基于所述期望负载电压和实际负载电压之间的误差进行占空比控制的强化学习的步骤,直至所述期望负载电压和最新实际负载电压之间的误差满足设定条件,将得到所述最新实际负载电压的占空比控制方式存储为控制策略。
[0022]在可选的实施方式中,所述基于所述期望负载电压和实际负载电压之间的误差进行占空比控制的强化学习的步骤,包括:
[0023]将所述期望负载电压和实际负载电压之间的误差作为强化学习智能体的输入,得到所述强化学习智能体输出的待确定占空比;
[0024]获得所述DC

DC变换器的占空比为所述待确定占空比的情况下,新的实际负载电压;
[0025]根据所述期望负载电压和新的实际负载电压之间新的误差,基于设定的奖惩规则给予所述强化学习智能体奖励或者惩罚,激励所述强化学习智能体重新采取动作,输出新的待确定占空比,获得所述DC

DC变换器的占空比为所述新的待确定占空比的情况下,最新的实际负载电压;根据所述期望负载电压和最新的实际负载电压之间新的误差,基于设定的奖惩规则给予所述强化学习智能体奖励或者惩罚,激励所述强化学习智能体重新采取动作,输出新的待确定占空比,直至所述期望负载电压和最新实际负载电压之间的误差满足设定条件,将得到所述最新实际负载电压的占空比控制方式存储为控制策略。
[0026]在可选的实施方式中,所述设定的奖惩规则包括:
[0027]实际负载电压高于期望负载电压的惩罚优先于实际负载电压低于期望负载电压的惩罚;奖惩计算公式如下:
[0028][0029]其中,k1和k2为正常数且k1>k2,V
O
(x)为当前实际负载电压,为期望负载电压;或者,
[0030]奖励与所述期望负载电压和实际负载电压之间的误差成比例;奖惩计算公式如下:
[0031][0032]其中,k3为正常数,V
O
(x)为当前实际负载电压,为期望负载电压。
[0033]在可选的实施方式中,所述控制策略基于最小二乘回归得到;或者,
[0034]所述控制策略基于稳健回归得到。
[0035]第二方面,本专利技术提供一种阻抗匹配装置,应用于强化学习控制器,所述强化学习控制器与无线充电系统中的DC

DC变换器连接,该DC

DC变换器用于为负载提供充电电能,
所述阻抗匹配装置包括:
[0036]信息获得模块,用于获得所述无线充电系统在设定传输效率下的目标负载;实时获得所述无线充电系统的当前实际负载;
[0037]信息处理模块,用于根据所述目标负载和当前实际负载,分析得到所述DC

DC变换器当前的目标占空比;基于预存的控制策略,将所述DC

DC变换器的占空比调节为所述目标占空比,以使所述无线充电系统中的实际负载为所述目标负载,等效输入阻抗保持不变。
[0038]第三方面,本专利技术提供一种强化学习控制器,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述实施方式任一项所述的阻抗匹配方法。
[0039]第四方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质包括计算机程序,所述计算机程序运行时控制所述计算机可读存储介质所在强化学习控制器执行前述实施方式任一项所述的阻抗匹配方法。
[0040]本专利技术实施例的有益效果包括,例如:基于强化学习控制器,根据无线充电系统的目标负载和当前实际负载,分析得到DC

DC变换器当前的目标占空比,基于预存的控制策略,将DC

DC变换器的占空比调节为目标占空比,以使无线充电系统中的实际负载为目标负载,等效输入阻抗保持不变,从而本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种阻抗匹配方法,其特征在于,应用于强化学习控制器,所述强化学习控制器与无线充电系统中的DC

DC变换器连接,该DC

DC变换器用于为负载提供充电电能,所述方法包括:获得所述无线充电系统在设定传输效率下的目标负载;实时获得所述无线充电系统的当前实际负载;根据所述目标负载和当前实际负载,分析得到所述DC

DC变换器当前的目标占空比;基于预存的控制策略,将所述DC

DC变换器的占空比调节为所述目标占空比,以使所述无线充电系统中的实际负载为所述目标负载,等效输入阻抗保持不变。2.根据权利要求1所述的阻抗匹配方法,其特征在于,所述DC

DC变换器为Boost变换器,当前的目标占空比通过以下公式计算得到:R

o
=R
o
·
(1

u)2其中,R
′0为目标负载;R0为当前实际负载;u为目标占空比。3.根据权利要求2所述的阻抗匹配方法,其特征在于,所述设定传输效率为最大传输效率,所述目标负载通过以下公式计算得到:其中,R
i

ηmax
为目标负载;R
s
为DC

DC变换器的拓扑结构中的线圈内阻;k为耦合系数;Q为品质因数。4.根据权利要求1所述的阻抗匹配方法,其特征在于,所述方法还包括得到控制策略的步骤,该步骤包括:获得所述DC

DC变换器在设定传输效率下的期望负载电压;获得所述DC

DC变换器的实际负载电压;基于所述期望负载电压和实际负载电压之间的误差进行占空比控制的强化学习;根据每次强化学习的结果,返回执行获得所述DC

DC变换器的实际负载电压至基于所述期望负载电压和实际负载电压之间的误差进行占空比控制的强化学习的步骤,直至所述期望负载电压和最新实际负载电压之间的误差满足设定条件,将得到所述最新实际负载电压的占空比控制方式存储为控制策略。5.根据权利要求4所述的阻抗匹配方法,其特征在于,所述基于所述期望负载电压和实际负载电压之间的误差进行占空比控制的强化学习的步骤,包括:将所述期望负载电压和实际负载电压之间的误差作为强化学习智能体的输入,得到所述强化学习智能体输出的待确定占空比;获得所述DC

DC变换器的占空比...

【专利技术属性】
技术研发人员:刘宜成秦镜张峻伟涂海燕
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1