基于TD3强化学习算法的DC-DC变换器控制方法技术

技术编号:37963584 阅读:21 留言:0更新日期:2023-06-30 09:38
本发明专利技术公开了一种基于TD3强化学习算法的DC

【技术实现步骤摘要】
基于TD3强化学习算法的DC

DC变换器控制方法


[0001]本专利技术涉及DC

DC变换器智能控制
,特别涉及一种基于TD3强化学习算法的DC

DC变换器控制方法。

技术介绍

[0002]随着电力电子和智能电网技术的不断发展,各种分布式可再生能源系统已集成到现有电力系统中。由于成本低、结构简单、效率高,DC

DC开关变换器引起了广泛的研究关注。它们已应用于直流微电网、直流电机驱动和直流电源等,并在未来的工业、交通、军事等应用中表现出极大的应用前景。然而,变换器在应用过程中存在各种不确定性干扰,包括电路参数扰动、负载变化和供电电压波动等,受这些因素影响,变换器的瞬态输出电压需要较长时间才能恢复稳态,电能输出质量严重下降。因此,当系统面临不可避免的干扰时,提高DC

DC变换器的动态响应性能被视为关键问题。
[0003]目前,用于DC

DC变换器的基于强化学习的神经网络控制器主要分为两类。一种使用基于强化学习的神经网本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于TD3强化学习算法的DC

DC变换器控制方法,其特征在于,包括:基于DC

DC变换器获取状态观测向量;基于TD3强化学习算法构建强化学习控制器模型,其中,所述强化学习控制模型包括强化学习智能体和奖励模块,将所述状态观测向量输入所述强化学习智能体,得到行为动作,并形成新状态观测向量;所述奖励模块基于所述行为动作得到即时奖励;基于所述即时奖励更新所述强化学习智能体的参数,直至收敛,得到训练好的强化学习控制器模型;基于所述训练好的强化学习控制器模型,实现对DC

DC变换器的控制。2.根据权利要求1所述的基于TD3强化学习算法的DC

DC变换器控制方法,其特征在于:获取状态观测向量的过程包括:获取参考电压,实时采集DC

DC变换器的输出电压,基于所述参考电压和所述输出电压得到电压误差,基于所述电压误差得到误差积分;基于所述输出电压、电压误差和所述误差积分得到状态观测向量。3.根据权利要求1所述的基于TD3强化学习算法的DC

DC变换器控制方法,其特征在于:所述强化学习智能体还包括策略模块和强化学习算法模块。4.根据权利要求3所述的基于TD3强化学习算法的DC

DC变换器控制方法,其特征在于:所述强化学习...

【专利技术属性】
技术研发人员:叶剑郭寰宇
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1