一种基于深度Q网络学习的SOC均衡控制方法、设备及介质技术

技术编号:45622233 阅读:11 留言:0更新日期:2025-06-24 18:48
本申请公开了一种基于深度Q网络学习的SOC均衡控制方法、设备及介质,方法包括:利用仿真软件构建电池阵列仿真模型;根据当前时刻的荷电状态利用ε‑贪婪算法确定当前时刻的放电策略;以此与电池阵列仿真模型进行环境交互,并将当前时刻的荷电状态、当前时刻的放电策略、下一时刻的荷电状态和当前时刻的奖励作为当前时刻的经验,并放入经验回放池中更新积累;利用经验回放池中的经验样本以损失函数最小为目标对深度Q网络模型进行训练,并利用决策网络对待均衡电池阵列进行动态可重构电池SOC均衡控制。本申请能够在系统层面上实现电池单元的快速均衡,实现了动态可重构电池SOC的全局均衡优化,提高了动态可重构电池SOC的均衡效率。

【技术实现步骤摘要】

本申请涉及动态可重构电池soc均衡领域,特别是涉及一种基于深度q网络学习的soc均衡控制方法、设备及介质。


技术介绍

1、随着电池储能系统的不断发展,电池储能系统广泛应用于工业产品与电网储能系统中。在常规电池储能系统中,多节电池通过固定串并联的方式连接。但是电池单元的性质、状态不尽相同,而固定化的拓扑结构无法解决电池之间差异导致的“短板效应”。为解决这个问题,动态可重构电池系统作为一种以能量数字化为基础的新型电池储能系统被提出。这种新型电池储能系统打破了常规的固定串并联结构,通过电池单元与低压低功耗电力电子器件深度耦合的方式实现电池能量离散化,并通过数字能量交换系统实现电池模块级的数字能量管控,能够有效的从根本上消除常规电池储能系统受电池单元差异造成的“短板效应”。然而,动态可重构电池系统是一个复杂、非线性的时变系统,给控制带来了巨大挑战。

2、目前,针对动态可重构电池的soc均衡控制方法可分为以下几类:首先,采用基于经验的控制方法。这种方法的策略是在相互并联电池单元中选择固定数量进行放电。这种方法简单易行,但只能实现局部优化。其次,采用基于模本文档来自技高网...

【技术保护点】

1.一种基于深度Q网络学习的SOC均衡控制方法,其特征在于,所述基于深度Q网络学习的SOC均衡控制方法包括:

2.根据权利要求1所述的基于深度Q网络学习的SOC均衡控制方法,其特征在于,利用仿真软件构建电池阵列仿真模型,具体包括:

3.根据权利要求2所述的基于深度Q网络学习的SOC均衡控制方法,其特征在于,所述电池单元的等效电路模型包括:生命周期单元模型和外电路单元模型;

4.根据权利要求1所述的基于深度Q网络学习的SOC均衡控制方法,其特征在于,所述ε-贪婪算法的决策策略为当探索率小于探索率阈值时,产生随机的放电策略,当探索率大于或者等于探索率阈值时...

【技术特征摘要】

1.一种基于深度q网络学习的soc均衡控制方法,其特征在于,所述基于深度q网络学习的soc均衡控制方法包括:

2.根据权利要求1所述的基于深度q网络学习的soc均衡控制方法,其特征在于,利用仿真软件构建电池阵列仿真模型,具体包括:

3.根据权利要求2所述的基于深度q网络学习的soc均衡控制方法,其特征在于,所述电池单元的等效电路模型包括:生命周期单元模型和外电路单元模型;

4.根据权利要求1所述的基于深度q网络学习的soc均衡控制方法,其特征在于,所述ε-贪婪算法的决策策略为当探索率小于探索率阈值时,产生随机的放电策略,当探索率大于或者等于探索率阈值时产生最大价值的放电策略。

5.根据权利要求1所述的基于深度q网络学习的soc均衡控制方法,其特征在于,所述当前时刻的奖励包括:当前时刻的主线奖励和当前时刻的辅助奖励;

6....

【专利技术属性】
技术研发人员:慈松宋丹李佳钊刘闯侯恩策齐强周杨林刘晓光张从佳冯扬谭佳铭沈向琼
申请(专利权)人:内蒙古华电氢能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1