【技术实现步骤摘要】
电池组均衡控制模型的训练方法、装置及介质
[0001]本专利技术涉及电池控制
,具体提供一种电池组均衡控制模型的训练方法、装置及介质。
技术介绍
[0002]在使用锂电池进行供电的过程中,考虑到电池单体的电压较低且输出能力和容量有限,通常会采用大量电池串并联的方式组成大容量电池组来实现锂电池的供电。
[0003]其中,有大量的卫星电源使用通过串并联锂电池的方式组成的大容量电池组来实现供电。但是卫星电源目前主要存在以下问题:1)由于电池单体荷电状态不一致,荷电状态较小的电池可能会被过充或过放,这将加速衰老过程,严重影响电池单体的使用寿命和安全性。2)锂离子电池端电压随荷电状态变化较大,而为了提高供电效率,电源系统往往需要将电池组直挂母线上,这就需要对电池组输出电压进行稳定控制。3)锂电池组故障率较高,当电池单体耗尽或损坏后,会导致串联电池组停止工作。
[0004]相应地,本领域需要一种新的电池组均衡控制方案来解决上述问题。
技术实现思路
[0005]为了解决上述技术问题,即,在确保电池组正常工作的前提下,有效提升电池单体的寿命和安全性,并确保母线电压的稳定性的问题。
[0006]在第一方面,本专利技术提供一种电池组均衡控制模型的训练方法,所述电池组均衡控制模型包括智能体,所述电池组包括多个串联连接的电池单体支路,每个所述电池单体支路包括电池单体和两个开关器件,所述电池单体与一个开关器件串联形成串联支路,所述串联支路与另一个开关器件并联;所述智能体被配置为根据电池组中电池单体
【技术保护点】
【技术特征摘要】
1.一种电池组均衡控制模型的训练方法,其特征在于,所述电池组均衡控制模型包括智能体,所述电池组包括多个串联连接的电池单体支路,每个所述电池单体支路包括电池单体和两个开关器件,所述电池单体与一个开关器件串联形成串联支路,所述串联支路与另一个开关器件并联;所述智能体被配置为根据电池组中电池单体的荷电状态控制所述开关器件的开关动作,以控制所述电池单体的接入状态,实现电池单体接入所述电池组或将电池单体从所述电池组中切除,所述电池组与负载连接,形成为所述负载进行供电的供电回路;所述训练方法包括:在每个迭代训练中,获取所述电池组中所有电池单体的荷电状态,电池单体在当前迭代训练以及下一个迭代训练的接入状态,以及所述供电回路的母线电压;根据所述电池单体的荷电状态,获取所述电池单体的荷电状态偏差;根据所述电池单体在当前迭代训练以及下一个迭代训练的接入状态,获取所述电池组中的所述开关器件的开关动作的次数;根据所述供电回路的母线电压,获取所述供电回路的母线电压波动偏差;根据所述荷电状态偏差、所述开关动作的次数以及所述母线电压波动偏差,获取所述智能体输出的实际奖励值;应用梯度下降法,根据所述实际奖励值计算所述智能体的参数的梯度值,根据所述梯度值反向传播更新所述智能体的参数,以实现对所述智能体的训练。2.根据权利要求1所述的训练方法,其特征在于,“根据所述荷电状态偏差、所述开关动作的次数以及所述母线电压波动偏差,获取所述智能体输出的实际奖励值”的步骤包括通过以下公式获取所述实际奖励值:R=α1(ΔV
‑
T1)+α2F+α3(ΔSOC
‑
T2)其中,R表示所述实际奖励值,ΔV表示所述母线电压波动偏差,F表示所述开关动作的次数,ΔSOC表示所述荷电状态偏差,T1表示预设的母线电压波动偏差的阈值,T2表示预设的荷电状态偏差的阈值,α1、α2、α3表示预设的奖励系数。3.根据权利要求2所述的训练方法,其特征在于,“根据所述电池单体的荷电状态,获取所述电池单体的荷电状态偏差”的步骤包括通过以下公式获取所述电池单体的荷电状态偏差:其中,SOC
BAT_max
表示所述电池组中荷电状态最大的电池单体的荷电状态,SOC
BAT_min
表示所述电池组中荷电状态最小的电池单体的荷电状态,SOC
end
表示所述电池单体充电或放电结束时的荷电状态,SOC
′
表示所述电池组中所有电池单体的荷电状态的平均值。4.根据权利要求3所述的训练方法,其特征在于,“根据所述电池单体在当前迭代训练以及下一个迭代训练的接入状态,获取所述电池组中的所述开关器件的开关动作的次数”的步骤包括通过以下公式获取所述电池组中的所述开关器件的开关动作的次数F:
其中,N表示所述电池组中所述...
【专利技术属性】
技术研发人员:叶泽雨,尹靖元,师长立,韦统振,罗彦,韩立博,彭祥华,张桐硕,
申请(专利权)人:中国科学院电工研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。