基于深度学习的船舶混合动力能量管理方法、设备及介质技术

技术编号:37968880 阅读:8 留言:0更新日期:2023-06-30 09:44
本发明专利技术适用于船舶动力技术领域,提供了一种基于深度学习的船舶混合动力能量管理方法、设备及介质,具体步骤如下:S1:采集船舶系统的相关信息,相关信息包括船舶系统的柴油发电机输出转矩、船舶系统的需求转矩、储能电池组荷电状态、控制动作、状态空间;S2:将相关信息输入到训练模型中,训练模型输出储能电池组最佳荷电状态;S3:获取船舶行驶所需功率;S4:根据储能电池组最佳荷电状态以及船舶行驶所需功率,由逻辑门限生成控制指令,控制指令用于控制船舶系统的运行。本发明专利技术通过训练模型获取储能电池组最佳荷电状态,生成控制指令控制船舶系统的运行,使得柴油发电机工作于最佳效率区间,提高燃油经济性,减少污染气体的排放。减少污染气体的排放。减少污染气体的排放。

【技术实现步骤摘要】
基于深度学习的船舶混合动力能量管理方法、设备及介质


[0001]本专利技术属于船舶动力
,具体涉及一种基于深度学习的船舶混合动力能量管理方法、设备及介质。

技术介绍

[0002]目前船舶的动力系统的推进形式主要分为:
[0003]一、柴油发电机推进:具有功率密度大、可瞬间提供较大转矩等优点,但其在低转速、低负荷工作情况下,其燃油效率低,同时排放大量的CO
X
以及NO
X
等污染气体,对海洋环境与空气质量影响较大,且对海洋生态平衡造成影响,于此同时,柴油发电机运行时所产生的噪音相对较大,不仅使船员对内、外沟通产生阻力,而且长时间处于高分贝的环境会对人体身心健康产生不良影响;
[0004]二、电力推进:作为推进系统发展中的先进技术,电力推进系统在节能性、环保性、经济性、操纵性、机动性、降噪性等性能上相对柴油发电机推进均有质的提高,但是电力推进负载续航时间短、能力弱、需要电池组容量大且在复杂工况下行驶易对电池组产生损坏;
[0005]三、柴电混合动力推进系统:作为一种新的推进方式,同时具有柴油发电机推进与电力推进两种型式的综合优势,符合混合动力系统“双机互补”的理念,对能量的合理管理与调度,可以带给船舶更好的经济效益,柴电混合动力船舶的控制体系较复杂,充分及高效利用能量是柴电混合动力系统能量管理、分配需要解决的关键问题,在船舶安全运行的前提下,对降低油耗、污染与提高燃油效率起到决定性作用,船舶在不同的海域或不同的海况行驶时,需要根据不同运行工况选择最合理的推进模式,从而减少污染排放、降低能耗;但是目前对于柴电混合动力推进系统船舶的能量管理仅限于对各部件的能量进行监测与统一调度,能量分配不合理,船舶运行的经济性不高。

技术实现思路

[0006]本专利技术的目的是提供一种基于深度学习的船舶混合动力能量管理方法、设备及介质,解决
技术介绍
中存在的上述技术问题。
[0007]本专利技术是这样实现的:
[0008]第一方面,本申请提供了一种基于深度学习的船舶混合动力能量管理方法,具体步骤如下:
[0009]S1:采集船舶系统的相关信息,相关信息包括:船舶系统的柴油发电机输出转矩船舶系统的需求转矩储能电池组荷电状态SOC
t
,控制动作Z
t
,状态空间S
t
,其中,
[0010]S2:将相关信息输入到训练模型中,训练模型输出储能电池组最佳荷电状态SOC
l

[0011]S3:获取船舶行驶所需功率P
r

[0012]S4:根据储能电池组最佳荷电状态SOC
l
以及船舶行驶所需功率P
r
,由逻辑门限生成
控制指令,控制指令用于控制船舶系统的运行。
[0013]在上述技术方案中,对船舶系统航行过程中的相关信息进行收集,并通过训练模型获取储能电池组最佳荷电状态,最后生成控制指令,船舶系统根据控制指令运行时,位于最佳推进形式,使得柴油发电机工作于最佳效率区间内,提高船舶燃油经济性,提高能量的利用率,减少一氧化碳等污染气体的排放,达到整体节能减排的效果。
[0014]进一步地,步骤S2中,所述训练模型输出储能电池组最佳荷电状态SOC
l
的具体步骤为:
[0015]S201:初始化深度强化学习网络W(S,Z),初始化经验池,在经验池中存储动作对a
t
、策略π、最佳策略π
*
以及权重参数θ;
[0016]S202:状态空间S
t
在控制动作Z
t
的作用下转换到下一状态空间S
t+1
时获得即时奖励r
t

[0017][0018]其中,C
e
代表柴油发电机的瞬时油耗,C代表惩罚,值为柴油发电机最大瞬时油耗值与最大污染排放量之和,SOC
min
为储能电池组荷电状态的最小值,SOC
max
为储能电池组荷电状态的最大值,B为船舶排出的二氧化碳、碳氢化物、氮氧化合物归一化后的排放量之和;
[0019]S203:令动作对a
t
=(S
t
,Z
t
,r
t
,S
t+1
);
[0020]S204:计算从时刻t开始到时刻T过程结束时的奖赏之和R
t
,,其中,t、为瞬时时刻,γ为折扣因子,γ∈[0,1],用来权衡未来奖赏对累积奖赏的影响;
[0021]S205:在状态空间S
t
下执行控制动作Z
t
,并遵循策略π到下一工况前获得的累积回报定义为W
t
,W
t
(S,Z)=E[R
t
|S=S
t
,Z=Z
t
,π],E为期望,最优策略π
*
的回报大于或等于其他所有策略的回报,多个最优策略π
*
共享一个回报值函数W
π*

[0022]S206:将回报值函数通过贝尔曼最优方程迭代,当t

∞时,W
t
(S,Z)

W
π*
(S,Z),回报值函数最终收敛,得到收敛值函数W
k
(S,Z),(S,Z),式中,S`是下一个时间步长的状态,Z`是下一个时间步长的控制动作,一个时间步长为一次迭代,为W
t
(S,Z)的最大值;
[0023]S207:对损失函数用梯度下降法,获取更新后的权重参数θ
*
,,J(θ
*
)为损失函数,更新后的权重参数θ
*
放入经验池,作为下一循环的初始权重参数;
[0024]S208:通过线性函数逼近器拟合得到深度强化学习目标网络值,W
L
(S,Z|θ
*
);
[0025]S209:令W
t
(S,Z)=W
L
(S,Z|θ
*
),输出更新后的最佳策略π
*
、控制动作Z
*
、状态空间S
*
,并将输出后的最佳策略π
*
储存至经验池中;
[0026]S210:根据步骤S209输出的数据,获取对应的储能电池组最佳荷电状态SOC
l
,柴油发电机输出转矩
[0027]进一步地,步骤S204中,时刻t为状态S
t
采集的时刻,时刻T为状态S
t+1
采集的时刻。
[0028]进一步地,步骤S210中,根据状态空间的函数:获取SOC
l

[0029]进一步地,步骤S3中,船舶行驶所需功率P
r...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的船舶混合动力能量管理方法,其特征在于,具体步骤如下:S1:采集船舶系统的相关信息,所述相关信息包括:船舶系统的柴油发电机输出转矩船舶系统的需求转矩储能电池组荷电状态SOC
t
,控制动作Z
t
,状态空间S
t
,其中,S2:将所述相关信息输入到训练模型中,所述训练模型输出储能电池组最佳荷电状态SOC
l
;S3:获取船舶行驶所需功率P
r
;S4:根据储能电池组最佳荷电状态SOC
l
以及船舶行驶所需功率P
r
,由逻辑门限生成控制指令,所述控制指令用于控制船舶系统的运行。2.根据权利要求1所述的一种基于深度学习的船舶混合动力能量管理方法,其特征在于,步骤S2中,所述训练模型输出储能电池组最佳荷电状态SOC
l
的具体步骤为:S201:初始化深度强化学习网络W(S,Z),初始化经验池,在经验池中存储动作对a
t
、策略π、最佳策略π
*
以及权重参数θ;S202:状态空间S
t
在控制动作Z
t
的作用下转换到下一状态空间S
t+1
时获得即时奖励r
t
,其中,C
e
代表柴油发电机的瞬时油耗,C代表惩罚,值为柴油发电机最大瞬时油耗值与最大污染排放量之和,SOC
min
为储能电池组荷电状态的最小值,SOC
max
为储能电池组荷电状态的最大值,B为船舶排出的二氧化碳、碳氢化物、氮氧化合物归一化后的排放量之和;S203:令动作对a
t
=(S
t
,Z
t
,r
t
,S
t+1
);S204:计算从时刻t开始到时刻T过程结束时的奖赏之和R
t
,其中,t`为瞬时时刻,γ为折扣因子,γ∈[0,1],用来权衡未来奖赏对累积奖赏的影响;S205:在状态空间S
t
下执行控制动作Z
t
,并遵循策略π到下一工况前获得的累积回报定义为W
t
,W
t
(S,Z)=E[R
t
|S=S
t
,Z=Z
t
,π],E为期望,最优策略π
*
的回报大于或等于其他所有策略的回报,多个最优策略π
*
共享一个回报值函数共享一个回报值函数S206:将回报值函数通过贝尔曼最优方程迭代,当t

∞时,∞时,回报值函数最终收敛,得到收敛值函数W
k
(S,Z),式中,S`是下一个时间步长的状态,Z`是下一个时间步长的控制动作,一个时间步长为一次迭代,为
W
t
(S,Z)的最大值;S207:对损失函数用梯度下降法,获取更新后的权重参数θ
*
,J(θ
*
)为损失函数,更新后的权重参数θ
*
放入经验池,作为下一循环的初始权重参数;S208:通过线性函数逼近器拟合得到深度强化学习目标网络值,W
L
(S,Z|θ
*
);S209:令W
t
(S,Z)=W
L
(S,Z|θ
*
),输出更新后的最佳策略π
*
、控制动作Z
*
、状态空间S
*
,并将输出后的最佳策略π
*
储存至经验池中;S210:根据步骤S209输出的数据,获取对应的储能电池组最佳荷电状态SOC
l
,柴油发电机输出转矩3.根据权利要求2所述的一种基于深度学习的船舶混合动力能量管理方法,其特征在于,步骤S204中,时刻t为状态S
t
采集的时刻,时刻T为状态S
t+1
采集的时刻。4.根据权利要求2所述的一种基于深度学习的船舶混...

【专利技术属性】
技术研发人员:许媛媛王利伟朱少欣徐茂栋张智羿
申请(专利权)人:广东海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1