【技术实现步骤摘要】
一种基于Q
‑
learning的柴油机空气系统多变量自抗扰控制方法
[0001]本专利技术涉及发动机空气系统控制
,特别是涉及一种基于Q
‑
learning的柴油机空气系统多变量自抗扰控制方法。
技术介绍
[0002]柴油机作为一种高效清洁的内燃机,应用广泛,处在所属产业链的相对核心的位置。其中柴油机的空气系统,是一种典型的多输入、多输出,且存在较强的输出信号噪声的动态系统。其动态过程的精确控制对发动机的动力性、经济性有重要影响。但是为了追求更快的响应速度,且输出信号中存在噪声、其控制过程容易发生执行机构的抖动。
[0003]因此,设计更快更稳定,控制效果更好的算法一直是近年来国内外学者关注的问题,并为此投入了许多精力,取得了诸多成果。文献(Rate
‑
based model predictive controller for diesel engine air path:Design and experimental evaluation)对柴油机空气系统进行基于速率的模型预测控制,协调控制EGR阀、EGR节气门及VGT阀从而使进气歧管压力和EGR率达到目标值。文献(Robust rate
‑
based Model Predictive Control of diesel engine air path)将模型适当降阶后,设计了模型预测控制以控制EGR阀和VGT阀门开度,使得进气歧管压力和EGR率能够快速达到目标值。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种基于Q
‑
learning的柴油机空气系统多变量自抗扰控制方法,其特征在于,包括以下步骤:步骤1,根据空气系统进排气部分核心动态方程,建立TVA
‑
VGT
‑
EGR柴油机空气系统面向控制模型,所述TVA
‑
VGT
‑
EGR柴油机空气系统面向控制模型包括增压压力动态方程、涡前压力动态方程和EGR率动态方程,所述TVA
‑
VGT
‑
EGR柴油机空气系统面向控制模型实时算出增压压力p
22
、涡前压力p3以及EGR率X
EGR
;步骤2,简化步骤1中的TVA
‑
VGT
‑
EGR柴油机空气系统面向控制模型表达式写成状态空间方程形式,基于多变量自抗扰控制算法设计三输入三输出的空气系统控制器及相应扩张状态观测器和控制律,实现对p
22
、p3和X
EGR
的控制;步骤3,根据所述空气系统控制器实际情况设计状态空间S和行动集A,对所有的状态s∈S和行动a∈A,初始化相应的状态
‑
行动值函数Q(s,a)=0;步骤4,设定Q
‑
learning算法中的折扣因子γ∈(0,1)与满足如下条件的学习率序列learning算法中的折扣因子γ∈(0,1)与满足如下条件的学习率序列并选择状态转移概率,下角标j表示第j次进行Q学习;步骤5,设计回报函数:在系统运行过程中,每q次采样进行一次学习,从t=jqh时刻到t=(j+1)qh时刻之间的带宽是一个常数,记为ω
j
=ω(t),t∈[jqh,(j+1)qh],j=1,2,...h为时间步长;通过Q学习调节扩张状态观测器的参数,当系统运行到t=jqh,j=1,2,
…
时刻时,当前状态s
j
,并选取行动a
j
,然后对扩张状态观测器带宽进行调节。2.如权利要求1所述的基于Q
‑
learning的柴油机空气系统多变量自抗扰控制方法,其特征在于,增压压力动态方程如下:式中,涡前压力动态方程为:式中,式中,EGR率动态方程为:式中,
其中,A
TVA
为TVA阀有效流通截面积;A
VGT
为VGT阀有效流通截面积;A
EGR
为EGR阀有效流通截面积;p
21
为TVA阀门前压力;p
22
为节流阀后压力;为节流阀后压力的动态变化,p3为涡前压力,表示涡前压力的动态变化;R为理想气体常数;T
22
为进气温度;V
22
为进气歧管容积;T3为涡前温度;V3为排气歧管容积;为燃油质量流量;T
21
为TVA阀门前温度;1为待标定系数;T3为涡前温度;2为待标定系数;η
vol
为充气效率;V
d
为气缸容积;N
Eng
为发动机转速;β为待标定系数,p4为涡后压力,X
EGR
为EGR率,为EGR率的动态变化,ρ2为气缸进气气体密度。3.如权利要求1所述的基于Q
‑
learning的柴油机空气系统多变量自抗扰控制方法,其特征在于,步骤2中,状态空间方程如下:式中,式中,A
TVA
、A
VGT
、A
EGR
分别表示TVA阀门、VGT阀门、EGR阀门的有效流通面积,f1、f2、f3分别为p
22
、p3和X
EGR
通...
【专利技术属性】
技术研发人员:宋康,任玉茹,谢辉,薛文超,汤国杰,
申请(专利权)人:天津大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。