【技术实现步骤摘要】
一种自主小车巡航控制方法及装置
[0001]本专利技术涉及自动控制和强化学习
,更具体地,涉及一种自主小车巡航控制方法及装置。
技术介绍
[0002]在实际自动控制系统中,通常存在多个控制器,它们具有不同的偏好并通过交互信息做出决策。因为可以提供模块化设计和进行独立的学习设计,基于微分博弈的方法已成为解决此类系统控制问题的有效工具。一般地,通过求解微分博弈的纳什均衡,就可以获得对应问题的控制策略。近些年,已经提出了许多强化学习算法来近似获得纳什均衡解,同时事件触发机制也被融合到学习设计中以降低通讯成本。
[0003]自主小车系统已经逐渐深入到各行各业和国民生活中,高效的巡航控制是其智能化和实际应用的重要环节。自主小车通过数字控制器进行自主决策并具备数据传输与数据通信功能。大多数车辆系统都包含复杂的非线性动力学,典型的做法是采用线性化操作然后进行控制器设计。
[0004]对于自主小车的巡航控制,主要存在两个方面的问题:一方面,因电源能量有限,需要开发效率更高的动态事件触发机制;另一方面,如何提高小车系统的 ...
【技术保护点】
【技术特征摘要】
1.一种自主小车巡航控制方法,其特征在于,包括如下步骤:S10,构建基于微分博弈的巡航跟踪控制模型;S20,利用评价网络结构获得基于事件触发的控制策略;S30,确定基于分布式动态触发的事件触发规则;S40,将训练获得的控制策略经误差变换后实现自适应巡航控制。2.根据权利要求1所述的一种自主小车巡航控制方法,其特征在于,所述微分博弈的巡航跟踪控制模型构建过程:S110,通过下式建立自主小车的运动学模型其中:P
F
和P
L
是由两个风扇提供的推进力,即控制变量或控制输入;系统状态变量包括:方向角θ(t)、X轴速度或横向速度Y轴速度或纵向速度角速度μ表示线性摩擦常数,φ表示旋转摩擦系数,J表示转动惯量,m是车体质量,r
f
是车体质心与风扇轴之间的距离;S120,误差变换:根据这四个状态变量之间的误差关系对巡航跟踪控制模型进行误差变换,得到新的误差状态:x1(t)=e
θ
=θ(t)
‑
θ
T
;x2(t)=e
x
=V
x
(t)
‑
V
xT
;其中:θ
T
,V
xT
,V
yT
,0分别代表小车开始巡航后方向角、横向速度、纵向速度和角速度对应的巡航值,因此巡航指令写为r
T
=[θ
T
,V
xT
,V
yT
,0]
T
;x1(t),x2(t),x3(t),x4(t)代表四个误差状态。S130,确定行为关系:将车辆系统的两个风扇看作是独立决策的博弈者,其控制输入记为u1=P
F
,u2=P
L
,得到基于微分博弈的巡航跟踪控制模型:其中:系统状态x(t)=[x1,x2,x3,x4]
T
已经获得,通过将此时的状态x(t)稳定至零,车辆实现对指定巡航指令r
T
的自主跟踪。3.根据权利要求1所述的一种自主小车巡航控制方法,其特征在于,所述事件触发的控制策略构建过程:S210,根据微分博弈模型构建评价神经网络;所述的评价神经网络输入层到隐层的权值矩阵被设置为单位向量,隐层到输出层的权值设置为
S220,经评价神经网络中权值与事件触发信号结合...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。