【技术实现步骤摘要】
一种基于实时参数优化LQR控制器的编队控制方法及系统
[0001]本专利技术涉及机器人
,具体的是一种基于实时参数优化
LQR
控制器的编队控制方法及系统
。
技术介绍
[0002]随着机器人技术的快速发展,多机器人协同操作和编队控制逐渐成为了研究的焦点
。
在多种应用场景中,如无人驾驶
、
物流配送
、
农业作业等,多机器人需要按照预设的队形和相对位置,协同完成特定任务
。
在这样的应用中,机器人编队的稳定性和跟踪性能显得尤为重要
。
[0003]线性二次型
(LQR)
控制器是一种经典的优化控制策略,它在很多工程应用中,尤其是车辆控制领域,得到了广泛应用
。LQR
控制器基于线性系统动态和二次型性能指标,寻求最优控制策略来确保系统的稳定性和满足性能要求
。
然而,
LQR
控制器的一大局限性在于其控制参数是固定的
。
这意味着,在设计
【技术保护点】
【技术特征摘要】
1.
一种基于实时参数优化
LQR
控制器的编队控制方法,其特征在于,方法包括以下步骤:接收领航者相关数据,根据领航者相关数据计算得到动态虚拟目标位置,其中,所述领航者相关数据包括位姿和不同队形;基于阿克曼车辆平台,得到运动学模型,利用运动学模型的表达式进行线性化得到控制系统状态方程,依据控制系统状态方程选取目标函数得到
LQR
控制器;接收编队系统的状态,将编队系统的状态输入预先建立的深度强化学习深度确定策略梯度算法模型
DDPG
,对
LQR
控制器参数进行预测训练,得到带
DDPG
参数优化的
LQR
控制器,将带
DDPG
参数优化的
LQR
控制器跟踪动态虚拟目标位置,并部署在跟随者中,从而实现编队控制
。2.
根据权利要求1所述的一种基于实时参数优化
LQR
控制器的编队控制方法,其特征在于,所述根据领航者相关数据计算得到动态虚拟目标位置包括三种队形的虚拟目标点,三种队形的虚拟目标点的计算公式分别如下:种队形的虚拟目标点的计算公式分别如下:种队形的虚拟目标点的计算公式分别如下:其中式
(1)
~
(3)
分别为纵向一字队形
、
三角队形和横向一字队形的虚拟目标点计算公式,其中
i
为队形唯一
ID
号,领航者
ID
为1,跟随者
ID
从2开始,
[x
m
,y
m
]
为领航者的当前位置,
θ
m
为领航者的当前全局朝向,为三角队形的夹角参数,
Δ
d
为编队间距,
n
为编队数目;第
i
辆跟随者的动态虚拟目标直线通过式
(1)
~
(3)
计算得出的虚拟目标点
[x
i
,y
i
]
,以及当前领航者当前全局朝向
θ
m
来确定
。3.
根据权利要求1所述的一种基于实时参数优化
LQR
控制器的编队控制方法,其特征在于,所述基于阿克曼模型车辆平台,得到运动学模型,所述运动学模型如下:
其中,
v
为车辆速度,
L
为车辆前后轮轴距,
δ
为前轮转向角,为车辆在全局坐标系统中
x
轴方向的速度,为车辆在全局坐标系统中
y
轴方向的速度,
θ
为车辆的全局朝向,为车辆的角速度
。4.
根据权利要求1所述的一种基于实时参数优化
LQR
控制器的编队控制方法,其特征在于,所述运动学模型改写成矩阵形式,公式如下:其中,
(x,y)
为车辆在全局坐标系中的坐标;设参考点车辆运动学方程和公式
(5)
相同形式为:其中,
(x
*
,y
*
)
为参考点车辆在全局坐标系中的坐标,
θ
*
为参考点车辆的全局朝向,
v
*
为参考点车辆速度,
δ
为参考点车辆前轮转向角;将第
(5)
步的模型线性化,将
f(X,u)
在参考点
(X
*
,u
*
)
处泰勒展开,并忽略高次项,有式
(7)
:上式可表示为式
(8)
:其中其中为状态量误差,为控制量误差;将式
(8)
离散化处理,成为式
(9)
:其中,
A
d
=
A
·
dt+I
,
B
d
=
B
·
dt
定义
LQR
控制器的目标函数为式
(10)
:其中
Q
和
R
分别为半正定和正定的参数矩阵,领航者采用传统
LQR
控制器进行跟踪控制,
Q
和
R
选取为固定值,各跟随者采用
DDPG
实时优化的
Q
和
R
值
。5.
根据权利要求4所述的一种基于实时参数优化
LQR
控制器的编队控制方法,其特征在于,得出
LQR
控制器的目标函数后,找出使目标函数
J
达到最小的控制量,领航者和跟随者的
LQR
控制器控制量的计算过程如下:通过式
(11)
所示的离散化
Riccati
方程在每个控制周期内求解得到
P
N
:P
t
‑1=
Q+A
dT
P
t
A
d
‑
A
dT
P
t
B
d
(R+B
dT
P
t
B
d
)
‑1B
dT
P
t
A
d
ꢀꢀꢀꢀꢀ
(11)
上式循环迭代计算,设置
P
t
初始值为
Q
,在一定迭代次数
N
内,当
P
t
‑1和
P
t
的误差小于预设迭代精度
e
时结束迭代,取此时的
P
t
‑1值为最终值,记为
P
N
;通过解式
(11)
得到最优控制为式
(12)
:领航者和跟随者的
LQR
控制器的状态量误差分别表示为:控制器的状态量误差分别表示为:其中,
x
f,i
,y
f,i
,
θ
f,i
为第
i
辆跟随者当前的...
【专利技术属性】
技术研发人员:王智,渠娜,杜敏杰,
申请(专利权)人:南京信息职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。