一种无人艇追逃博弈控制方法及控制器技术

技术编号:39828686 阅读:7 留言:0更新日期:2023-12-29 16:05
本发明专利技术一种无人艇追逃博弈控制方法及控制器,基于追捕无人艇运动学数学模型和逃逸无人艇运动学数学模型,分别构造追逃优化代价函数和博弈化代价函数,设计了基于非线性模型预测方法的无人艇博弈控制器和无人艇追逃控制器,在对自身最不利的情况下评估追捕无人艇和逃逸无人艇的最佳策略;然后根据评估的对手策略得到自己的最佳博弈策略;考虑包括非线性无人艇运动学模型约束

【技术实现步骤摘要】
一种无人艇追逃博弈控制方法及控制器


[0001]本专利技术涉及水面无人艇运动控制领域,尤其涉及一种无人艇追逃博弈控制方法及控制器


技术介绍

[0002]无人艇是人类开发海洋和保护海洋的重要工具,具有无人化

小型化和智能化等优点

无人艇通过搭载各种传感器

导航系统和自主运动控制系统,能够在水面上进行自主航行并执行作业任务,在军事

民用

科研等领域得到了广泛应用,各国都在加大对无人艇的研究

开发和利用的力度

[0003]无人艇自主运动控制技术是无人艇能够自主执行任务的关键技术之一,其运动控制器设计方法近年来受到了国外内学者的广泛关注

模型预测控制是无人艇典型的自主运动控制方法之一,国内外已取得较多相关的研究成果
。Yan Zheng
针对存在海洋环境扰动下欠驱动无人艇轨迹跟踪问题,提出了一种基于神经动力学的无人船模型预测轨迹跟踪方法,定制双层递归神经网络求解最大最小值优化问题,在提高算法实时性的同时实现了扰动环境下的欠驱动无人船轨迹跟踪任务
。Abdelaal,Mohamed
针对存在环境扰动的非线性无人艇航迹控制系统,将非线性模型预测控制技术与扰动观测器相结合,提出一种鲁棒轨迹跟踪控制器,实现海洋环境扰动下欠驱动无人艇的轨迹跟踪控制
。SR Oh
针对欠驱动无人艇路径跟踪问题,提出一种基于视距制导的模型预测路径跟踪方法,利用视距制导产生目标轨迹,通过模型预测控制实现对目标轨迹的跟踪
。Zhang Jun
针对存在环境扰动和执行器饱条件下的无人艇路径跟踪问题,提出一种基于扰动观测器和自适应卡尔曼滤波器的鲁棒模型预测路径跟踪方法
。Zheng Huarong
针对多无人艇系统提出一种分布式鲁棒模型预测协同路径跟踪方法,利用交叉方向乘子法求解所构造的全局优化问题,实现环境扰动下多无人艇协同路径跟踪控制

然而,现有无人艇运动控制器设计方法仍存在一些不足之处:
[0004]第一,现有无人艇运动控制器设计方法大多只针对轨迹跟踪

路径跟踪

目标跟踪等合作任务目标提出,均未考虑存在敌对无人艇的非合作运动场景下的无人艇运动控制器设计问题

在实际应用中,无人艇执行任务可能面临敌对无人艇的干扰

追逐等复杂场景,亟需开发针对非合作场景的无人艇运动控制方法

[0005]第二,现有无人艇模型预测控制方法均通过最小化自身代价函数实现期望目标任务,属于单边性能优化运动控制方法,其设计过程只考虑了自身动态方程,没有考虑敌方无人艇的运动动态对自身运动控制结果的影响,无法用于解决存在敌对无人艇场景的非合作运动控制问题

[0006]第三,现有的追逃博弈控制方法多依赖于深度学习算法,然而深度学习算法存在数据需求量大

可解释性较差以及对数据质量敏感等问题

这些限制使得一旦出现错误的决策,很难准确确定原因并进一步修正,从而限制了深度学习算法在无人艇追逃博弈运动控制方面的应用


技术实现思路

[0007]为了解决上述问题,本专利技术采用的技术方案是:一种无人艇追逃博弈控制方法,包括以下步骤:
[0008]建立追捕无人艇运动学数学模型;
[0009]建立逃逸无人艇运动学数学模型;
[0010]基于追捕无人艇运动学数学模型及逃逸无人艇运动学数学模型,设计追捕无人艇代价函数,用于追捕无人艇在评估逃逸无人艇采用控制策略最大化其目标函数后,采用控制策略最小化其目标函数;
[0011]基于追捕无人艇运动学数学模型,设计追捕无人艇避障策略;
[0012]基于追捕无人艇运动学数学模型及追捕无人艇运动学数学模型,对逃逸无人艇的逃跑策略进行估计,得到估计的逃逸无人艇策略;
[0013]基于追捕无人艇代价函数

追捕无人艇避障策略

追捕无人艇状态与输入约束

逃逸无人艇策略,构造优化问题进行求解得到追捕无人艇的追捕博弈策略;
[0014]基于追捕无人艇运动学数学模型及逃逸无人艇运动学数学模型,设计逃逸无人艇代价函数,用于逃逸无人艇在评估追捕无人艇采用控制策略最大化其目标函数后,采用控制策略最小化其目标函数;
[0015]基于逃逸无人艇运动学数学模型,设计逃逸无人艇避障策略;
[0016]基于追捕无人艇运动学数学模型及追捕无人艇运动学数学模型,对追捕无人艇的追捕测量进行估计,得到估计的追捕无人艇策略;
[0017]基于逃逸无人艇代价函数

逃逸无人艇避障策略

逃逸无人艇状态与输入约束

追捕无人艇策略,构造优化问题进行求解得到逃逸无人艇的追捕博弈策略,使得追捕无人艇和逃逸无人艇达到了纳什均衡状态

[0018]进一步地:所述追捕无人艇代价函数的得到过程如下:
[0019]在博弈论背景下,用双边优化代价函数来描述追捕无人艇代价函数如下:
[0020][0021]上式中表示零和博弈中追捕无人艇的双边优化问题,其可解释为追捕无人艇在评估逃逸无人艇采用控制策略
U
e
最大化其目标函数后,采用控制策略
U
p
最小化自己的目标函数

[0022]当追捕无人艇和逃逸无人艇策略达到纳什均衡时,追捕无人艇代价函数表示为此时有:
[0023][0024]上式中各符号的含义如下:表示达到纳什均衡时追捕无人艇的控制策略;
U

p
表示追捕无人艇的备选控制策略;表示达到纳什均衡时逃逸无人艇的控制策略;
U

e
表示逃逸无人艇的备选控制策略

[0025]进一步地:对逃逸无人艇的最佳策略进行估计,得到估计的逃逸无人艇策略其估计方法如下:
[0026][0027]上式中各符号的含义如下:第一项表示逃逸无人艇状态和追捕无人艇状态之间的二次型误差;
Q
pe

R
pe
表示权重矩阵,
Q
pe
可以用于改变状态误差对优化结果的影响程度,
R
pe
用于改变逃逸无人艇控制输入对优化结果的影响程度;
N
表示模型预测控制的预测步长;
[0028]公式
(9)
表示从追捕无人艇角度估计得到的一个逃逸无人艇策略其最大化了逃逸无人艇状态和追捕无人艇状态之间的误差,即追捕无人艇认为逃逸无人艇会尽可能摆脱其追捕;
[0029]所述追捕无人艇对逃逸无人艇的策略估计所构建的优化问题<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种无人艇追逃博弈控制方法,其特征在于:包括以下步骤:建立追捕无人艇运动学数学模型;建立逃逸无人艇运动学数学模型;基于追捕无人艇运动学数学模型及逃逸无人艇运动学数学模型,设计追捕无人艇代价函数,用于追捕无人艇在评估逃逸无人艇采用控制策略最大化其目标函数后,采用控制策略最小化其目标函数;基于追捕无人艇运动学数学模型,设计追捕无人艇避障策略;基于追捕无人艇运动学数学模型及追捕无人艇运动学数学模型,对逃逸无人艇的逃跑策略进行估计,得到估计的逃逸无人艇策略;基于追捕无人艇代价函数

追捕无人艇避障策略

追捕无人艇状态与输入约束

逃逸无人艇策略,构造优化问题进行求解得到追捕无人艇的追捕博弈策略;基于追捕无人艇运动学数学模型及逃逸无人艇运动学数学模型,设计逃逸无人艇代价函数,用于逃逸无人艇在评估追捕无人艇采用控制策略最大化其目标函数后,采用控制策略最小化其目标函数;基于逃逸无人艇运动学数学模型,设计逃逸无人艇避障策略;基于追捕无人艇运动学数学模型及追捕无人艇运动学数学模型,对追捕无人艇的追捕测量进行估计,得到估计的追捕无人艇策略;基于逃逸无人艇代价函数

逃逸无人艇避障策略

逃逸无人艇状态与输入约束

追捕无人艇策略,构造优化问题进行求解得到逃逸无人艇的追捕博弈策略,使得追捕无人艇和逃逸无人艇达到了纳什均衡状态
。2.
根据权利要求1所述的一种无人艇追逃博弈控制方法,其特征在于:所述追捕无人艇代价函数的得到过程如下:在博弈论背景下,用双边优化代价函数来描述追捕无人艇代价函数如下:上式中表示零和博弈中追捕无人艇的双边优化问题,其可解释为追捕无人艇在评估逃逸无人艇采用控制策略
U
e
最大化其目标函数后,采用控制策略
U
p
最小化自己的目标函数

当追捕无人艇和逃逸无人艇策略达到纳什均衡时,追捕无人艇代价函数表示为此时有:上式中各符号的含义如下:表示达到纳什均衡时追捕无人艇的控制策略;
U

p
表示追捕无人艇的备选控制策略;表示达到纳什均衡时逃逸无人艇的控制策略;
U

e
表示逃逸无人艇的备选控制策略
。3.
根据权利要求1所述的一种无人艇追逃博弈控制方法,其特征在于:对逃逸无人艇的最佳策略进行估计,得到估计的逃逸无人艇策略其估计方法如下:
上式中各符号的含义如下:第一项表示逃逸无人艇状态和追捕无人艇状态之间的二次型误差;
Q
pe

R
pe
表示权重矩阵,
Q
pe
可以用于改变状态误差对优化结果的影响程度,
R
pe
用于改变逃逸无人艇控制输入对优化结果的影响程度;
N
表示模型预测控制的预测步长;公式
(9)
表示从追捕无人艇角度估计得到的一个逃逸无人艇策略其最大化了逃逸无人艇状态和追捕无人艇状态之间的误差,即追捕无人艇认为逃逸无人艇会尽可能摆脱其追捕;所述追捕无人艇对逃逸无人艇的策略估计所构建的优化问题
(11)
受束于如下约束条件:上式中各符号的含义如下:第一个约束条件表示逃逸无人艇的运动学模型约束
(3)
;第二个约束条件表示逃逸无人艇的避障约束条件,其中
R
easv
表示以追捕无人艇质心为圆心的圆形半径;第三和第四个约束条件表示逃逸无人艇的状态约束条件,符号与公式
(4)
中的定义相同;第五和第六个约束条件分别表示追捕无人艇和逃逸无人艇的初始状态约束,其中
η
p
(0)

η
e
(0)
表示追捕无人艇与逃避无人艇的零时刻的位置;
η
p0

η
e0
表示人为设定的追捕无人艇和逃逸无人艇的初始位置
。4.
根据权利要求1所述的一种无人艇追逃博弈控制方法,其特征在于:所述追捕无人艇的追捕博弈策略的追捕博弈策略上式中各符号的含义如下:表示采用最佳估计策略下,追捕无人艇对逃逸无人艇位姿状态的预测值;
Q
pp

R
...

【专利技术属性】
技术研发人员:古楠吕光颢秦恒峰刘陆王浩亮彭周华王丹
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1