当前位置: 首页 > 专利查询>四川大学专利>正文

基于分布式模型预测控制的多智能体协同突防打击方法技术

技术编号:38707309 阅读:10 留言:0更新日期:2023-09-08 14:47
本发明专利技术公开了一种基于分布式模型预测控制的多智能体协同突防打击方法,涉及多智能体系统的协同作战技术领域,包括:构建多智能体的更新系统模型;制定飞行约束条件;将避免与敌方智能体的碰撞条件作为软约束考虑在目标函数中,构建智能体的总目标函数;构建多智能体协同突防打击模型;基于分布式MPC算法求解多智能体协同突防打击模型,要求需对避免与我方智能体碰撞的约束进行解耦处理,以及在任意时刻,有且仅有一个智能体求解多智能体协同突防打击模型,得到未来的控制输入,更新控制输入序列,其它智能体则各自采用自身上一次更新获得的控制输入序列。本发明专利技术能增强了多智能体系统的稳定性,且解决了约束条件中的耦合问题。题。题。

【技术实现步骤摘要】
基于分布式模型预测控制的多智能体协同突防打击方法


[0001]本专利技术涉及多智能体系统的协同作战
,具体而言,涉及一种基于分布式模型预测控制的多智能体协同突防打击方法。

技术介绍

[0002]多智能体系统的协同作战是未来智能作战的重要方式,目前已经成为研究的重点,指的是通过多智能体协同探索、协同突防和协同打击等,共同完成打击敌方目标的作战任务。在近距空战突防中,智能体通过机载传感器获得其他智能体以及周围环境信息,但是敌方同时也会派遣智能体进行拦截,我方智能体必须采取一系列的机动策略躲避敌方智能体才能完成打击任务。多智能体协同突防问题要求在近距对抗的过程中满足单个智能体动力学方程的同时,满足避障和避碰等硬性约束。因此,模型预测控制(Model Predictive Control,MPC)因其处理约束的能力,而广泛应用解决协同打击问题。
[0003]目前,多智能体协同打击的方式主要有两种,一是独立协同打击;二是分布式协同打击。独立协同打击不与其他智能体间相互作用,主要依靠其收集的信息和相应的控制策略完成打击任务。不同于独立协同打击,分布式协同打击存在各智能体之间的信息交换行为,被认为是最有效打击目标的方式之一。传统的基于模型预测控制的协同打击问题主要采用集中式MPC,所有的智能体采用同一个控制架构,根据系统的综合信息从全局角度做出机动决策,所有的信息会传输到中心控制站,然后再分别将相应决策传输到每个智能体。在这一框架下,可以获得整个系统的最优控制性能。但是如果中心控制站出现故障,整个系统都将无法运行。并且,采用集中式方式求解将面临维数灾问题,难以实现对战场变化的快速反应。因此,针对中大型系统,分布式模型预测控制(Distributed Model Predictive Control,DMPC)得到了广泛应用。目前有文献研究了多智能体冲击角约束下的协同制导问题,采用leader

follower的打击方式,将多智能体协同打击问题重构为可考虑复杂约束的分布式优化问题,所有子系统采用滚动时域更新的策略。还有文献提出了一种基于约束鲁棒模型预测控制的弹性飞行器综合制导控制方法。该设计基于局部状态反馈控制律,在线性矩阵不等式的框架内最小化代价函数。同时,考虑了非线性运动学和动力学因素,保证了闭环非线性系统的内部稳定性。这些文献在求解问题时利用分布式算法的特性,解决了集中式算法存在的不足,但是都没有考虑系统中可能存在具有拦截策略的敌方智能体。在实际的多智能体系统协同打击过程中,敌方为保护目标会派遣智能体进行拦截,通常情况下敌方智能体具有较强的拦截策略以阻止我方智能体的打击。

技术实现思路

[0004]本专利技术在于提供一种基于分布式模型预测控制的多智能体协同突防打击方法,在满足避障和避碰的约束条件下实现多智能体的突防并完成打击目标,利用分布式算法,将协同打击的突防问题转换为带有耦合约束条件的优化问题,解决了集中式算法的不足,提高了系统的在线求解速度,并通过协同打击的突防算法实现躲避敌方智能体的拦截并击中
目标。
[0005]本专利技术采取的技术方案如下:
[0006]一种基于分布式模型预测控制的多智能体协同突防打击方法,包括以下步骤:
[0007]S1、构建多智能体动力学模型;
[0008]S2、根据多智能体动力学模型和时间步长,构建多智能体的更新系统模型;
[0009]S3、制定飞行约束条件,包括避免与障碍物碰撞的约束,避免与我方智能体碰撞的约束,和智能体的飞行约束;
[0010]S4、将避免与敌方智能体的碰撞条件作为软约束考虑在目标函数中,构建智能体的总目标函数;
[0011]S5、根据多智能体的更新系统模型、飞行约束条件和智能体的总目标函数,构建多智能体协同突防打击模型;
[0012]S6、基于分布式MPC算法,对避免与我方智能体碰撞的约束进行解耦处理,以及在任意时刻,有且仅有一个智能体求解多智能体协同突防打击模型,得到未来的控制输入,更新控制输入序列,其它智能体则各自采用自身上一次更新获得的控制输入序列。
[0013]在本专利技术的一较佳实施方式中,步骤S1中,多智能体动力学模型为:
[0014][0015]其中,
[0016][0017]表示x
i
关于t求导,N
g
表示智能体个数,L表示智能体集合,v
i
(t),χ
i
(t),γ
i
(t)分别表示智能体i的速度、偏航角和俯仰角,g表示重力加速度,分别表示智能体i在x轴、y轴和z轴方向的过载,智能体i的状态向量x
i
=[x
i
,y
i
,z
i
,v
i

i

i
]∈R6,控制向量R表示实数空间,x
i
(t),y
i
(t),z
i
(t)分别表示智能体i在x轴、y轴和z轴的位置,z
i
(t)=(x
i
(t),y
i
(t),z
i
(t))。
[0018]在本专利技术的一较佳实施方式中,步骤S2中,多智能体的更新系统模型为Δt表示时间步长。
[0019]在本专利技术的一较佳实施方式中,步骤S3中,避免与障碍物碰撞的约束为:
[0020][0021]其中,z
o
=(x
o
,y
o
,z
o
)表示障碍物位置,表示智能体与障碍物之间需要保持的安全距离;
[0022]避免与我方智能体碰撞的约束为:
[0023][0024]其中,d
ik
表示智能体i与智能体k的相对距离,为各智能体之间的安全距离;
[0025]智能体的飞行约束为:
[0026]v
min
≤v
i
(t)≤v
max
[0027][0028][0029][0030]其中,v
min
,v
max
分别表示智能体的最小安全飞行速度和最大安全飞行速度,分别表示智能体的最小安全飞行速度和最大安全飞行速度,分别为x轴、y轴和z轴方向的最大过载。
[0031]在本专利技术的一较佳实施方式中,步骤S4中,第i个智能体的总目标函数J
i
为:
[0032][0033]其中,
[0034][0035]z
t
=(x
t
,y
t
,z
t
)表示目标位置,表示敌方智能体j的位置,表示智能体与拦截器之间的安全距离,N表示预测时域,L
i
(t+l)表示第i个智能体在当前时刻t预测第l步的目标函数,β
i
表示与敌方相距距离的惩罚因子,ρ
i
表示控本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分布式模型预测控制的多智能体协同突防打击方法,其特征在于,包括以下步骤:S1、构建多智能体动力学模型;S2、根据多智能体动力学模型和时间步长,构建多智能体的更新系统模型;S3、制定飞行约束条件,包括避免与障碍物碰撞的约束,避免与我方智能体碰撞的约束,和智能体的飞行约束;S4、将避免与敌方智能体的碰撞条件作为软约束考虑在目标函数中,构建智能体的总目标函数;S5、根据多智能体的更新系统模型、飞行约束条件和智能体的总目标函数,构建多智能体协同突防打击模型;S6、基于分布式MPC算法,对避免与我方智能体碰撞的约束进行解耦处理,以及在任意时刻,有且仅有一个智能体求解多智能体协同突防打击模型,得到未来的控制输入,更新控制输入序列,其它智能体则各自采用自身上一次更新获得的控制输入序列。2.根据权利要求1所述基于分布式模型预测控制的多智能体协同突防打击方法,其特征在于,步骤S1中,多智能体动力学模型为:其中,其中,表示x
i
关于t求导,N
g
表示智能体个数,L表示智能体集合,v
i
(t),χ
i
(t),γ
i
(t)分别表示智能体i的速度、偏航角和俯仰角,g表示重力加速度,分别表示智能体i在x轴、y轴和z轴方向的过载,智能体i的状态向量x
i
=[x
i
,y
i
,z
i
,v
i

i

i
]∈R6,控制向量R表示实数空间,x
i
(t),y
i
(t),z
i
(t)分别表示智能体i在x轴、y轴和z轴的位置,z
i
(t)=(x
i
(t),y
i
(t),z
i
(t))。3.根据权利要求1或2所述基于分布式模型预测控制的多智能体协同突防打击方法,其特征在于,步骤S2中,多智能体的更新系统模型为Δt表示时间步长。4.根据权利要求3所述基于分布式模型预测控制的多智能体协同突防打击方法,其特征在...

【专利技术属性】
技术研发人员:李彬王宇张鸿运史明明郝明瑞邹晓滢
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1