当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于策略梯度的无人机多目标最优控制方法和设备技术

技术编号:33201920 阅读:81 留言:0更新日期:2022-04-24 00:40
本发明专利技术涉及一种基于策略梯度的无人机多目标最优控制方法,具体包括以下步骤:S1、获取无人机在目标飞行区间中离散时间非线性系统的多个性能指标,构建相应的状态

【技术实现步骤摘要】
一种基于策略梯度的无人机多目标最优控制方法和设备


[0001]本专利技术涉及人工智能和最优控制领域的交汇融合领域,尤其是涉及一种基于策略梯度的无人机多目标最优控制方法和设备。

技术介绍

[0002]近年来,“智能制造”的发展使得工业领域经历了从电气化到智能化的变革,控制系统的规模变大,复杂性提高,这推动了人工智能和先进控制技术的深度融合。在工程实践中,很多问题会涉及到多个待优化的目标。例如在飞行器控制领域,考虑无人机执行悬停任务的过程中,需要使之与目标位置的误差尽可能小以完成指定任务,同时使无人机消耗的能量尽可能小。多目标最优控制问题就是寻找这样一个最优解,使系统稳定,使多个性能指标在一定意义下同时达到最小值。目前主要的解决方案可以分为两大类。第一种叫做标量化方法,即根据每个目标的重要性来设定相应的偏好,从而将多目标问题转化为单目标问题来解决。第二个是引入帕累托最优的概念。F.Logist等人利用交替标量多目标优化技术,将原问题转化为一系列参数化的单目标优化问题。A.Kumar等人提出了一种新的求解积分约束下多目标最优控制问题的有效数值方法。G本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于策略梯度的无人机多目标最优控制方法,其特征在于,具体包括以下步骤:S1、获取无人机在目标飞行区间中离散时间非线性系统的多个性能指标,构建相应的状态

动作价值函数;S2、获取一个在容许控制集内的初始控制策略;S3、根据多个状态

动作价值函数和当前的控制策略进行策略评估,得到策略评估结果;S4、根据步骤S3的策略评估结果,结合梯度下降的方法进行策略改进,得到优化控制策略,判断优化控制策略是否满足预设的收敛条件,若否返回步骤S3,若是则将相应的优化控制策略作为最终的无人机控制策略。2.根据权利要求1所述的一种基于策略梯度的无人机多目标最优控制方法,其特征在于,所述步骤S1中离散时间非线性系统F的公式如下所示:x
k+1
=F(x
k
,u
k
)其中,x
k
和u
k
分别代表系统的状态输入和控制输入。3.根据权利要求2所述的一种基于策略梯度的无人机多目标最优控制方法,其特征在于,所述性能指标的公式如下所示:其中,N为无人机的总个数,J
j
是第j个无人机的性能指标,j=1,...,N,为效用函数,其中W
j
(u)和S
j
(x)都是正定函数,整体性能指标表示为J=[J1,...,J
N
]
T
。4.根据权利要求3所述的一种基于策略梯度的无人机多目标最优控制方法,其特征在于,所述状态

动作价值函数的公式如下所示:其中,Q
(j,u)
为第j个状态

动作价值函数...

【专利技术属性】
技术研发人员:张皓丁怡王祝萍张长柱黄超
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1