The invention provides an implementation method of adaptive multi-target tracking for UAV, which relates to the field of flight control. By calculating the state space and motion equation of UAV and solving the objective function, the flight state and tracking trajectory of UAV in the whole time domain can be obtained by cyclic calculation. The beneficial effect of the present invention is that the adaptive target tracking of UAV is studied based on reinforcement learning, POMDP framework is constructed, and belief optimization method is selected to solve POMDP problem, so that the objective function is easy to solve and the calculation amount is small. The convergence of the method is also verified by simulation. The simulation results show that the flight trajectory of UAV is smooth and adaptable, and it can track the target adaptively.
【技术实现步骤摘要】
无人机自适应多目标跟踪的实现方法
本专利技术涉及飞行控制领域,尤其是一种无人机的跟踪方法。
技术介绍
由于当今飞行环境复杂而且信息难以获取,无人机仅依靠地面指挥中心提拱的信息进行跟踪已经难以成事,因此如何使得无人机能自发的适应环境并且高效、精确的跟踪目标就显得尤为重要。强化学习(ReinforcementLearning)是一种智能体跟环境不断交互且学习方式跟策略有关的学习,强化学习的模型如图1所示。强化学习的核心在于使收益长期最大化。无人机自适应跟踪问题的核心在于如何选取下一步的最佳飞行动作,所以无人机跟踪问题可以看成是强化学习问题,因此可以建立无人机自适应多目标跟踪控制的强化学习框架,如图2所示。由于强化学习决策出来的每一个状态-行为对都是离散值,且具有马尔科夫性质,因此解决此类满足马尔科夫性质的强化学习问题,其实就是解决部分可观马尔科夫决策过程(POMDP)问题。现有解决POMDP问题的方法有启发式ECTG、参数近似、policyrollout、hindsightoptimization、foresightoptimization等。但是这些方法在解决目标函 ...
【技术保护点】
1.一种无人机自适应多目标跟踪的实现方法,其特征在于包括下述步骤:步骤1:状态空间状态空间分为系统状态和信念状态,其中系统状态包含无人机状态、目标状态和跟踪状态,在t时刻系统状态表示为χt=(st,ζt,ξt,Pt),其中st为无人机的状态,ζt为目标的状态,(ξt,Pt)为跟踪状态,具体为:无人机的状态:
【技术特征摘要】
1.一种无人机自适应多目标跟踪的实现方法,其特征在于包括下述步骤:步骤1:状态空间状态空间分为系统状态和信念状态,其中系统状态包含无人机状态、目标状态和跟踪状态,在t时刻系统状态表示为χt=(st,ζt,ξt,Pt),其中st为无人机的状态,ζt为目标的状态,(ξt,Pt)为跟踪状态,具体为:无人机的状态:其中,表示无人机的位置,表示无人机的速度,θt表示无人机的航向角;第i个目标的状态:其中,i=1,2,...,n,n为目标的数量,表示目标的位置,表示目标在x,y轴上的速度分量;对于第i个目标的跟踪状态:为滤波后目标状态估计值,Pti为滤波后目标状态的估计协方差;信念状态指的是系统整体状态的后验分布,在t时刻为:其中,无人机的信念状态为跟踪信念状态为目标信念状态为步骤2:无人机运动方程无人机在t时刻的状态为行动量ut=(at,φt),at为加速度,φt为转向角,无人机的运动方程如下:θt+1=θt+(gTtan(φt)/vt)(2-4)其中T为仿真步长,为无人机t+1时刻的位置,为t+1时刻无人机的速度,θt+1为t+1时刻无人机的航向角,g为重力加速度,[vmin,vmax]为速度的大小限制;步骤3:目标运动方程第i个目标在t时刻的运动状态更新如下:其中,为第i个目标在t+1时刻的状态,F为状态转移矩阵,为目标的过程噪声,且Q为过程噪声的协方差矩阵;步骤4:目标状态测量已知t时刻无人机和第i个目标的位置矢量,为位置协方差矩阵;依照step1.1到step1.3计算Step1.1:无人机与目标之间的有效距离和夹角为:实际距离为:有效距...
【专利技术属性】
技术研发人员:李波,马浩,高晓光,万开方,符小卫,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。