面向动态威胁区的多飞行器强化学习时空协同制导方法技术

技术编号:46417280 阅读:6 留言:0更新日期:2025-09-19 20:28
本申请涉及一种面向动态威胁区的多飞行器强化学习时空协同制导方法,包括构建多飞行器运动学模型,并确定时空约束条件;构建障碍物模型;获取飞行器周围环境信息,飞行器周围环境信息包括障碍物位置、飞行器状态和目标位置;基于多飞行器运动学模型、障碍物模型和飞行器周围环境信息,采用深度强化学习算法,得到IFDS算法的参数;IFDS算法的参数包括排斥参数、切向参数和旋转角度参数;根据飞行器周围环境信息和IFDS算法的参数,采用IFDS算法生成各飞行器到目标位置的避障航迹。本申请利用深度强化学习算法动态调整IFDS算法参数,使多飞行器在复杂、不确定环境中实现时空协同打击,提高动态环境适应性。

【技术实现步骤摘要】

本申请涉及协同制导领域,具体地,涉及一种面向动态威胁区的多飞行器强化学习时空协同制导方法


技术介绍

1、随着现代反导武器以及防御体系的快速发展,单体飞行器的性能提升已经难以匹配愈加复杂的任务需求,多飞行器协同成为重要的研究方向,呈现出集群化、智能化趋势。多飞行器通过彼此间的信息交互,利用协同制导控制技术提高整体性能。

2、飞行器的协同包括时间协同和空间协同,然而现有研究只针对单一的协同攻击场景,未考虑更为复杂的环境情况,例如环境中存在多个障碍物。对于多飞行器航行过程中突然遭遇的障碍物,如何设计兼顾计算效率和鲁棒性的协同航迹规划方法是值得研究的问题。这就在原来的协同研究基础上,增加了对复杂环境中的障碍进行规避的内容。

3、对于传统的避障研究,大多集中于无人机和机器人领域,常见的方法有artificial potential field,apf、rrt、a*等。其中ifds(interfered fluid dynamicalsystem)算法由于具有能够快速响应环境变化、生成的路径自然平滑等优势,成为避障算法领域的研究热点。然而,i本文档来自技高网...

【技术保护点】

1.一种面向动态威胁区的多飞行器强化学习时空协同制导方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述多飞行器运动学模型为:

3.如权利要求1所述的方法,其特征在于,所述时空约束条件包括时间约束和空间约束:

4.如权利要求1所述的方法,其特征在于,所述障碍物模型为:

5.如权利要求1所述的方法,其特征在于,所述深度强化学习算法的状态空间为:

6.如权利要求1所述的方法,其特征在于,所述深度强化学习算法的动作空间为:

7.如权利要求1所述的方法,其特征在于,所述深度强化学习算法的奖励函数为:

...

【技术特征摘要】

1.一种面向动态威胁区的多飞行器强化学习时空协同制导方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述多飞行器运动学模型为:

3.如权利要求1所述的方法,其特征在于,所述时空约束条件包括时间约束和空间约束:

4.如权利要求1所述的方法,其特征在于,所述障碍物模型为:

5.如权利要求1所述的方法,其特征在于,所述深度强化学习算法的状态空间为:

6.如权利要求1所述的方法,其特征在于,所述深度强化学习算法的动作空间为:

7.如权利要求1所述的方法...

【专利技术属性】
技术研发人员:郭杨刘福聪王少博王晋王永超胡庆雷闫循良王夏复张仕源付泽斌刘征全王浩楠
申请(专利权)人:中国人民解放军火箭军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1