一种实时路径寻优和机动规避行动规划方法和装置制造方法及图纸

技术编号：41516187 阅读：21 留言：0更新日期：2024-05-30 14:53

本发明专利技术公开一种实时路径寻优和机动规避行动规划方法和装置，包括以下步骤：步骤S1、获取路网拓扑图与蓝方侦察单元轨道数据；步骤S2、根据路网拓扑图与蓝方侦察单元轨道数据、红方路网机动单元轨道数据，得到强化学习模型所需训练集；步骤S3、构建强化学习模型；步骤S4、根据所述训练集训练强化学习模型；步骤S5、在实际规划中的每一个决策时刻，对每个路网机动单元，根据训练好的强化学习模型，从动作空间中选取最优动作作为当前时刻的机动策略。采用本发明专利技术的技术方案，能够有效刻画蓝方侦察单元时序信息，并以此为基础为红方路网机动单元规划机动路径和速度，使其在尽可能快速且尽可能不被侦察到的任务目标下到达终点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于路径规划，尤其涉及一种实时路径寻优和机动规避行动规划方法和装置。

技术介绍

1、在地面战场环境中，红方作战车辆及装备的战场机动是侦察、打击、运输等各项作战任务的基石。由于地面战场环境中的机动行为受地形和装备性能限制较大，通常只能在指定路网图上实现快速、安全机动，而蓝方的侦察行为则多来源于卫星、无人机等受地形限制较小的空中单元。目前，针对这一实时博弈对抗及路径规划问题的研究较少，主要采用多次离线规划的方法，无法有效利用蓝方侦察单元的时序信息。

技术实现思路

1、本专利技术要解决的技术问题是，提供一种实时路径寻优和机动规避行动规划方法和装置，能够有效刻画蓝方侦察单元时序信息，并以此为基础为红方路网机动单元规划机动路径和速度，使其在尽可能快速且尽可能不被侦察到的任务目标下到达终点。

2、为实现上述目的，本专利技术采用如下的技术方案：

3、一种实时路径寻优和机动规避行动规划方法，包括以下步骤：

4、步骤s1、获取路网拓扑图与蓝方侦察单元轨道数据；</p>

5、步骤本文档来自技高网...

【技术保护点】

1.一种实时路径寻优和机动规避行动规划方法，其特征在于，包括以下步骤：

2.如权利要求1所述的实时路径寻优和机动规避行动规划方法，其特征在于，步骤S3中，使用变种的深度Q网络构建强化学习模型。

3.如权利要求2所述的实时路径寻优和机动规避行动规划方法，其特征在于，步骤S4中，使用基于梯度下降的优化器训练强化学习模型。

4.如权利要求3所述的实时路径寻优和机动规避行动规划方法，其特征在于，步骤S5中，所述机动策略根据各个动作的总评分选取最优获得，每个动作的总评分由应用该动作所产生的单步奖励和训练好的强化学习模型对该动作后继状态的评分求和得到。

...

【技术特征摘要】

1.一种实时路径寻优和机动规避行动规划方法，其特征在于，包括以下步骤：

2.如权利要求1所述的实时路径寻优和机动规避行动规划方法，其特征在于，步骤s3中，使用变种的深度q网络构建强化学习模型。

3.如权利要求2所述的实时路径寻优和机动规避行动规划方法，其特征在于，步骤s4中，使用基于梯度下降的优化器训练强化学习模型。

4.如权利要求3所述的实时路径寻优和机动规避行动规划方法，其特征在于，步骤s5中，所述机动策略根据各个动作的总评分选取最优获得，每个动作的总评分由应用该动作所产生的单步奖励和训练好的强化学习模型对该动作后继状态的评分求和得到。

5.如权利要求4所述的实时路径寻优和机动规避行动规划方法，其特征在于，步骤s2中，基于实时路径寻优和机动规避任务，根据路网拓扑图和蓝方侦察单元轨道数据、红方路网机动单元与环境的交互数据，构建强化学习模型所需...

【专利技术属性】
技术研发人员：曾梦祺，瞿继双，
申请(专利权)人：中电普信长沙科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人