【技术实现步骤摘要】
本专利技术属于路径规划,尤其涉及一种实时路径寻优和机动规避行动规划方法和装置。
技术介绍
1、在地面战场环境中,红方作战车辆及装备的战场机动是侦察、打击、运输等各项作战任务的基石。由于地面战场环境中的机动行为受地形和装备性能限制较大,通常只能在指定路网图上实现快速、安全机动,而蓝方的侦察行为则多来源于卫星、无人机等受地形限制较小的空中单元。目前,针对这一实时博弈对抗及路径规划问题的研究较少,主要采用多次离线规划的方法,无法有效利用蓝方侦察单元的时序信息。
技术实现思路
1、本专利技术要解决的技术问题是,提供一种实时路径寻优和机动规避行动规划方法和装置,能够有效刻画蓝方侦察单元时序信息,并以此为基础为红方路网机动单元规划机动路径和速度,使其在尽可能快速且尽可能不被侦察到的任务目标下到达终点。
2、为实现上述目的,本专利技术采用如下的技术方案:
3、一种实时路径寻优和机动规避行动规划方法,包括以下步骤:
4、步骤s1、获取路网拓扑图与蓝方侦察单元轨道数据;<
...【技术保护点】
1.一种实时路径寻优和机动规避行动规划方法,其特征在于,包括以下步骤:
2.如权利要求1所述的实时路径寻优和机动规避行动规划方法,其特征在于,步骤S3中,使用变种的深度Q网络构建强化学习模型。
3.如权利要求2所述的实时路径寻优和机动规避行动规划方法,其特征在于,步骤S4中,使用基于梯度下降的优化器训练强化学习模型。
4.如权利要求3所述的实时路径寻优和机动规避行动规划方法,其特征在于,步骤S5中,所述机动策略根据各个动作的总评分选取最优获得,每个动作的总评分由应用该动作所产生的单步奖励和训练好的强化学习模型对该动作后继状态的评分求
...
【技术特征摘要】
1.一种实时路径寻优和机动规避行动规划方法,其特征在于,包括以下步骤:
2.如权利要求1所述的实时路径寻优和机动规避行动规划方法,其特征在于,步骤s3中,使用变种的深度q网络构建强化学习模型。
3.如权利要求2所述的实时路径寻优和机动规避行动规划方法,其特征在于,步骤s4中,使用基于梯度下降的优化器训练强化学习模型。
4.如权利要求3所述的实时路径寻优和机动规避行动规划方法,其特征在于,步骤s5中,所述机动策略根据各个动作的总评分选取最优获得,每个动作的总评分由应用该动作所产生的单步奖励和训练好的强化学习模型对该动作后继状态的评分求和得到。
5.如权利要求4所述的实时路径寻优和机动规避行动规划方法,其特征在于,步骤s2中,基于实时路径寻优和机动规避任务,根据路网拓扑图和蓝方侦察单元轨道数据、红方路网机动单元与环境的交互数据,构建强化学习模型所需...
【专利技术属性】
技术研发人员:曾梦祺,瞿继双,
申请(专利权)人:中电普信长沙科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。