基于强化学习的无人机路径规划方法及相关设备技术

技术编号:41870169 阅读:25 留言:0更新日期:2024-07-02 00:20
本公开提供一种基于强化学习的无人机路径规划方法及相关设备。所述方法包括:获取第一无人机的第一状态;基于第一无人机的第一状态和第一动作,确定第一无人机的下一状态;确定第一无人机从第一状态运行到下一状态对应的第一奖励,基于第一奖励和更新次数确定第一强化值;响应于第一强化值满足预设的条件,对第一状态进行更新得到下一状态;基于第一状态中的第一初始位置和下一状态中的第一目标位置,确定第一无人机的第一最佳路径;基于第一最佳路径确定第二无人机的第二状态;通过延迟强化学习算法对第二状态进行递归处理,得到第二无人机的第二最佳路径。

【技术实现步骤摘要】

本公开涉及数据处理,尤其涉及一种基于强化学习的无人机路径规划方法及相关设备


技术介绍

1、在许多地区或应急场景中,建立网络覆盖面临着巨大的挑战,有效的路径规划可以确保无人机在网络覆盖有困难的区域内高效地工作,最大程度地满足通信和数据传输需求。然而,当前对无人机路径进行规划时,不能准确地对无人机组网中的每个无人机的最佳路径进行规划。

2、有鉴于此,如何准确地对无人机组网中的每个无人机的最佳路径进行规划成为亟待解决的问题。


技术实现思路

1、有鉴于此,本公开的目的在于提出一种基于强化学习的无人机路径规划方法及相关设备用以解决或部分解决上述技术问题。

2、基于上述目的,本公开的第一方面提出了一种基于强化学习的无人机路径规划方法,所述方法包括:

3、获取第一无人机的第一状态;其中,所述第一状态包括:第一初始位置、第一飞行时间和第一剩余能量;

4、基于所述第一无人机的第一状态和第一动作,确定所述第一无人机的下一状态;

5、确定所述第一无人机从所述第一状态运行本文档来自技高网...

【技术保护点】

1.一种基于强化学习的无人机路径规划方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述第一无人机从所述第一状态运行到所述下一状态对应的第一奖励,包括:

3.根据权利要求2所述的方法,其特征在于,所述确定所述第一状态中的第一飞行时间以及所述下一状态中的下一飞行时间,包括:

4.根据权利要求3所述的方法,其特征在于,所述确定所述第一无人机从所述第一状态运行到所述下一状态对应的移动时间,包括:

5.根据权利要求1所述的方法,其特征在于,在所述获取第一无人机的第一状态之前,还包括:

<p>6.根据权利要求...

【技术特征摘要】

1.一种基于强化学习的无人机路径规划方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述第一无人机从所述第一状态运行到所述下一状态对应的第一奖励,包括:

3.根据权利要求2所述的方法,其特征在于,所述确定所述第一状态中的第一飞行时间以及所述下一状态中的下一飞行时间,包括:

4.根据权利要求3所述的方法,其特征在于,所述确定所述第一无人机从所述第一状态运行到所述下一状态对应的移动时间,包括:

5.根据权利要求1所述的方法,其特征在于,在所述获取第一无人机的第一状态之前,还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述第一最佳路径确定第二无人机的第二状态,包括:

7.根据权利要求1所述的方法,其特征在于,还包括:

8.一种基于强化学习的无人机路径规划装置,其特征在于,包括:

9.根...

【专利技术属性】
技术研发人员:朱红蒋承伶王艳茹王文帝欧清海马文洁张明张宁池孙凯刘卉邵苏杰宋继高章林张英帅刘椿枫郭少勇张洁王颖石慧何海洋
申请(专利权)人:国网江苏省电力有限公司南京供电分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1