当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于强化学习的无人机导航避障控制律设计方法技术

技术编号:42660851 阅读:122 留言:0更新日期:2024-09-10 12:18
本发明专利技术公开一种基于强化学习的无人机导航避障控制律设计方法,包括以下步骤:建立无人机导航避障仿真训练环境;构建无人机的马尔科夫决策模型;训练引入时序注意力的深度强化学习SAC算法,以获取具有根据环境状态做出合适控制动作的神经网络参数;部署训练好的神经网络模型,进行导航避障任务。通过引入时序信息的无人机导航避障马尔可夫决策模型,训练引入时序注意力的深度强化学习算法,使其能够获知之前一段时间的飞行状态及障碍物信息,以达到加快算法收敛速度、提高任务成功率,并实现了无人机的全自动导航避障任务,为复杂环境中无人机自主、安全、有效的导航避障提供了实际有效的思路。

【技术实现步骤摘要】

本专利技术属于智能控制律设计领域,具体地说,涉及到一种基于强化学习的无人机导航避障控制律设计方法


技术介绍

1、近年来,无人机(unmanned aerial vehicle,uav)在军事和民事的各应用方面都展现了很好的前景,例如灾害救援、野生动物保护、军事侦察和远程监控等。无人机具有灵活性高、机动性能强等显著优点,使得任务执行更加高效,降低了人为因素带来的成本和风险,具有重要的研究价值和应用前景。

2、要完成这样的任务,就需要一种在没有人为干扰的情况下执行所需任务的控制律,但是许多研究集中在完全已知和静态环境中的无人机导航上。例如使用a*算法、随机树来搜索无人机的可用路径,或使用pid和遗传算法来实现导航,这些方法需要提前知悉任务中的完整信息或无人机会遇到的所有情况,再根据这些信息通过无线远程操作或预编程相关算法来进行控制。

3、然而,在实际部署中会受到诸多限制,首先,在密集、动态的障碍物环境中,我们很难获得有关无人机环境的完整信息来制定严格的图或模型,这使得上述算法的设计和部署会很困难或健壮性不足;其次,高精度、端到端的环境本文档来自技高网...

【技术保护点】

1.一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:

3.根据权利要求1所述的一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:

4.根据权利要求1所述的一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:

5.根据权利要求4所述的一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:

6.根据权利要求1所述的一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:

【技术特征摘要】

1.一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:

3.根据权利要求1所述的一种基于强化学习的无人机导航避障控制律设计方法,其特征在于:

<...

【专利技术属性】
技术研发人员:刘树远常兴华刘化勇陈亮中王靖宇张来平姜屹
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1