当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于深度强化学习和PID控制器的无人机导航方法技术

技术编号:40106560 阅读:17 留言:0更新日期:2024-01-23 18:30
本发明专利技术涉及一种基于深度强化学习和PID控制器的无人机导航方法,包括:获取无人机执行导航任务时的无人机状态向量;构建深度强化学习网络,将无人机状态向量输入深度强化学习网络中获取原始经验并将原始经验存储进原始经验存储池中;将原始经验存储池中的原始经验输入经验扩展模块得到扩展经验,利用扩展经验更新深度强化学习网络得到训练后的深度强化学习模型;重新获取无人机状态向量,输入到训练后的深度强化学习网络中,输出控制命令指引无人机完成导航。本发明专利技术在包含真实动力学的无人机导航任务中高效规划无人机路径,并使用PID控制器控制高仿真无人机飞行,最终使无人机沿着高效路径安全、平稳、无碰撞地到达目标区域,实现避障导航全过程。

【技术实现步骤摘要】

本专利技术涉及无人机导航,尤其涉及一种基于深度强化学习和pid控制器的无人机导航方法。


技术介绍

1、无人机技术的迅猛发展已经使其在各种应用领域中变得越来越重要,其中之一是无人机在导航任务中的应用。这些任务涵盖了广泛的应用领域,包括搜索与救援、农业、环境监测、交通监管和无人机配送等。在这些任务中,无人机需要根据环境中的感知信息和任务目标来做出决策,以实现精确的位置控制和轨迹跟踪。传统的比例-积分-微分proportional-integral-derivative, pid控制方法在无人机导航中被广泛使用,它们通常能够提供稳定的性能。然而,pid控制方法无法很好地处理复杂的非线性系统,且通常需要手动调整参数,这在大规模应用中受到限制。

2、随着深度学习和强化学习的不断发展,逐渐衍生出一个新兴的交叉领域,即深度强化学习deep reinforcement learning, drl。深度强化学习为智能体提供了一种端到端学习策略的方式,具有可处理复杂非线性问题等优点,因此被广泛用于解决路径导航、路径规划等问题。然而,目前深度强化学习在无人机导航中应本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习和PID控制器的无人机导航方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度强化学习和PID控制器的无人机导航方法,其特征在于:在步骤S1中,所述无人机状态信息,其中,为t时刻无人机当前所在位置的x轴坐标,为t时刻无人机当前所在位置的y轴坐标,为t时刻无人机当前所在位置的z轴坐标,为t时刻无人机的滚转角,为t时刻无人机的俯仰角,为t时刻无人机的偏航角,为t时刻无人机在x轴上的线速度分量,为t时刻无人机在y轴上的线速度分量,为t时刻无人机在z轴上的线速度分量,为t时刻无人机的角速度,为无人机携带的雷达测距仪反馈的障碍物信息,为无人机已...

【技术特征摘要】

1.一种基于深度强化学习和pid控制器的无人机导航方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度强化学习和pid控制器的无人机导航方法,其特征在于:在步骤s1中,所述无人机状态信息,其中,为t时刻无人机当前所在位置的x轴坐标,为t时刻无人机当前所在位置的y轴坐标,为t时刻无人机当前所在位置的z轴坐标,为t时刻无人机的滚转角,为t时刻无人机的俯仰角,为t时刻无人机的偏航角,为t时刻无人机在x轴上的线速度分量,为t时刻无人机在y轴上的线速度分量,为t时刻无人机在z轴上的线速度分量,为t时刻无人机的角速度,为无人机携带的雷达测距仪反馈的障碍物信息,为无人机已执行的动作次数;所述目标为无人机需要到达的位置坐标。

3.根据权利要求1所述的一种基于深度强化学习和pid控制器的无人机导航方法,其特征在于:在步骤s2中,所述深度强化学习网络包括动作网络、q值网络、原始经验存储池、经验扩展模块、经验回放池,其依次连接构成;所述pid控制器模块包括位置控制器、姿态控制器。

4.根据权利要求1所述的一种基于深度强化学习和pid控制器的无人机导航方法,其特征在于:在步骤s2中,具体过程包括以下步骤:...

【专利技术属性】
技术研发人员:任璐冯士营柳文章孙长银
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1