【技术实现步骤摘要】
本专利技术涉及无人机导航,尤其涉及一种基于深度强化学习和pid控制器的无人机导航方法。
技术介绍
1、无人机技术的迅猛发展已经使其在各种应用领域中变得越来越重要,其中之一是无人机在导航任务中的应用。这些任务涵盖了广泛的应用领域,包括搜索与救援、农业、环境监测、交通监管和无人机配送等。在这些任务中,无人机需要根据环境中的感知信息和任务目标来做出决策,以实现精确的位置控制和轨迹跟踪。传统的比例-积分-微分proportional-integral-derivative, pid控制方法在无人机导航中被广泛使用,它们通常能够提供稳定的性能。然而,pid控制方法无法很好地处理复杂的非线性系统,且通常需要手动调整参数,这在大规模应用中受到限制。
2、随着深度学习和强化学习的不断发展,逐渐衍生出一个新兴的交叉领域,即深度强化学习deep reinforcement learning, drl。深度强化学习为智能体提供了一种端到端学习策略的方式,具有可处理复杂非线性问题等优点,因此被广泛用于解决路径导航、路径规划等问题。然而,目前深度强化
...【技术保护点】
1.一种基于深度强化学习和PID控制器的无人机导航方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于深度强化学习和PID控制器的无人机导航方法,其特征在于:在步骤S1中,所述无人机状态信息,其中,为t时刻无人机当前所在位置的x轴坐标,为t时刻无人机当前所在位置的y轴坐标,为t时刻无人机当前所在位置的z轴坐标,为t时刻无人机的滚转角,为t时刻无人机的俯仰角,为t时刻无人机的偏航角,为t时刻无人机在x轴上的线速度分量,为t时刻无人机在y轴上的线速度分量,为t时刻无人机在z轴上的线速度分量,为t时刻无人机的角速度,为无人机携带的雷达测距仪反馈的障
...【技术特征摘要】
1.一种基于深度强化学习和pid控制器的无人机导航方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于深度强化学习和pid控制器的无人机导航方法,其特征在于:在步骤s1中,所述无人机状态信息,其中,为t时刻无人机当前所在位置的x轴坐标,为t时刻无人机当前所在位置的y轴坐标,为t时刻无人机当前所在位置的z轴坐标,为t时刻无人机的滚转角,为t时刻无人机的俯仰角,为t时刻无人机的偏航角,为t时刻无人机在x轴上的线速度分量,为t时刻无人机在y轴上的线速度分量,为t时刻无人机在z轴上的线速度分量,为t时刻无人机的角速度,为无人机携带的雷达测距仪反馈的障碍物信息,为无人机已执行的动作次数;所述目标为无人机需要到达的位置坐标。
3.根据权利要求1所述的一种基于深度强化学习和pid控制器的无人机导航方法,其特征在于:在步骤s2中,所述深度强化学习网络包括动作网络、q值网络、原始经验存储池、经验扩展模块、经验回放池,其依次连接构成;所述pid控制器模块包括位置控制器、姿态控制器。
4.根据权利要求1所述的一种基于深度强化学习和pid控制器的无人机导航方法,其特征在于:在步骤s2中,具体过程包括以下步骤:...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。