基于RL-MPC四轮巡检机器人的路径跟踪方法、系统、设备及介质技术方案

技术编号:44961824 阅读:30 留言:0更新日期:2025-04-12 01:32
本发明专利技术公开了一种基于RL‑MPC四轮巡检机器人的路径跟踪方法、系统、设备及介质,包括:获取四轮巡检机器人当前的路径跟踪误差、速度及航向角信息;将所述四轮巡检机器人当前的路径跟踪误差、速度及航向角信息作为Q‑learning方法训练的奖励,动态计算MPC的预测时域Np及控制时域Nc;根据MPC的预测时域Np及控制时域Nc求解目标函数得到前轮转向参数,控制四轮巡检机器人跟踪路径,该方法、系统、设备及介质的路径跟踪效果较好。

【技术实现步骤摘要】

本专利技术属于智能优化控制算法领域,涉及一种基于rl-mpc四轮巡检机器人的路径跟踪方法、系统、设备及介质。


技术介绍

1、智能巡检机器人作为智慧电场的重要组成,在电力领域已经得到了广泛应用。实现其导航的本质是通过控制器前轮转向来使得机器人按照一条已经计划好的路线行进,所以需要一种合适的控制算法解决路径跟踪问题。

2、模型预测控制(mpc)作为一种预测控制算法,通过前瞻性优化避免临时调整,使路径跟踪不仅依赖当前时刻的状态,还考虑到未来的行为,以此减少震荡或不稳定的转向,而且算法能够处理状态约束(如车速)和控制约束(如转角),使得跟踪过程不出现超出物理限制的情况。另一方面,在传统路径跟踪方法中,路径规划和控制是两个独立的过程,而mpc中规划和控制通过一个优化框架共同解决。mpc在优化控制输入时,会同时考虑目标路径和当前状态,使得路径规划和控制过程无缝连接。因此,mpc是轮式机器人跟随问题的一个高精度、稳定性强的解决方案。

3、模型预测控制算法的核心是求解目标函数,其中,影响目标函数求解的最重要的两个参数是预测时域和控制时域。预测时域是本文档来自技高网...

【技术保护点】

1.一种基于RL-MPC四轮巡检机器人的路径跟踪方法,其特征在于,包括:

2.根据权利要求1所述的基于RL-MPC四轮巡检机器人的路径跟踪方法,其特征在于,Q-learning方法在训练过程中的奖励函数为:

3.根据权利要求1所述的基于RL-MPC四轮巡检机器人的路径跟踪方法,其特征在于,Q-learning方法在训练过程中更新公式为:

4.根据权利要求1所述的基于RL-MPC四轮巡检机器人的路径跟踪方法,其特征在于,根据MPC的预测时域Np及控制时域Nc的值求解四轮巡检机器人控制参数过程中的目标函数为:

5.一种基于RL-MPC四轮巡检机...

【技术特征摘要】

1.一种基于rl-mpc四轮巡检机器人的路径跟踪方法,其特征在于,包括:

2.根据权利要求1所述的基于rl-mpc四轮巡检机器人的路径跟踪方法,其特征在于,q-learning方法在训练过程中的奖励函数为:

3.根据权利要求1所述的基于rl-mpc四轮巡检机器人的路径跟踪方法,其特征在于,q-learning方法在训练过程中更新公式为:

4.根据权利要求1所述的基于rl-mpc四轮巡检机器人的路径跟踪方法,其特征在于,根据mpc的预测时域np及控制时域nc的值求解四轮巡检机器人控制参数过程中的目标函数为:

5.一种基于rl-mpc四轮巡检机器人的路径跟踪系统,其特征在于,包括:

6.根据权利要求5所述的基于rl-mpc四轮巡检机器人的路径跟踪系统,其特征在于,q-learning方法训练过程中的奖励函数...

【专利技术属性】
技术研发人员:高鑫曹亚宁王佳惠黄茂宋志超
申请(专利权)人:华能宁夏能源有限公司灵武隆桥分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1