一种基于强化学习的全向小车轨迹跟踪最优控制方法技术

技术编号:43133783 阅读:14 留言:0更新日期:2024-10-29 17:40
本发明专利技术属于强化学习和最优控制技术领域,具体公开了一种基于强化学习的全向小车轨迹跟踪最优控制方法,包括以下步骤:建立全向小车的轨迹运动学模型和动力学模型;基于全向小车的轨迹运动学模型和动力学模型,设计基于神经网络求解的全向小车轨迹跟踪最优控制算法;基于全向小车的轨迹跟踪最优控制算法和持续激励条件,分析全向小车系统的一致最终有界稳定性,完成基于强化学习的全向小车轨迹跟踪最优控制方法。本发明专利技术解决了传统控制算法对HJB方程求解困难的问题,并解除了初始控制策略须为容许控制的条件限制,实现了对全向小车轨迹跟踪的最优控制。

【技术实现步骤摘要】

本专利技术属于强化学习和最优控制,具体涉及一种基于强化学习的全向小车轨迹跟踪最优控制方法的设计。


技术介绍

1、全向小车由于其灵活的运动能力和高效的机动性能,广泛应用于工业自动化、物流运输以及服务机器人等领域。随着自动化和人工智能技术的不断发展,仅仅追求控制性能的提升已经无法满足实际应用的需求,如何解决控制性能与输入能耗的优化问题越来越受到相关专家学者的关注和研究。

2、然而,传统的最优控制算法在应对全向小车这类非线性系统时,常常面临 hjb(哈密尔顿-雅可比-贝尔曼)方程求解困难的问题。这是因为 hjb方程的非线性和耦合特性使得解析求解几乎不可能。此外,传统最优控制算法在设计初始控制策略时,通常需要确保策略的容许性,这进一步增加了设计全向小车轨迹跟踪最优控制器的复杂性。

3、目前,主流的全向小车轨迹跟踪最优控制方法包括自适应动态规划、模糊控制和强化学习等,上述算法均有不同的参数更新律设计方法,但是大多数更新律的设计均存在一定的局限性,对初始控制策略的限制本文档来自技高网...

【技术保护点】

1.一种基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,所述步骤S1中具体包括以下公式:

3.根据权利要求1所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,所述步骤S2具体包括以下分步骤:

4.根据权利要求3所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,步骤S21中所述全向小车待跟踪的参考轨迹的表述公式为:

5.根据权利要求3所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,步骤S22中所述跟踪性...

【技术特征摘要】

1.一种基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,所述步骤s1中具体包括以下公式:

3.根据权利要求1所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,所述步骤s2具体包括以下分步骤:

4.根据权利要求3所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,步骤s21中所述全向小车待跟踪的参考轨迹的表述公式为:

5.根据权利要求3所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,步骤s22中所述跟踪性能指标的函数公式为:

6.根据权利要求3所...

【专利技术属性】
技术研发人员:龙江张涛金才君郭阳明刘尊
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1