【技术实现步骤摘要】
本专利技术属于强化学习和最优控制,具体涉及一种基于强化学习的全向小车轨迹跟踪最优控制方法的设计。
技术介绍
1、全向小车由于其灵活的运动能力和高效的机动性能,广泛应用于工业自动化、物流运输以及服务机器人等领域。随着自动化和人工智能技术的不断发展,仅仅追求控制性能的提升已经无法满足实际应用的需求,如何解决控制性能与输入能耗的优化问题越来越受到相关专家学者的关注和研究。
2、然而,传统的最优控制算法在应对全向小车这类非线性系统时,常常面临 hjb(哈密尔顿-雅可比-贝尔曼)方程求解困难的问题。这是因为 hjb方程的非线性和耦合特性使得解析求解几乎不可能。此外,传统最优控制算法在设计初始控制策略时,通常需要确保策略的容许性,这进一步增加了设计全向小车轨迹跟踪最优控制器的复杂性。
3、目前,主流的全向小车轨迹跟踪最优控制方法包括自适应动态规划、模糊控制和强化学习等,上述算法均有不同的参数更新律设计方法,但是大多数更新律的设计均存在一定的局限性,
...【技术保护点】
1.一种基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,所述步骤S1中具体包括以下公式:
3.根据权利要求1所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,所述步骤S2具体包括以下分步骤:
4.根据权利要求3所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,步骤S21中所述全向小车待跟踪的参考轨迹的表述公式为:
5.根据权利要求3所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,步
...【技术特征摘要】
1.一种基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,所述步骤s1中具体包括以下公式:
3.根据权利要求1所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,所述步骤s2具体包括以下分步骤:
4.根据权利要求3所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,步骤s21中所述全向小车待跟踪的参考轨迹的表述公式为:
5.根据权利要求3所述的基于强化学习的全向小车轨迹跟踪最优控制方法,其特征在于,步骤s22中所述跟踪性能指标的函数公式为:
6.根据权利要求3所...
【专利技术属性】
技术研发人员:龙江,张涛,金才君,郭阳明,刘尊,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。