System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多目标多步变时域预测的智能体运动控制方法技术_技高网

一种基于多目标多步变时域预测的智能体运动控制方法技术

技术编号:40340635 阅读:6 留言:0更新日期:2024-02-09 14:28
本发明专利技术属于智能体控制相关技术领域,其公开了一种基于多目标多步变时域预测的智能体运动控制方法,包括:以所调整的曲率与控制周期作为前提条件,设计多目标优化指标;设定约束信息,构建不同条件下的速度和预测时域参数库;通过所定义的终端域与代价函数验证其控制系统稳定性的约束条件,对终端域进行重新划分;将系统求解末端状态所在终端域的位置作为判断依据,设计控制器参数切换逻辑规则;结合动态变化判断切换条件,从速度和时域参数库中选取合适的参数,实现自适应调整;利用非线性模型预测控制优化求解获得该时刻控制信息,对智能体控制系统进行多步控制。本发明专利技术旨在解决智能体的运动控制问题,提高了运动控制的精度以及实时性。

【技术实现步骤摘要】

本专利技术属于智能体运动控制领域相关,更具体地,涉及一种基于多目标多步变时域预测的智能体运动控制方法


技术介绍

1、运动控制作为智能体研究领域的核心技术之一,采用高效的控制系统才能保障智能体实现稳定运动以及精准操作,而轨迹跟踪控制是其运动控制的主要研究内容。模型预测控制(model predictive control,mpc)是近年来被广泛研究讨论的一种反馈控制策略。其优点是在与其控制过程中可以施加多种约束,并适用于受约束和不确定性的非线性多输入多输出系统。模型预测控制方法通过求解有限时域约束优化问题得到最优控制序列,并将该序列第一个元素施加到控制器中,以此反复进行。其具备鲁棒性强、控制性能好等优点。随着模型预测控制的发展,非线性模型预测控制算法的稳定性和可行性也逐渐得到了求解证明。这种控制算法更适用于智能体等具有更强的非线性特性的系统,不会存在降低系统模型精度的问题,从而实现较高的控制效果。

2、然而,针对非线性模型预测控制在智能体控制系统中的应用,仍然存在着一些难题:1)由于智能体控制系统处于动态变化中,其系统参数与环境变化将会影响非线性模型预测控制的控制效果;2)非线性模型预测控制算法仅采用固定时域或单目标优化时域方式,难以同时兼容系统稳定性、提高控制精度以及实时性要求;3)由于非线性模型预测控制的计算复杂度较高,所需求解的时间更长,使得实时性难以保证。


技术实现思路

1、针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于多目标多步变时域预测的智能体运动控制方法,可以在多目标优化条件下高效适应智能体的动态变化。

2、为实现上述目的,按照本专利技术的一个方面,提供了一种基于多目标多步变时域预测的智能体运动控制方法,包括:参数库获取阶段:s11:设计智能体运动控制系统的跟踪误差系统,根据不同的曲率和控制周期,构建成本函数集以用于运动控制;s12:分别以成本函数最小化为目标,采用非线性模型预测控制器对所述智能体运动控制系统进行离线训练,获得多目标优化算法的评价指标;s13:设定多目标优化算法的约束条件;s14:在所述约束条件下,采用所述多目标优化算法以所述评价指标最小化为目标对所述评价指标进行求解,获得pareto集,并对所述pareto集进行分类获得速度参数库和预测时域参数库;稳定域获取阶段:s21:定义所述非线性模型预测控制器的终端代价函数,获取终端域和终端控制器;s22:依据跟踪误差系统对所述终端域进行限缩获得稳定域;调整阶段:s31:判断智能体的末端状态是否在稳定域,若在稳定域则降低预测时域并提升智能体速度;若不在稳定域,则根据当前的轨迹曲率和控制周期选择对应的所述速度参数库和预测时域参数库;s32:对所述多目标优化评价指标进行权重分配,并进行多目标优化求解获得最优的目标速度和目标预测时域;s33:将所述目标速度和目标预测时域带入到非线性模型预测控制器中,获得智能体运动控制系统的目标控制序列与目标状态序列,以所述目标控制序列控制智能体,获得智能体的末端状态,重复循环步骤s31进行状态切换。

3、优选地,步骤s11还包括预设智能体的期望轨迹,调整所述期望轨迹的曲率和控制周期,并获取每条轨迹的成本函数;步骤s12具体为分别以所述成本函数最小化为目标,采用非线性模型预测控制器对所述智能体运动控制系统进行离线训练,获得多目标优化算法的评价指标。

4、优选地,所述成本函数j(u,q0)为:

5、

6、其中,u表示控制量序列,u={ue(0,q0),ue(1,q0),ue(2,q0)...ue(n-1,q0)},q0表示待优化的系统状态,i∈[0,n-1]表示预测时域内的不同时刻,qe(i,q0)表示在预测时域内i时刻下所优化的轨迹与参考轨迹的误差量,且qe(0,q0)=q0,ue(i,q0)表示预测时域内i时刻下所需的控制增量,w(qe(i,qe),ue(i,qe))为阶段指标函数,w(qe,ue)=qetqqe+uetrue,n为预测时域,f(·)为终端代价函数,满足q、r和p为对应维数的正定矩阵。

7、优选地,步骤s12中获得多目标优化算法的评价指标具体为:对离线训练过程中的运动参数进行评估获得多目标优化算法的评价指标。

8、优选地,所述评价指标p为:

9、π={f|f=[f1,f2,f3]t<fmax}

10、其中:

11、

12、f1为时间加权积分绝对误差指标,f2为调节时间指标,f3为计算求解时间指标,ts为输出阶跃响应进入误差带范围内所需要的时间,e(t)为离线计算下t时刻的误差值,δζ为非线性模型预测控制器每次优化求解所需的平均时间,fmax为时间加权积分误差绝对误差、调节时间与计算求解时间所构成的列向量的最大值,δ为预设误差阈值。

13、优选地,步骤s13具体为基于智能体运动控制系统的控制需求设定多目标优化算法的约束条件。

14、优选地,所述约束条件ψ为:

15、ψ={v,n|vmin<v<vmax(ρ),nmin<n<nmax(t)}

16、其中,v为智能体的运动速度,vmin为运动速度的最小值,vmax(ρ)为受曲率ρ变化影响的运动速度最大值,nmin为预测时域的最小值,n为预测时域,nmax(t)为受控制周期t变化影响的预测时域最大值。优选地,步骤s21还包括建立智能体跟踪误差系统的离散多面体模型,采用线性矩阵不等式证明所述智能体运动控制系统的终端代价函数满足稳定性条件,以及在终端域内满足控制约束条件和状态约束条件。

17、优选地,步骤s32中,对所述多目标优化评价指标进行权重分配,具体为:

18、对多目标优化评价指标进行模糊逻辑权重分配,分配后多目标优化评价指标的权重值g为:

19、g=σ1f1+σ2f2+σ3f3

20、其中,(σ1,σ2,σ3)为权重系数,f1为时间加权积分绝对误差指标,f2为调节时间指标,f3为计算求解时间指标。

21、优选地,步骤s33中,以所述目标控制序列控制智能体,获得智能体的末端状态,具体为:采用滚动优化原理,将所述目标控制序列中的前预设项数控制参数依次连续作为智能体的控制输入,并在输入结束后,获得智能体的末端状态。

22、总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,本专利技术提供的一种基于多目标多步变时域预测的智能体运动控制方法主要具有以下有益效果:

23、1.本申请以成本函数最小化为目标对智能体运动控制系统进行离线训练获得多目标优化算法的评价指标,结合约束条件,获取速度参数库和预测时域参数库,并进一步对终端域进行限缩获得稳定域,基于稳定域判断智能体的末端状态的稳定性,并通过调整实现智能体工作在稳定域内,保证了在多目标工作下的稳定性和随时域变化的及时性。

24、2.针对多目标优化算法,本方法将运动控制系统中的控制精度,稳定性以及实时性进本文档来自技高网...

【技术保护点】

1.一种基于多目标多步变时域预测的智能体运动控制方法,其特征在于,包括:

2.根据权利要求1所述的智能体运动控制方法,其特征在于,步骤S11还包括预设智能体的期望轨迹,调整所述期望轨迹的曲率和控制周期,并获取每条轨迹的成本函数;步骤S12具体为分别以所述成本函数最小化为目标,采用非线性模型预测控制器对所述智能体运动控制系统进行离线训练,获得多目标优化算法的评价指标。

3.根据权利要求1或2所述的智能体运动控制方法,其特征在于,预设智能体的期望轨迹,调整所述期望轨迹的曲率和控制周期,并获取每条轨迹的成本函数,组成成本函数集S:

4.根据权利要求1~3任意一项所述的智能体运动控制方法,其特征在于,步骤S12中获得多目标优化算法的评价指标具体为:

5.根据权利要求1或4所述的智能体运动控制方法,其特征在于,所述评价指标P为:

6.根据权利要求1所述的智能体运动控制方法,其特征在于,步骤S13具体为基于智能体运动控制系统的控制需求设定多目标优化算法的约束条件。

7.根据权利要求6所述智能体运动控制方法,其特征在于,所述约束条件Y为:

8.根据权利要求1所述的智能体运动控制方法,其特征在于,步骤S21还包括建立智能体跟踪误差系统的离散多面体模型,采用线性矩阵不等式证明所述智能体运动控制系统的终端代价函数满足稳定性条件,以及在终端域内满足控制约束条件和状态约束条件;进一步优选的,步骤S22依据跟踪误差系统对所述终端域进行限缩获得稳定域具体为设置缩放比例因子λ,则稳定域为λW,其中,W为终端域。

9.根据权利要求1所述的智能体运动控制方法,其特征在于,步骤S32中,对所述多目标优化评价指标进行权重分配,具体为:

10.根据权利要求1所述的智能体运动控制方法,其特征在于,步骤S33中,以所述目标控制序列控制智能体,获得智能体的末端状态,具体为:

...

【技术特征摘要】

1.一种基于多目标多步变时域预测的智能体运动控制方法,其特征在于,包括:

2.根据权利要求1所述的智能体运动控制方法,其特征在于,步骤s11还包括预设智能体的期望轨迹,调整所述期望轨迹的曲率和控制周期,并获取每条轨迹的成本函数;步骤s12具体为分别以所述成本函数最小化为目标,采用非线性模型预测控制器对所述智能体运动控制系统进行离线训练,获得多目标优化算法的评价指标。

3.根据权利要求1或2所述的智能体运动控制方法,其特征在于,预设智能体的期望轨迹,调整所述期望轨迹的曲率和控制周期,并获取每条轨迹的成本函数,组成成本函数集s:

4.根据权利要求1~3任意一项所述的智能体运动控制方法,其特征在于,步骤s12中获得多目标优化算法的评价指标具体为:

5.根据权利要求1或4所述的智能体运动控制方法,其特征在于,所述评价指标p为:

6.根据权利要求1所述的智能体运动控制方法...

【专利技术属性】
技术研发人员:谢远龙张鸿洋王书亭李虎
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1