System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于校准反馈控制器的系统和方法技术方案_技高网

用于校准反馈控制器的系统和方法技术方案

技术编号:40670010 阅读:3 留言:0更新日期:2024-03-18 19:05
公开了一种用于控制执行任务的机器的操作的系统。该系统向机器提交控制输入序列并接收反馈信号。该系统还在各个控制步通过基于反馈控制器的控制参数集合中的控制参数的当前值应用将系统的当前状态的当前测量变换为用于控制机器的当前控制输入的控制策略,基于包括当前测量的反馈信号来确定当前控制输入。此外,该系统可使用预测控制参数的值的预测模型和更新预测值的测量模型迭代地更新由控制参数定义的反馈控制器的状态,以根据性能目标生成说明测量序列的控制参数的当前值。

【技术实现步骤摘要】
【国外来华专利技术】

本公开总体上涉及控制系统,更具体地,涉及用于校准反馈控制器的系统和方法


技术介绍

1、目前,存在可在非结构化和不确定环境中操作的各种动力机器(dynamicmachine)。实际上,为了在非结构化和不确定环境中操作,这些动力机器本质上更复杂。因为动力机器本质上复杂并且在越来越非结构化或不确定的环境中操作,所以对动力机器的自动化设计和校准过程的需求变得更重要。特别是,诸如自主车辆或机器人的许多动力机器的控制包括常常冲突的各种规范,因此需要相当大的手动校准努力。此外,通常在生产阶段进行校准,并且因为动力机器的操作条件在其寿命内变化,所以后期常常难以调节与动力机器关联的控制器。

2、存在一些目前可用的方法,其旨在将控制器校准自动化并使控制器适应动力机器的操作和运行条件。然而,这些可用方法聚焦于向人类专家学习或经由试错搜索的重复性学习任务。因此,这些可用方法可能仅适合于适宜重复性学习的应用。例如,这些可用方法可用在机器人中以操纵对象。然而,这些可用方法在本质上更连续的控制应用(例如自主驾驶)中无法提供控制器校准。此外,试错搜索常常不适合安全关键机器。另外,有人类示范者的要求限制了自动化量。

3、因此,需要一种可按高效且可行的方式自动地校准控制器的系统。


技术实现思路

1、一些实施方式的目的是实时迭代地校准控制器并使用校准的控制器来控制机器的操作。机器的示例可包括载具(例如,自主车辆)、机器人组件、马达、电梯门、hvac(加热通风和空调)系统等。机器的操作的示例可包括(但不限于)根据特定轨迹操作载具、根据特定参数操作hvac系统、根据特定任务操作机器人臂以及打开/关闭电梯门。控制器的示例可包括pid(比例积分微分)控制器、最优控制器、神经网络控制器等。以下,“控制器”和“反馈控制器”可互换使用以表示相同的意思。

2、为了校准反馈控制器,一些实施方式使用卡尔曼(kalman)滤波器。但是卡尔曼滤波器通常用于估计定义机器的状态的状态变量,其中状态可以是诸如位置、速度等的物理量。为此,一些实施方式的目的是与机器的状态变量相比变换或调整卡尔曼滤波器以用于估计用于控制机器的反馈控制器的控制参数。尽管状态变量定义所控制的机器的状态,控制参数用于计算控制命令。控制参数的示例是反馈控制器的增益(例如pid控制器中的增益)和/或机器的物理结构的参数(类似机器人臂的质量或车辆轮胎与道路的摩擦)。值得注意的是,控制参数不应与定义由反馈控制器执行的控制律或控制策略的输入和输出的控制变量(例如控制致动器的电压值)混淆。换言之,基于控制参数所定义的控制律将输入控制变量映射到输出控制变量。该映射可以是分析的或基于优化问题的解。

3、在许多控制应用中,控制参数预先已知并且固定,即,在控制期间保持恒定。例如,机器人臂的质量可测量或从机器人的规格知道,可限制或选择轮胎摩擦,可在实验室调节控制器的增益。然而,预先固定控制参数对于一些应用会是次优的,对于一些其它应用甚至是不切实际的,相反其需要以具有不确定性的控制参数来控制机器。

4、一些实施方式基于这样的认识:跟踪卡尔曼滤波器所提供的状态变量的原理可被扩展或调整以用于跟踪控制参数。实际上,尽管控制不是机器,而是过程,但认识到控制可被当作具有由控制参数定义的虚拟状态的虚拟机。根据这种直觉,如果在预测阶段期间卡尔曼滤波器所使用的预测模型可预测可根据测量模型说明机器的状态的测量的控制参数,则卡尔曼滤波器可迭代地跟踪控制参数。

5、值得注意的是,由于预测模型和测量模型由卡尔曼滤波器的设计者提供,这种灵活性允许针对不同类型的控制目标调整卡尔曼滤波器。例如,在一些实施方式中,预测模型是预测控制参数在过程噪声的方差内不会改变的常数或恒等模型。实际上,对于具有固定控制参数的许多控制应用,这种预测是常见的。另外地或另选地,一些实施方式定义了可基于其与其它参数的预定关系来预测至少一些参数的预测模型。例如,一些实施方式可基于车辆的当前速度预测轮胎摩擦的变化。在卡尔曼滤波器的这种配置中,过程噪声控制控制参数随时间变化有多快。

6、在任何情况下,这种预测模型将跟踪控制参数的主要工作放在测量模型上,并且增加了灵活性以基于控制目标变化测量模型的更新。值得注意的是,这种灵活性允许变化测量模型以用于控制不同机器,但也允许在同一机器的控制期间针对不同时刻或不同状态变化测量模型。

7、为此,在各种实施方式中,测量模型使用性能目标,性能目标评估在线控制闭环机器的操作的性能,然后用于调整控制参数以改进相对于性能目标测量的闭环机器操作。值得注意的是,性能目标具有高度灵活的结构并且可不同于最优控制器的目标。这是有益的,因为最优控制成本函数具有由于其实时应用而受到限制的结构,例如,成本函数常常需要是可微的和凸的,使得它适合数值优化。此外,性能目标可根据相同的最优控制目标在不同的控制时间改变。此外,最优控制目标或其它控制参数可根据相同的性能目标在不同的时间或作为机器状态的函数改变。

8、以这种方式,卡尔曼滤波器的优点扩展至控制参数的递归估计。这些优点包括卡尔曼滤波器(i)在机器操作期间在线调整参数、(ii)由于基于滤波器的设计而对噪声鲁棒、(iii)维持闭环操作的安全保证、(iv)计算上高效、(v)由于递归实现而所需的数据存储减少、以及(vi)易于实现,因此对工业应用有吸引力。

9、一些实施方式基于这样的认识:在许多应用中,需要彼此依赖地集体调节多个控制参数。例如,需要集体地调节pid控制器的增益,以便获得期望的性能并确保安全操作;需要集体地调节最优控制的成本函数的权重,因为它们定义了多个潜在冲突的目标之间的权衡;需要集体地调节用于h∞控制器或动态输出反馈控制器的滤波器系数,以确保性能和稳定性要求。

10、通常,校准相互依赖的参数是更具挑战性的问题,因为这种相互依赖性增加了另一要考虑的变量。因此,有多个相互依赖的参数要校准可能增加校准复杂度。然而,一些实施方式基于这样的认识:可通过调节对不同参数的更新设置不同权重的卡尔曼增益来自然地统计上调节校准的控制参数的这种相互依赖性。

11、一些实施方式基于这样的认识:反馈控制器中使用的控制参数取决于机器的状态。一些实施方式使用基函数的线性组合来解决这种状态依赖性,基函数是机器状态的函数。实际上,卡尔曼滤波器可被实现为调节基函数的系数,然后用于生成控制参数。另外地或另选地,一些实施方式与基函数组合使用状态相关区域。在各个区域中,作为基函数的线性组合计算控制参数。卡尔曼滤波器可调节各个区域中的基函数的系数以及决定哪组基函数用于计算控制参数的区域。

12、在不同实施方式中,所控制的机器具有线性或非线性动力学特性以及具有不同界限的控制参数的不同不确定性。一些实施方式通过选择卡尔曼滤波器的不同类型的实现和/或过程和/或测量噪声的不同方差来解决这些变化。

13、例如,一个实施方式使用扩展卡尔曼滤波器(ekf)来计算卡尔曼增益。ekf数值上计算性能目标相对于控制本文档来自技高网...

【技术保护点】

1.一种用于控制用于执行任务的机器的操作的系统,该系统包括:

2.根据权利要求1所述的系统,其中,所述卡尔曼滤波器还被配置为调节卡尔曼增益以用于校准多个相互依赖的控制参数。

3.根据权利要求1所述的系统,其中,所述预测模型是被配置为预测所述控制参数在由所述过程噪声定义的方差内保持固定的恒等模型。

4.根据权利要求1所述的系统,其中,所述预测模型被配置为基于与所述机器的所述状态的代数关系在由所述过程噪声定义的方差内预测至少一些控制参数。

5.根据权利要求1所述的系统,其中,用于更新所述控制参数的所述性能目标不同于所述反馈控制器的所述控制策略。

6.根据权利要求1所述的系统,其中,所述性能目标包括定义所述机器的所述状态与所述机器的参考状态的偏差的成本函数,并且其中,所述测量模型被配置为通过优化所述成本函数来更新所述控制参数。

7.根据权利要求1所述的系统,其中,所述测量模型还被配置为基于所述机器的所述状态和所述机器周围的环境的状态之一或组合来从不同的性能目标当中选择一个。

8.根据权利要求1所述的系统,其中,所述性能目标包括(i)定义所述状态与参考状态的偏差的成本函数、(ii)超过最优操作区域的所述状态的成本函数、(iii)在参考状态过冲特定值的情况下的成本函数、(iv)所述状态的振荡的成本函数以及(v)在所述状态在时间步之间改变的情况下的成本函数之一或组合。

9.根据权利要求1所述的系统,其中,所述控制参数包括(i)所述反馈控制器的一个或多个增益、(ii)所述机器的一个或多个结构参数、(iii)所述反馈控制器所使用的一个或多个滤波器的一个或多个系数、或者(iv)神经网络控制器的一个或多个权重之一或组合。

10.根据权利要求1所述的系统,其中,为了生成所述控制参数,所述卡尔曼滤波器被配置为更新一个或多个状态相关区域中的基函数的系数。

11.根据权利要求1所述的系统,其中,为了生成所述控制参数,所述卡尔曼滤波器被配置为更新多个状态相关区域中的基函数的系数以及分离所述多个状态相关区域的边界。

12.根据权利要求1所述的系统,其中,所述卡尔曼滤波器是被配置为通过计算所述性能目标的梯度来计算卡尔曼增益的扩展卡尔曼滤波器EKF。

13.根据权利要求1所述的系统,其中,所述卡尔曼滤波器是被配置为通过相对于所述性能目标评估所述控制参数来计算卡尔曼增益的无迹卡尔曼滤波器UKF。

14.根据权利要求1所述的系统,其中,所述控制参数中的至少一个的不确定性是有界的,并且其中,所述卡尔曼滤波器还被配置为基于所述不确定性的界限来选择所述过程噪声、所述测量噪声或所述性能目标之一或组合。

15.根据权利要求1所述的系统,其中,所述反馈控制器被配置为确定经受对所述机器的所述操作的约束的所述当前控制输入,从而应对控制的不连续性。

16.根据权利要求1所述的系统,该系统还包括安全检查模块,该安全检查模块被配置为:

17.根据权利要求16所述的系统,其中,当所述卡尔曼滤波器所生成的所述控制参数的值不满足所述安全检查时,所述卡尔曼滤波器还被配置为迭代地生成所述控制参数的新值,直至满足所述安全检查。

18.根据权利要求16所述的系统,其中,所述安全检查包括所述状态与原点的有界性和所述状态的递减成本之一或组合。

19.一种用于控制用于执行任务的机器的操作的方法,该方法包括以下步骤:

20.一种非暂时性计算机可读存储介质,该非暂时性计算机可读存储介质上具体实现有程序,所述程序能够由处理器执行以用于执行用于控制执行任务的机器的操作的方法,该方法包括以下步骤:

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于控制用于执行任务的机器的操作的系统,该系统包括:

2.根据权利要求1所述的系统,其中,所述卡尔曼滤波器还被配置为调节卡尔曼增益以用于校准多个相互依赖的控制参数。

3.根据权利要求1所述的系统,其中,所述预测模型是被配置为预测所述控制参数在由所述过程噪声定义的方差内保持固定的恒等模型。

4.根据权利要求1所述的系统,其中,所述预测模型被配置为基于与所述机器的所述状态的代数关系在由所述过程噪声定义的方差内预测至少一些控制参数。

5.根据权利要求1所述的系统,其中,用于更新所述控制参数的所述性能目标不同于所述反馈控制器的所述控制策略。

6.根据权利要求1所述的系统,其中,所述性能目标包括定义所述机器的所述状态与所述机器的参考状态的偏差的成本函数,并且其中,所述测量模型被配置为通过优化所述成本函数来更新所述控制参数。

7.根据权利要求1所述的系统,其中,所述测量模型还被配置为基于所述机器的所述状态和所述机器周围的环境的状态之一或组合来从不同的性能目标当中选择一个。

8.根据权利要求1所述的系统,其中,所述性能目标包括(i)定义所述状态与参考状态的偏差的成本函数、(ii)超过最优操作区域的所述状态的成本函数、(iii)在参考状态过冲特定值的情况下的成本函数、(iv)所述状态的振荡的成本函数以及(v)在所述状态在时间步之间改变的情况下的成本函数之一或组合。

9.根据权利要求1所述的系统,其中,所述控制参数包括(i)所述反馈控制器的一个或多个增益、(ii)所述机器的一个或多个结构参数、(iii)所述反馈控制器所使用的一个或多个滤波器的一个或多个系数、或者(iv)神经网络控制器的一个或多个权重之一或组合。

10.根据权利要求1所述的系统,其中,为了生成所述控制参数,...

【专利技术属性】
技术研发人员:M·门纳K·贝恩拓普S·迪卡拉诺
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1