用于控制器适应的系统和方法技术方案

技术编号:15396932 阅读:165 留言:0更新日期:2017-05-19 11:27
描述了一种控制动力系统(即,“设备”)的神经模型预测控制(MPC)控制器。该MPC控制器在基本控制器中接收设备的当前状态的测量结果,并且基于所述设备的所述当前状态的所述测量结果生成控制信号。前向模块接收所述设备的所述当前状态的所述测量结果以及所述控制信号,以生成前向模块预测。前向模块校正器从所述基本控制器接收所述设备的所述当前状态的所述测量结果以及所述控制信号,以生成对所述前向模块预测的附加校正以生成预测设备状态。生成多对控制信号和相应预测设备状态的为长度L的控制序列,直至已经生成N

System and method for controller adaptation

A neural model predictive control (MPC) controller for controlling a power system (i.e., a device) is described. The MPC controller receives the measurement result of the current state of the device in the basic controller, and generates control signals based on the measurement results of the current state of the device. The forward module receives the measurement results of the current state of the device, and the control signals to generate prediction of the forward module. The measurement results prior to receiving the corrector module equipment from the basic controller of the current state of the control signal to generate additional correction to the forward prediction module to generate the prediction of equipment state. A control sequence with a plurality of pairs of control signals and corresponding predicted device status is generated, with a length of L until the N has been generated

【技术实现步骤摘要】
【国外来华专利技术】用于控制器适应的系统和方法相关申请的交叉引用本申请是2014年9月30日提交的美国临时申请No.62/057,633的非临时专利申请,该美国临时申请的全部内容通过引用被包括在本文中。
技术介绍
(1)
本专利技术涉及一种控制器适应(adaptation)系统,并且更具体地,涉及一种给予系统(诸如自主和/或用户控制的汽车或飞机)的控制器快速地适应系统的动力学的变化的能力的控制器适配器。(2)相关技术的描述动力系统通常经由控制器操作。控制器的任务是在自主系统上评估操作参数(诸如周围环境等)并执行命令,以在操作参数的界限内执行任务并进行操作。已经开发了用于控制自主系统的多种系统和方法。例如,模型预测控制(参见所结合的参考文献列表,参考文献1)计算最佳控制命令来实现给定控制目标(例如,将汽车保持在车道中),但是这种计算取决于系统动力学的前向(forward)模型,并且使该模型适应突变要求另一种方法。诸如支持向量回归(参见参考文献2)、高斯过程(参见参考文献3)以及主成分分析(参见参考文献4)的机器学习方法通常要求大量数据来重新学习功能关系。在线学习方法利用每个单独数据点使内部模型逐渐适应(参见参考文献5至7),但是不能适应突变。系统动力学的预期变化可能很大,特别是在损害之后。由于这种变化,在线学习模型通常不能足够快速地适应突变。因此,存在一种对根据由于系统动力学的突变导致的稀疏数据提供适应的快速控制器适配器的持续需求。
技术实现思路
描述一种用于根据稀疏数据适应以控制动力系统而不管动力的不期望改变的神经模型预测控制(MPC)控制器。系统可能是自主和/或用户控制的汽车或飞机或其子组件(或者任何其它自主系统)。换句话说,在一些实施方式中,自主系统是能够操作以用于执行各种任务(诸如飞行(在飞机的情况下)、或驾驶(在汽车的情况下)或者抓取(在机器人的情况下))的设备(plant)、或者是能够操作以用于执行任务的任何其它合适系统。所述MPC控制器包括被配置为执行多个操作的一个或更多个非暂时性电子处理器(例如,一个或更多个处理器以及存储器,所述存储器是在其上编码有可执行指令的非暂时性计算机可读介质,使得当执行所述指令时,所述一个或更多个处理器执行多个操作)。如上所述,所述一个或更多个非暂时性电子处理器被配置为执行多个操作,包括:在基本控制器中接收设备的当前状态的测量结果,并且基于所述设备的所述当前状态的所述测量结果生成控制信号;在前向模块中接收所述设备的所述当前状态的所述测量结果以及所述控制信号,以生成前向模块预测;在前向模块校正器中从所述基本控制器接收所述设备的所述当前状态的所述测量结果以及所述控制信号,以生成对所述前向模块预测的附加校正(additivecorrection)以生成预测设备状态;生成多对控制信号和相应预测设备状态的为长度L的控制序列,直至已经生成Ns个控制序列为止;以及基于所述Ns个控制序列来生成下一个设备控制信号。在另一方面,所述MPC控制器使得所述设备驱动或执行所述下一个控制信号。在又一方面,对预测设备状态限定代价函数,使得通过在所述Ns个控制序列中的每个控制序列中的所述预测设备状态当中找到使所述代价函数最小化的预测设备状态以生成最小化序列,然后从所述最小化序列中选择第一设备控制信号来确定所述下一个控制设备信号。生成所述最小化序列的所述基本控制器是在下一个时间步幅(step)中使用的基本控制器。在又一方面,一个或更多个传感器可以与基本控制器、前向模块和前向模块校正器通信连接,以生成所述设备的所述当前状态的所述测量结果。在又一方面,使用唯一随机生成的基本控制器生成每个控制序列。另外,所述前向模块校正器是神经网络。在另一方面,所述前向模块校正器是多层感知器(multi-layerperceptron)。在又一方面,所述基本控制器是神经网络。最后,本专利技术还包括计算机程序产品和计算机实现方法。所述计算机程序产品包括存储在非暂时性计算机可读介质上的计算机可读指令,所述计算机可读指令可以通过具有一个或更多个处理器的计算机来执行,使得当执行所述指令时,所述一个或更多个处理器执行本文中所列出的操作。另选地,所述计算机实现方法包括使得计算机执行这种指令并执行所产生的操作的动作。附图说明从下面结合附图对本专利技术的各个方面的详细描述中,本专利技术的目的、特征和优点将变得明显,在附图中:图1是示出根据本专利技术的一些实施方式的系统的组件的框图;图2是具体实现本专利技术的一个方面的计算机程序产品的例示;图3是根据本专利技术的实施方式的神经模型预测控制(MPC)控制器的系统表示;图4是示出如双杆平衡问题中使用的车摆系统的例示;图5是示出车摆系统和神经MPC控制器的例示;图6是示出如由车摆系统中的前向模块采用的示例性微分方程的例示;图7是示出在损害车摆系统之后车体和杆(pole)的位置的图表;图8是示出在损害车摆系统之后车体和杆的速度的图表;图9是示出在损害车摆系统之后由神经MPC控制器进行的预测车摆系统状态时的误差的图表;图10是示出在各种等级的损害已经发生之后车摆系统被成功控制达至少20秒的可能性的图表;图11是示出在各种等级的损害已经发生之后车摆系统被成功控制达至少40秒的可能性的图表;图12是示出在各种等级的损害已经发生之后车摆系统被成功控制达至少60秒的可能性的图表;以及图13是示出在不同前向模块校正器网络大小的范围内生存达20秒、40秒和60秒的生存时间的平均可能性的图表。具体实施方式本专利技术涉及一种控制器适应系统,并且更具体地,涉及一种允许系统(诸如自主和/或用户控制的汽车或飞机)的控制器具有快速地适应自主系统的动力学的变化的能力的控制器适配器。给出下面的描述以使得本领域普通技术人员能够制造并使用本专利技术,并且能够将其包含在特定应用的情境中,各种修改以及在不同应用中的各种使用对于本领域技术人员来说将是显而易见的,并且本文中限定的一般原理可以应用于广泛多个方面。因此,本专利技术不旨在限于所呈现的方面,而是符合与本文中所公开的原理和新颖特征相一致的最宽范围。在下面的详细说明中,为了提供对本专利技术的更全面理解,阐述了大量具体细节。然而,本专利技术可以在不必须限于这些具体细节的情况下被实践,这对于本领域技术人员来说将是显而易见的。在其它情况下,已知结构和装置以框图形式而不是详细地被示出,以便避免使本专利技术模糊不清。读者的注意力在于与本说明书同时提交的并且与本说明书一起对公众查阅开放的全部文献,并且全部这种文献的内容通过引用被包含在本文中。除非另有明确说明,本说明书(包括任何所附权利要求、摘要和附图)中公开的全部特征可以由用作相同、等同或相似目的的另选特征代替。因此,除非另有明确说明,所公开的每个特征是通常系列的等同或相似特征的仅一个示例。此外,权利要求中的没有明确陈述用于执行指定功能的“装置”或者用于执行特定功能的“步骤”的任何元件将不会如35U.S.C.112章节第6款中规定的“装置”或“步骤”条款那样进行解释。特别地,在本文中的权利要求中使用“步骤”或“动作”并不旨在引用35U.S.C.112章节第6款的规定。在详细描述本专利技术之前,首先提供所引用文献的列表。接下来,提供本专利技术的各个主要方面的描述。随后,介绍为读者提供了本专利技术的一般理解。最后,提本文档来自技高网...
用于控制器适应的系统和方法

【技术保护点】
一种神经模型预测控制MPC控制器,所述神经模型预测控制MPC控制器包括:一个或更多个非暂时性电子处理器,所述非暂时性电子处理器被配置为执行以下操作:在前向模块中从基本控制器接收设备的当前状态的测量结果和控制信号,以生成前向模块预测;在前向模块校正器中接收所述设备的所述当前状态的所述测量结果和所述控制信号,以生成对所述前向模型预测的附加校正以便生成预测设备状态;生成多对控制信号和相应预测设备状态的控制序列;以及基于所述控制序列生成下一个设备控制信号。

【技术特征摘要】
【国外来华专利技术】2014.09.30 US 62/057,633;2015.09.29 US 14/869,9611.一种神经模型预测控制MPC控制器,所述神经模型预测控制MPC控制器包括:一个或更多个非暂时性电子处理器,所述非暂时性电子处理器被配置为执行以下操作:在前向模块中从基本控制器接收设备的当前状态的测量结果和控制信号,以生成前向模块预测;在前向模块校正器中接收所述设备的所述当前状态的所述测量结果和所述控制信号,以生成对所述前向模型预测的附加校正以便生成预测设备状态;生成多对控制信号和相应预测设备状态的控制序列;以及基于所述控制序列生成下一个设备控制信号。2.根据权利要求1所述的神经模型预测控制MPC控制器,所述神经模型预测控制MPC控制器还被配置为执行以下操作:在所述基本控制器中接收设备的当前状态的测量结果;以及基于所述设备的所述当前状态的所述测量结果生成所述控制信号。3.根据权利要求2所述的神经模型预测控制MPC控制器,其中,对预测设备状态限定代价函数,使得通过在所述Ns个控制序列中的每个控制序列中的所述预测设备状态当中找到使所述代价函数最小化的预测设备状态以生成最小化序列,并且然后从所述最小化序列中选择第一设备控制信号来确定所述下一个控制设备信号。4.根据权利要求3所述的神经模型预测控制MPC控制器,其中,生成所述最小化序列的所述基本控制器是在下一个时间步幅中使用的所述基本控制器。5.根据权利要求1所述的神经模型预测控制MPC控制器,所述神经模型预测控制MPC控制器还包括一个或更多个传感器,所述一个或更多个传感器与基本控制器、前向模块和前向模块校正器通信连接,以生成所述设备的所述当前状态的所述测量结果。6.根据权利要求1所述的神经模型预测控制MPC控制器,其中,每个控制序列使用唯一随机生成的基本控制器生成。7.根据权利要求1所述的神经模型预测控制MPC控制器,其中,所述前向模块校正器是神经网络。8.根据权利要求1所述的神经模型预测控制MPC控制器,其中,所述前向模块校正器是多层感知器。9.根据权利要求1所述的神经模型预测控制MPC控制器,其中,所述基本控制器是神经网络。10.根据权利要求1所述的神经模型预测控制MPC控制器,所述神经模型预测控制MPC控制器还包括一个或更多个传感器,所述一个或更多个传感器与基本控制器、前向模块和前向模块校正器通信连接,以生成所述设备的所述当前状态的所述测量结果;其中,每个控制序列使用唯一随机生成的基本控制器生成;其中,对预测设备状态限定代价函数,使得通过在所述Ns个控制序列中的每个控制序列中的所述预测设备状态当中找到使所述代价函数最小化的预测设备状态以生成最小化序列,并且然后从所述最小化序列中选择第一设备控制信号来确定所述下一个控制设备信号;其中,生成所述最小化序列的所述基本控制器是在下一个时间步幅中使用的基本控制器;其中,所述前向模块校正器是神经网络;并且其中,所述前向模块校正器是多层感知器。11.一种使用神经模型预测控制MPC控制器根据稀疏数据快速适应的方法,所述方法包括以下动作:使一个或更多个处理器执行存储在非暂时性存储器上的指令,使得当执行指令时所述一个或更多个处理器执行以下操作:在前向模块中从基本控制器接收设备的当前状态的测量结果和控制信号,以生成前向模块预测;在前向模块校正器中接收所述设备的所述当前状态的所述测量结果和所述控制信号,以生成对所述前向模型预测的附加校正以便生成预测设备状态;生成多对控制信号和相应预测设备状态的控制序列;以及基于所述控制序列生成下一个设备控制信号。12.根据权利要求11所述的方法,所述方法还包括执行以下操作的动作:在所述基本控制器中接收设备的当前状态的测量结果;以及基于所述设备的所述当前状态的所述测量结果生成所述控制信号。13.根据权利要求12所述的方法,其中,对预测设备状态限定代价函数,使得通过在所述Ns个控制序列中的每个控制序列中的所述预测设备状态当中找到使所述代价函数最小化的预测设备状态以生成最小化序列,并且然后从所述最小化序列中选择第一设备控制信号来确定所述下一个控制设备信号。14.根据权利要求13所述的方法,其中,生成所述最小化序列的所述...

【专利技术属性】
技术研发人员:C·E·马丁H·霍夫曼
申请(专利权)人:赫尔实验室有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1