通过使用模型委员会来进行预测建模的方法和系统技术方案

技术编号:5855429 阅读:281 留言:1更新日期:2012-04-11 18:40
描述了用于预测建模的方法和系统。在一个实施例中,该方法是使用预测模型委员会(12)来控制过程的方法。该过程具有多个控制设置值以及至少一个表示过程状态的探针数据。该方法包括:向模型委员会中的每个模型(18)提供探针数据以便每个模型产生各自的输出的步骤,将模型输出进行聚合的步骤,以及基于该聚合产生预测输出的步骤。

【技术实现步骤摘要】

本专利技术通常与预测建模(predictive modeling)相关,同时更特别地是,与使用模型委员会(committee of models)以及根据局部加权学习进行融合的预测建模相关。
技术介绍
很多不同的方法被用于使资产(asset)的利用最优化。比如,可以在产生供给电力网的电力的涡轮或锅炉操作中执行资产最优化。为了确定对涡轮或锅炉的最优化利用,对参数进行预测和优化是非常有用的,这些参数例如为在不同操作条件下的耗热率、NOx排放以及设备负载。对需要优化的资产进行预测建模是在对资产优化的决策制订时联合使用的一项已知技术。但是,利用典型的预测模型,局部性能在预测空间上可能有变化。比如,一个特定的预测模型有可能在一组操作条件下提供很精确的结果,但是也可能在另一组操作条件下提供不太精确的结果。很多因素的变化可能导致这样的预测不确定性。比如,在某些条件下提供给模型的数据可能会包含噪音,该噪音导致了不准确性。另外,在由训练集数据表示的操作模式中的数据密度的变化可能导致模型参数的不规范,其中该变化来源于对训练集数据的随机采样,非确定性训练结果,以及不同的初始条件。同样,例如,如果在神经网络预测模型中神经元不够或者回归模型指定的不够精确也能够导致模型结构不规范的发生。
技术实现思路
一方面,提供了一种使用预测模型委员会控制过程的方法。该过程具有多个控制设置值以及至少一个探针用于产生过程状态的数据表示。该方法包括将探针数据提供给模型委员会中每个模型以便每个模型产生各自的输出的步骤,聚集这些模型输出的步骤,以及基于该聚集来产生预测输出的步骤。在另外一个方面,提供了一种用于产生与过程相关的预测输出的系统。该过程具有多个控制设置值以及至少一个探针用于产生过程状态的数据表示。该系统包括模型委员会,其中该模型委员会包括多个预测模型。对每个模型进行配置以使其基于来自探针的数据产生各自的输出。该系统包括一计算机,被编程为将来自所述模型的输出进行融合以在所述模型输出的基础上产生至少一个预测输出。而在另外一个方面,提供了一种用于产生关于过程的预测输出的计算机执行方法。该过程具有多个控制设置以及至少一个探针用于产生过程状态数据表示。该方法包括为包括多个预测模型的模型委员会提供输入,执行每个模型以基于来自探针的数据产生其各自的输出,以及对这些来自模型的输出进行融合以基于模型的输出产生至少一个预测输出。附图说明图1是使用模型委员会以及融合(fusion)来预测探针性能的示意图。图2对多个预测模型的训练进行了说明。图3对探针的同位体(peer)的检索进行了说明。图4对预测模型局部性能的估计进行了说明。图5对模型聚合(aggregation)以及偏移补偿进行了说明。具体实施例方式图1是使用系统10以产生预测输出的示意图,其中系统10使用了模型委员会12和融合14。在图1中显示的例子中,使用系统10对来自探针16的输出进行预测。正如在此处使用的,术语“模型(model)”通常涉及,但是不仅限于,可作为基本(underling)资产/系统性能表示的代理的预测模块,同时术语“委员会(committee)”涉及,但不仅限于,模型的集合或组,其中的每个模型都能够执行相似的,即使不是完全相同的预测任务。在一个实施例中,能够在通用计算机中实现系统10。能够使用很多不同种类的计算机,并且本专利技术不只局限于在任何一个特殊计算机上的执行。此使用的术语“计算机”,包括桌上型和便携型的电脑,服务器,基于微处理器的系统,专用集成电路,以及能够执行这里结合该系统所描述的功能的任何可编程集成电路。如图1中所示,模型委员会12包括多个预测模型18。每个预测模型18基于模型输入,为探针(probe)Q 16产生预测输出。对模型输出进行“融合”(fuse)14,将在下面对此进行更加详细描述,同时系统10基于这种融合产生一个输出。然后可使用融合的输出来估计与探针所表示的控制设置值对应的过程输出。在此处使用的术语“融合”(fuse),涉及以一种产生改进的输出的方式对输出进行的组合。在一个实施例中,每个模型18都是基于神经网络的数据驱动模型,其中使用历史数据20训练和验证这些数据驱动模型,同时这些数据驱动模型被构造为表示输入输出关系,这些在本
中是公知的。例如,对于燃煤的锅炉,可能存在多个模型委员会,其中该模型委员会包括多个模型以产生表示锅炉的不同特点的输出。样例输入包括各种不同的可控和可观测的变量,同时输出可能包括诸如NOx和CO之类的排放特征、诸如热消耗量之类的燃料使用特征、以及诸如可承负载之类的操作特征。关于图1,从探针Q16提供给每个模型18的输入表示各种不同的变量之一。在此使用的术语“探针”(probe),涉及能够产生输出并将其作为输入直接或间接提供给预测模型的任何类型的传感器或其它装置。这种探针的例子包括温度传感器,压力传感器,流量传感器,位置传感器,NOx传感器,CO传感器,以及速度传感器。当然,探针可以是预测模型的很多种其他不同类型输入中的一种,例如,探针可以通过优化程序来产生,或例如,探针可以是在数据集中获取的已知输入变量。每个模型18都基于输入变量产生系统特征的量化表示。如上面所说明的,委员会12中的每个模型18的局部性能可能不同并且在整个预测空间上可能并不均匀一致。例如,在操作条件的一个特定集合中,一个模型18可能相对于其它模型18具有优良的性能。然而,在另一个操作条件集合中,一个不同的模型18可能具有优良的性能而前述的一个模型18的性能可能较低。因此,在一个实施例中,使用如下描述的过程对来自委员会12中模型18的输出进行局部加权,以便杠杆调节局部化的信息从而使模型18能够相互补充。参考图2,关于对多个模型的训练,正如本领域所公知的,可通过使用历史数据20对每个预测模型18进行训练。特别地,将不同的但是有可能重叠的历史数据集合22提供给每个模型18,同时通过“自举”(bootstrap)这样的数据来训练每个模型18。也就是说,在基于历史数据20对每个模型18的训练中使用现有技术中已知的自举验证。更特别地,通过对原始训练集中的置换来进行的重采样来建立训练数据集,这样数据记录的出现次数可能超过一次。通常通过计算每个自举测试集的估计值的平均值来获取最终的估计值。比如,历史数据20通常表示已知的变量输入和已知的输出。在训练中,将已知的输出和模型产生的输出进行比较,如果在模型产生的输出和已知的输出之间存在差异,则调整模型(比如,为神经网络改变节点的权重和/或连通性)以使模型产生已知的输出。此外,如图2所示,对这样的训练使用不同的但是有可能重叠的历史数据集合22。作为结果,对于在训练模型18时使用的变量条件,模型18可能具有特别优良的性能。然而,对于变量条件的不同集合,另一个模型18可能具有优良的性能。一旦对模型18进行了训练,并定义了模型委员会12,就接着产生对模型输出进行融合的算法。可以对这种融合使用多种不同的技术,并且本专利技术不局限于任何一个特定的融合技术。下面陈述的是一个融合算法的例子。更特别地,在一个关于探针16的实施例中,可通过在预测输入空间中检索探针的邻居/同位体来执行融合算法。接着计算模型的局部性能,并基于局部模型的性能聚合多个预测。接着对每本文档来自技高网
...

【技术保护点】
一种用于产生与过程相关的预测输出的系统(10),其中该过程具有多个控制设置值以及至少一个表示过程状态的探针数据,所述系统包括:    包括多个预测模型的模型(18)委员会,每个所述模型配置用于基于来自探针(16)的数据产生各自的输出;    计算机,被编程用以将来自所述模型的输出进行融合以在所述模型输出的基础上产生至少一个预测输出。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:RV苏布PP博尼索恩F薛
申请(专利权)人:通用电气公司
类型:发明
国别省市:US[美国]

网友询问留言 已有1条评论
  • 来自[北京市电信互联网数据中心] 2014年12月09日 00:14
    惠来古称葵阳地理坐标为北纬23°07东经116°29位于广东省东南沿海潮汕地区南部地处珠江三角洲经济区和长三角经济区之间厦深高铁沈海揭惠普惠等多条高速通道贯穿其境内并拥有对外开放的窗口神泉港也是海峡西岸经济区的组成部分随着中石油2000万吨炼油项目在惠来开工建设惠来继而成为广东四大能源产业基地之一
    0
1