基于偏最小二乘的变量选择方法技术

技术编号:8323721 阅读:241 留言:0更新日期:2013-02-14 02:34
基于偏最小二乘的变量选择方法,涉及基于偏最小二乘的变量选择方法。它为了解决目前的变量选择方法存在的预测能力差,无法提高预测性能的问题。基于偏最小二乘的变量选择方法为:对待分析变量进行预处理,获取标准化变量集;根据标准化变量集计算回归向量,所述的回归向量的各元素表示相应的输入变量对于输出的贡献率,所述的贡献率的排序顺序为依次减小的顺序;根据回归向量的贡献率的排序顺序对输入变量进行排序,获取输入变量序列Xior;对输入变量序列Xior中的所有输入变量进行相关性检验;对输入变量选择计算获取回归系数。本发明专利技术应用于钢铁、锅炉、化工、制药等诸多领域的过程控制系统中。

【技术实现步骤摘要】

本专利技术涉及一种选择方法,具体涉及。
技术介绍
过程控制系统涉及钢铁、锅炉、化工、制药等诸多领域,已经成为现代工业生产中重要的组成部分。现代过程控制系统往往会对生产过程中的许多状态变量进行长期的测量,从而获得大量现场监控数据。如何对这些数据进行合理、高效地利用,从而保证最终产品的质量,是现在工业过程控制系统所面临的主要挑战之一。尤其是当所监测的变量规模巨大时,如果直接使用全部变量进行分析,则会对系统造成巨大的计算压力,甚至影响到系统的控制 效果。因此,在不损失主要信息的前提下,通过提取关键变量来简化控制系统成为一种合理的选择。一种好的变量选择方法,可以有效的减少变量数量,并获得一个准确、合理的回归模型。目前,变量选择方法的设计已经受到了越来越多的重视。目前的变量选择方法存在的预测能力差,无法提高预测性能的问题。
技术实现思路
本专利技术为了解决目前的变量选择方法存在的预测能力差,无法提高预测性能的问题,从而提出了。,它包括下述步骤步骤一、对待分析变量进行预处理,获取标准化变量集;步骤二、根据标准化变量集计算回归向量,所述的回归向量的各元素表示相应的输入变量对于输出的贡献率,所述的贡献率的排序顺序为依次减小的顺序;步骤三、根据回归向量的贡献率的排序顺序对输入变量进行排序,获取输入变量序列Xior ;步骤四、对输入变量序列Xior中的所有输入变量进行相关性检验;步骤五、对输入变量选择计算获取回归系数。本专利技术计算计算回归向量、留一交叉检验方法以及变量进行相关性检验提高了变量预测能力的评估性能,达到了变量选择的预测能力好,提高预测性能的目的。附图说明图I为本专利技术所述的的流程图。具体实施例方式具体实施方式一、结合图I具体说明本实施方式,本实施方式所述的,它包括下述步骤步骤一、对待分析变量进行预处理,获取标准化变量集;步骤二、根据标准化变量集计算回归向量,所述的回归向量的各元素表示相应的输入变量对于输出的贡献率,所述的贡献率的排序顺序为依次减小的顺序;步骤三、根据回归向量的贡献率的排序顺序对输入变量进行排序,获取输入变量序列Xior ;步骤四、对输入变量序列Xior中的所有输入变量进行相关性检验;步骤五、对输入变量选择计算获取回归系数。具体实施方式二、本实施方式与具体实施方式一所述的的区别在于,步骤一所述的对待分析变量进行预处理,获取标准化变量集的具体过程为待分析变量的集合构成变量集X,初始化变量集X,根据归一化处理剔除变量集X 的野值获取标准化变量集,所述的标准化变量集为均值为0,方差为I的标准化变量集。本实施方式通过对待分析变量进行预处理保证了分析的有效性。具体实施方式三、本实施方式与具体实施方式一所述的的区别在于,步骤二所述的根据标准化变量集计算回归向量的具体过程为输入变量存在较大的冗余,具有自相关性,不利于后面的分析和处理,根据留一交叉检验方法确定标准化变量集的潜在变量的数目nlv,所述的潜在变量的数目nlv再根据改进的偏差最小二乘回归方法得到回归向量b,其各兀素代表相应的输入变量对于输出的贡献率。本实施方式所述的改进的偏差最小二乘回归方法可以保证数字计算的稳定性,提高运算速度。具体实施方式四、本实施方式与具体实施方式一或三所述的的区别在于,步骤三所述的根据回归向量的贡献率的排序顺序对输入变量进行排序,获取变量序列Xior的具体过程为回归向量b各元素的绝对值按照回归向量的贡献率依次减小的顺序排序,获取输入变量序列Xior。具体实施方式五、本实施方式与具体实施方式一所述的的区别在于,步骤四所述的对输入变量序列Xior中的所有元素进行相关性检验的具体过程为步骤四一、在输入变量序列Xior中去除与任意一个输入变量相关的其他输入变量,获取无冗余的变量序列Xor ;步骤四二、根据回归向量的贡献率由低到高的顺序,对无冗余的变量序列Xor中各变量进行相关性检验,直到所有变量都检验完成。具体实施方式六、本实施方式与具体实施方式一所述的的区别在于,步骤五所述的对输入变量选择计算获取回归系数的具体过程为步骤五一、从无冗余的变量序列Xor中选取前k个输入变量构成第一个子集Xl,根据检验方法计算该第一个子集Xl的预测性能;其中,k=3,步骤五二、在第一个子集Xl上增加i个输入变量,得到第二个子集X2,该子集有k=k+i个输入变量,根据检验方法计算该二个子集X2的预测性能;其中,i= l,步骤五三、重复步骤二,直到计算完无冗余的变量序列Xor中的所有输入变量的预测性能;步骤五四、计算无冗余的变量序列Xor中所有输入变量的预测性能的均方根误差,获取均方根误差最小的输入变量,根据该输入变量计算回归矩阵偏差系数C、贡献率Bn和Bn经过逆归一化构成后得到的贡献率B。可以写成如下形式Y=Bn X其中,Y是计算的输出,X是选出的输入变量,Bn是贡献率。由于在前面的步骤中对变量进行了归一化处理,所以要还原成未处理的变量,以方便实际使用,记为 Y=BX+C其中,X是输入变量,B是Bn经过逆归一化构成后得到的贡献率,C是偏差系数,是在逆归一化过程中产生的。具体实施方式七、本实施方式提供一种应用于工业过程的田纳西-伊斯曼模型的具体实例如下,所述的田纳西-伊斯曼模型为一个工业过程的标准模型,通常用来验证方法的优劣。获取田纳西-伊斯曼模型中11输入变量在20个采样时刻数据,以及相应时刻输出变量的数据。表I表示数据集-初始数据集X、Y,并执行归一化操作。表I本文档来自技高网...

【技术保护点】
基于偏最小二乘的变量选择方法,其特征在于,它包括下述步骤:步骤一、对待分析变量进行预处理,获取标准化变量集;步骤二、根据标准化变量集计算回归向量,所述的回归向量的各元素表示相应的输入变量对于输出的贡献率,所述的贡献率的排序顺序为依次减小的顺序;步骤三、根据回归向量的贡献率的排序顺序对输入变量进行排序,获取输入变量序列Xior;步骤四、对输入变量序列Xior中的所有输入变量进行相关性检验;步骤五、对输入变量选择计算获取回归系数。

【技术特征摘要】
1.基于偏最小二乘的变量选择方法,其特征在于,它包括下述步骤 步骤一、对待分析变量进行预处理,获取标准化变量集; 步骤二、根据标准化变量集计算回归向量,所述的回归向量的各元素表示相应的输入变量对于输出的贡献率,所述的贡献率的排序顺序为依次减小的顺序; 步骤三、根据回归向量的贡献率的排序顺序对输入变量进行排序,获取输入变量序列Xior ; 步骤四、对输入变量序列Xior中的所有输入变量进行相关性检验; 步骤五、对输入变量选择计算获取回归系数。2.根据权利要求I所述的基于偏最小二乘的变量选择方法,其特征在于,步骤一所述的对待分析变量进行预处理,获取标准化变量集的具体过程为 待分析变量的集合构成变量集X,初始化变量集X,根据归一化处理剔除变量集X的野值获取标准化变量集,所述的标准化变量集为均值为0,方差为I的标准化变量集。3.根据权利要求I所述的基于偏最小二乘的变量选择方法,其特征在于,步骤二所述的根据标准化变量集计算回归向量的具体过程为 根据留一交叉检验方法确定标准化变量集的潜在变量的数目nlv, 所述的潜在变量的数目nlv再根据改进的偏差最小二乘回归方法得到回归向量b,其各兀素代表相应的输入变量对于输出的贡献率。4.根据权利要求I或3所述的基于偏最小二乘的变量选择方法,其特征在于,步骤三所述的根据回归向量的贡献率的排序顺序对输入变量进行排序,获取变量序列Xior的具...

【专利技术属性】
技术研发人员:尹珅卫作龙王光高会军刘方舟
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1