基于最小二乘支持向量机集成的热工过程软测量建模方法技术

技术编号:9462958 阅读:148 留言:0更新日期:2013-12-19 00:27
基于最小二乘支持向量机集成的热工过程软测量建模方法,属于热工技术和人工智能交叉技术领域。该方法选择辅助变量作为模型的输入,要预测的关键变量作为模型的输出,选取运行数据作为初始训练样本,利用软模糊均值聚类(SFCM)方法将初始样本划分成相互重叠并有差异的子数据集,在各组子数据集上建立个体模型,对个体模型的预测输出进行合成得到关键变量的估计;对于任意新采集样本xk,得到相应的预测值本发明专利技术提出了软模糊均值聚类方法,通过构建集成模型,提高了模型的预测精度,减少了模型的计算复杂度,提高了运算效率;对边界样本进行了有效地处理;有利于工程实现;能够对关键变量进行精确预测;对热工系统的优化运行有重要的意义。

【技术实现步骤摘要】
【专利摘要】,属于热工技术和人工智能交叉
。该方法选择辅助变量作为模型的输入,要预测的关键变量作为模型的输出,选取运行数据作为初始训练样本,利用软模糊均值聚类(SFCM)方法将初始样本划分成相互重叠并有差异的子数据集,在各组子数据集上建立个体模型,对个体模型的预测输出进行合成得到关键变量的估计;对于任意新采集样本xk,得到相应的预测值本专利技术提出了软模糊均值聚类方法,通过构建集成模型,提高了模型的预测精度,减少了模型的计算复杂度,提高了运算效率;对边界样本进行了有效地处理;有利于工程实现;能够对关键变量进行精确预测;对热工系统的优化运行有重要的意义。【专利说明】
本专利技术涉及一种基于最小二乘支持向量机(least squares support vectormachine, LSSVM)集成的热工过程软测量建模方法,属于热工技术和人工智能交叉

技术介绍
由于检测技术和经济等方面条件的限制,在实际热工过程中,一些表征特征的关键变量例如成分、质量等难以实现直接的测量,建立这些变量与其他变量的关系模型对实现生产过程的优化有着重要的意义。虽然部分电站安装了在线分析仪器来实现对某些参数进行检测,但这些硬件传感器价格昂贵,安装和维护成本较高,并且经常关闭维修。因此构建这些参数的软测量模型对其冗余检测也是十分必要的。由于热工过程机理的复杂性和不确定性,建立准确的机理模型往往是非常困难的。近年来,神经网络、支持向量机等人工智能的发展使基于数据的建模技术得到了广泛的应用。最小二乘支持向量机(least squares support vector machine, LSSVM)是基于统计学习理论的一种新的人工智能建模方法,它以结构风险最小化为原则,与神经网络相比具有更好的泛化能力。而且,LSSVM利用等式约束代替不等式约束,使学习问题通过线性方程组来求解,从而减少了算法的复杂度,缩短了训练时间。在利用支持向量机等方法构建模型时,模型的参数一般通过交叉验证法选取,而这种搜寻是非常耗时的。另一方面,由于操作人员的习惯和控制系统的设计,过程的运行工况往往集中在某些局部区域,而且在大范围内变化,单一的回归模型不仅会降低预测的精度,同时也使计算的复杂性增加,给模型的构建、实施以及更新维护带来困难。因此,寻找一种新的快速学习算法来准确描述非线性、大范围工况热工过程具有一定的现实意义。集成学习是构建多个学习机对同一问题进行学习,通过多个个体模型的结合,得到一个预测精度更高、普适性更强的复合全局模型。而且,利用集成学习“分而治之”的思想,将大规模数据划分成多个子数据集,可以大大缩减搜寻参数和模型训练的时间。构建有差异的个体和寻找合适的合成策略是影响集成学习性能的两个重要因素。基于实际热工过程的特点,利用经典的模糊均值聚类(fuzzy c-means, FCM)方法把原始样本划分为不同的子样本空间,可以训练出具有差异性的个体。然而,传统的FCM方法基于最大隶属度原则,往往无法很好地处理边界样本。因此,本专利技术创造性地考虑利用FCM的隶属度的截集,即软模糊均值聚类(soft fuzzy c-means, SFCM)方法来划分样本。对于相对稳定的LSSVM算法,训练得到的各个子模型之间会存在一定程度的共线性,从而使集成效果变差。偏最小二乘法(partial least squares, PLS)基于主成分提取的思想,所提取的成分既能很好地概括自变量系统中的信息,又能最好地解释因变量,并抑制系统中的噪声干扰。因此利用PLS方法作为合成策略来提取各个子模型中差异性较大的成分,去除冗余和共线性信息。
技术实现思路
本专利技术的目的在于克服现有热工过程的预测精度不高、计算耗时的不足,提出了一种基于最小二乘支持向量机(least squares support vector machine, LSSVM)集成的热工过程软测量建模方法。该方法通过多个个体模型的结合,得到一个预测精度更高、普适性更强的复合全局模型。而且,利用集成学习“分而治之”的原则,将大规模数据划分成多个子数据集,可以很大程度上缩减搜寻参数和训练模型的时间。该方法预测精度高、成本低、计算速度快,有利于应用于工程实践之中。基于实际热工过程的特点,首先利用软模糊均值聚类(soft fuzzyc-means, SFCM)把原始样本划分为不同的子样本空间;然后在各子空间上建立具有差异性的最小二乘支持向量机(least squares support vector machine, LSSVM)个体学习机;最后利用偏最小二乘回归(partial least squares,PLS)作为合成策略,得到关键变量最终的预测输出。本专利技术的技术方案按以下步骤进行:,该方法步骤为:步骤1:根据相关机理分析,选择合适的辅助变量作为模型的输入,要预测的关键变量作为模型的输出。选取工况跨度较大且具有代表性的运行数据作为初始训练样本,并可以记为?(χ,,.&)!&,其中Xj e Rp表示第j组作为输入变量,Yj e R为第j组作为输出变量,P为输入变量个数,N为样本数量。步骤2:利用软模糊均值聚类方法,将采集的原始数据划分成相互重叠并有差异的子数据集。所述软模糊均值聚类方法为:定义目标函数【权利要求】1.,其特征在于,该方法步骤为:步骤1:选择辅助变量作为模型的输入,要预测的关键变量作为模型的输出,选择运行数据作为初始训练样本,记为,其中Xj e Rp表示第j组作为输入变量,y」e R为第j组作为输出变量,P为输入变量个数,N为样本数量; 步骤2:利用软模糊均值聚类方法,将采集的原始数据划分成相互重叠并有差异的子数据集; 所述软模糊均值聚类方法为:定义目标函数 2.根据权利要求1所述的的模型,其特征在于,所述模型根据权利要求1所述的建模得到。【文档编号】G06F17/30GK103455635SQ201310438819【公开日】2013年12月18日 申请日期:2013年9月24日 优先权日:2013年9月24日 【专利技术者】吕游, 杨婷婷, 刘吉臻 申请人:华北电力大学本文档来自技高网
...

【技术保护点】
基于最小二乘支持向量机集成的热工过程软测量建模方法,其特征在于,该方法步骤为:步骤1:选择辅助变量作为模型的输入,要预测的关键变量作为模型的输出,选择运行数据作为初始训练样本,记为其中xj∈Rp表示第j组作为输入变量,yj∈R为第j组作为输出变量,p为输入变量个数,N为样本数量;步骤2:利用软模糊均值聚类方法,将采集的原始数据划分成相互重叠并有差异的子数据集;所述软模糊均值聚类方法为:定义目标函数minJ=Σi=1TΣj=1Nμijm||xj-vi||2---(1)其中,m=2,T为子类个数,通过以下公式进行迭代求解上式,求得最终的隶属度μj:vi=Σj=1Nμijmxj/Σj=1Nμijm,i=1,···,T---(2)μij=1Σk=1T(||xj-vi||/||xj-vk||)2m-1,j=1,···,N---(3)利用隶属度的截集对初始训练样本进行划分,以得到子样本集,对样本xj及其隶属度μij,i=1,…,T,考虑以下两条判定规则:(ⅰ)若存在其中则把xj划分为第k类子集中,此时xj属于单个子类;(ⅱ)否则,对μij若有则把xj划分为第i类子集中,此时xj可能属于多个子类,这里δ是表征类间的界限余量参数;利用以上规则对原始数据样本划分,得到T个不同的子样本空间L1,...,LT;步骤3:把各组子数据集样本作为训练样本,利用最小二乘支持向量机方法建立个体模型;记子空间Lt(t=1,...,T)包含n个样本最小二乘支持向量机方法描述为以下优化问题:minw,b,ξJ(w,ξ)=12wTw+12γΣi=1nξi2---(4)其中,是核空间映射函数,w为权重向量,γ为惩罚系数,ξi为误差变量;为了解此优化问题,定义Lagrange函数如下:其中,α=[α1,…,αn]T为Lagrange乘子;对Lagrange函数进行求解,将其转化为求解线性方程组:01→T1→Ω+1/γIbα=0y---(6)其中,y=[y1,…,yn]T,I为n×n阶单位矩阵,Ω={Ωkl|k,l=1,…,n},且定义为核函数;通过求解方程组(6)得到α和b的值,从而得到LSSVM回归估计为:h(x)=Σi=1nαiK(x,xi)+b---(7)其中核函数选取为高斯径向基函数K(x,xi)=exp(?||x?xi||2/σ2),其中σ为核函数参数;步骤4:把样本隶属度对输出与各个子模型的输出共同作为合成策略的输入变量,利用偏最小二乘回归(partial?least?squares,?PLS)作为合成策略消除各个子模型之间以及隶属度变量间的相关性,得到关键变量的预测模型;偏最小二乘回归根据Wold提出的非线性迭代算法计算,形式如下:????????????????????????????fPLS(Z)=Z·W(PTW)?1BqT???????(8)其中,W是提取各主成分后得到权重矩阵,P是输入负荷矩阵,q是输出负荷向量,B是系数矩阵;在各个体模型上对训练样本进行估计,得到其预测值其中i=1,…,N,t=1,…,T;把和μi其作为合成策略的输入变量,实测yi值作为输出,得到重构样本其中并根据式(8)得到关键变量的预测模型f(·):y^=f(h1(x),h2(x),···,hT(x);μ)---(9)其中,T是个体LSSVM模型的个数,μ为x的隶属度;对于任意新采集的样本xk,根据式(3)求得对各子类的模糊隶属度向量μk,然后根据 训练好的各个个体LSSVM模型ht(·)和合成函数f(·),便可得到相应的预测值y^k=f(h1(xk),···,hT(xk);μk).FDA0000386286680000011.jpg,FDA0000386286680000015.jpg,FDA0000386286680000016.jpg,FDA0000386286680000017.jpg,FDA0000386286680000018.jpg,FDA0000386286680000022.jpg,F...

【技术特征摘要】

【专利技术属性】
技术研发人员:吕游杨婷婷刘吉臻
申请(专利权)人:华北电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1