结合过程先验和数据驱动模型的混合建模方法及系统技术方案

技术编号:12071458 阅读:127 留言:0更新日期:2015-09-18 04:36
本发明专利技术揭示了一种结合过程先验和数据驱动模型的混合建模方法及系统,所述方法包括:从已知的数据驱动模型中选择数据驱动模型和合适的模型结构建立对应模型的数学关系表达式,将所有的模型参数按照一定的顺序排列;对模型过程先验进行验证,得到检验模型违反过程先验程度的约束方程;将样本的模型输出和观测值比较,建立检验模型拟合训练样本程度的优化目标方程;将约束方程和优化目标方程联合,构建约束优化问题,采用约束处理智能算法求解最优参数解;将求解得到的最优参数解,作为S1的模型参数解,代入原模型中,用于模型预测或模型优化。本发明专利技术可以在少量数据样本的神经网络训练下得到更符合先验知识的模型,避免过拟合现象的发生。

【技术实现步骤摘要】

本专利技术属于化工过程建模领域,涉及一种过程建模方法,尤其涉及一种结合过程 先验和数据驱动模型的混合建模方法;同时,本专利技术还涉及一种结合过程先验和数据驱动 模型的混合模型。
技术介绍
传统的机理信息建模方法必须对建模的系统有足够的了解,并且通过质量能量方 程、反应动力学方程等公式建立精确的描述模型。但是,实际工业过程复杂度高、反应机理 多,难以准确把握,导致机理信息建模常难以达到过程系统模型的精度要求。基于数据驱动 的方法迅速发展,并广泛应用于化工过程建模与优化。数据驱动建模方法的优点在于仅依 托于历史数据或现场实时数据,不需要明确的机理信息。对于复杂的非线性过程,在能够获 取充足的输入输出样本下,数据驱动建模常具有较好的效果。然而,数据驱动建模方法也有 明显的缺点,如机理表达的模糊,外延特性不好,以及在小样本建模中常见的过拟合现象。 目前的主要避免过拟合的方法主要利用样本自身信息(如外部检验法、引导重采 样和噪声注入技术扩充样本法)实现对过拟合现象的一定制约,但研宄表明小样本建模作 用有限。过程对象本身存在诸多的机理信息难以应用,例如过程中大量的可以分析得到的 一阶信息(表现为单调性)、二阶信息(表现为凹凸性)和输出限制信息。一些学者也提 出综合过程机理的数据驱动建模方法(如带有机理的代理模型方法、输出增益检测的神经 网络模型、合概率密度估计的建模方法和单调神经网络),但是综合建模方法也存在一些缺 陷,要么模型结构过于简单,要么建模对象约束较高。 传统的机理信息结合样本信息的建模方法在克服过拟合问题上存在诸多的缺陷, 容易对部分有用信息进行舍弃。有鉴于此,如今迫切需要设计一种新的建模方法和模型,综 合利用机理信息和样本信息,客服小样本建模的过拟合问题。
技术实现思路
本专利技术所要解决的技术问题是:提供一种结合过程先验和数据驱动模型的混合建 模方法,可以在少量数据样本的神经网络训练下得到更符合先验知识的模型,避免过拟合 现象的发生。 此外,本专利技术还提供一种结合过程先验和数据驱动模型的混合系统,可以在少量 数据样本的情形下训练得到更符合先验知识的数据驱动模型,避免过拟合现象的发生和提 尚丰旲型鲁棒性。 为解决上述技术问题,本专利技术采用如下技术方案: -种结合过程先验和数据驱动模型的混合建模方法,所述方法包括如下步骤: 步骤S1、从已知的数据驱动模型中选择合适的数据驱动模型和合适的模型结构, 建立对应模型的数学关系表达式,将所有的模型参数按照一定的顺序排列; 步骤S2、定步扫描方法对模型过程先验(主要包括输出响应信息、输出响应的一 阶信息(表现为单调性)和二阶信息(表现为凹凸性)进行验证,得到检验模型违反过程 先验程度的约束方程; 步骤S3、将样本的模型输出和观测值比较,根据均方差公式和正则化方法建立检 验模型拟合训练样本程度的优化目标方程; 步骤S4、将约束方程和优化目标方程联合,构建约束优化问题,采用约束处理智能 算法求解最优参数解; 步骤S5、将求解得到的最优参数解,作为Sl的模型参数解,代入原模型中,用于模 型预测或模型优化。 作为本专利技术的一种优选方案,所述步骤Sl的模型数学关系表达式和模型参数排 列:选择某一数据驱动模型,一般的我们常选择BP神经网络模型、响应曲面模型、支持向量 机等。 对于BP神经网络模型,其模型输入输出关系式为:其中: par为模型参数排列,在BP网络模型中为所有权值和阈值的一种固定排列,包括 所有的Wij, Tli, 和Θ p X为输入向量组合,也可表示成(X1, X2,…,X1), Wu为输入层到隐含层的权值系数, Θ」为隐含层各神经元的阈值系数, Tli为隐含层到输出层的权值系数, Θ 输出层神经元的阈值系数, L为输入层神经元数,由实际系统的输入变量决定, H为隐含层神经元数,为建模者根据经验或者试凑法不确定方法来决定, B为输出层神经元数,由于研宄对象为多输入单输出对象,输出层神经元数取1, fi_h为隐含层激活函数,激活函数种类繁多,简单线性函数(purelin)、有sigmoid 函数(tansig和logsig)、正弦函数、双曲正切和反正切,自适应多项式函数等。常用的包括 tansig,Iogsig 和 purelin 三种,一般隐含层选取 tansig 或 logsig, fh_。为隐含层激活函数,一般选取purelin ; 类似的,对于响应曲面模型,其模型输入输出关系式为: 其中: par表不模型参数组合,包含b。、t^、bjk和b p Idci为常数项, bi为输入Xi的一阶项, bjk为输入X』和X k的相关系数项, Id1为输入X1的二阶项, Xi为第i个输入变量,共计L维; 作为本专利技术的一种优选方案,所述步骤S2通过以下3个子步骤获得模型的约束方 程表达式: 步骤S2. 1、检测点采样:在整个空间用固定步长Au将整个空间进行划分成多个 子空间,分别在子空间内采样,作为输出范围先验的多次检测。同样的,用固采定步长Aij 将已知的单调性先验和凹凸性先验的区间划分成个更小的M,7子区间,标记为 步骤S2. 2、采样点的先验检测:对于整个对象输入空间内的输出范围检测,可通 过采样点的输出值与输出上下限比较得到,已知输出上限为yH,下限为5^,比较检验模型 输出值与它们的关系,当且仅当Λ {^,办时,输出范围先验正确,否则在该小区域内 违反输出范围先验。若所有采样点均符合输出范围检验结果,则近似认为模型对该条单调 先验无违反。对于该小区间内的单调信息正确性检验可通过多次固定其他输入变量值,仅 求解区间两端点(和的输出值,比较大小检验单调性信息,若输出值比较结果与 单调信息符合,近似认为该小区间符合单调信息。例如,若该区间为单调递增区间,必有 λ >iu,若为单调递减区间,必有λ <?,"ρ若所有小区间均符合单调信息检验结果,则 近似认为模型对该条单调先验无违反。同理,检验该小区间的凹凸性可采用两端点 和^ )和中点的输出值比较,近似检验小区间的凹凸信息。例如,若该区间为严 格凸区间,必有+ > 2 X ,若为严格凹区间,必有+ y< 2 X 。可用符号 函数表示每一条先验的每一次检验结果,如公式(3)、公式(4)和公式(5),公式(3)用于检 验输出范围,公式(4)用于检验单调性先验,公式(5)用于检验凹凸性先验; 其中,h(i,j,m)为第i维上第j条已知先验的第m次检测结果; 如果每一个h(i,j,m)对应的值均为"1",则近似认为模型完全符合对应先验; h (i,j,m)为"-1",模型在对应的小区间内必然违背对应先验知识; 步骤S2. 3、违反程度统计:根据统计"-1"的次数占所有扫描检验次数的比例 viol,刻画模型的先验机理违反程度,计算公式如下: 如果系统模型完全符合所有过程先验,viol值为0。viol值较小代表模型轻微违 反已知的过程先验;Viol越接近1,表示模型违反过程的程度越大。 作为本专利技术的一种优选方案,所述步骤S3通过以下2个子步骤获得模型的优化目 标函数F(W): 步骤S3. 1、构建数据驱动模型输出值与测量值的均方差模型,见公式(7):(7) 为第k个样本的模型输出,计算公式参考模本文档来自技高网
...

【技术保护点】
一种结合过程先验和数据驱动模型的混合建模方法,其特征在于,利用过程先验和机理信息改进数据驱动模型的准确性和精度,提高模型预测能力和鲁棒性,避免过拟合发生;机理信息主要包括输出响应信息、输出响应阶次信息;所述方法包括如下步骤:步骤S1、从已知的数据驱动模型中选择合适的数据驱动模型和合适的模型结构,建立对应模型的数学关系表达式,将所有的模型参数按照一定的顺序排列;步骤S2、定步扫描方法对模型过程先验进行验证,得到检验模型违反过程先验程度的约束方程;模型过程先验主要包括输出响应信息、输出响应的表现为单调性的一阶信息和表现为凹凸性的二阶信息;步骤S3、将样本的模型输出和观测值比较,根据均方差公式和正则化方法建立检验模型拟合训练样本程度的优化目标方程;步骤S4、将约束方程和优化目标方程联合,构建约束优化问题,采用约束处理智能算法求解最优参数解;步骤S5、将求解得到的最优参数解,作为步骤S1的模型参数解,代入原模型中,用于模型预测或模型优化。

【技术特征摘要】

【专利技术属性】
技术研发人员:李绍军成祥杨一航许文夕郑文静
申请(专利权)人:华东理工大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1