当前位置: 首页 > 专利查询>浙江大学专利>正文

面向流式大数据的并行概率变分软测量建模方法技术

技术编号:22022432 阅读:48 留言:0更新日期:2019-09-04 01:20
本发明专利技术公开了一种面向流式大数据的并行概率变分软测量建模方法,该方法在原始的变分有监督因子分析模型的基础上,分别引入流式更新方法和对称相对熵,根据实际流式大数据的变化而实时更新模型参数的后验分布和决定先验分布的选择,从而实现模型的自适应更新,并结合并行计算策略,进一步提高模型更新效率;本发明专利技术能够针对实时性要求较高的流式大数据场景,在一定程度上改善了模型性能,并结合并行计算策略提高了模型更新效率,达到了面对流式大数据自适应软测量的目的。

Parallel Probabilistic Variational Soft Sensing Modeling Method for Large Flow Data

【技术实现步骤摘要】
面向流式大数据的并行概率变分软测量建模方法
本专利技术属于工业过程控制及软测量领域,涉及一种面向流式大数据的并行概率变分软测量建模方法。
技术介绍
在工业过程中,软测量模型被广泛地用于预测过程中因为恶劣测量环境、昂贵的测量仪器和大时间滞后等因素导致难以在线测量的关键过程变量。近来年,基于数据驱动的软测量建模方法依据过程运行时采集的数据建模,无须依赖过程机理知识,受到了研究者和生产者极大的青睐。相比机理建模方法,数据驱动方法能够更加真实地反映过程实际运行状态,其所建模型也更加可靠。但是,当软测量模型投入实际应用后,其预测性能往往会随着过程状态变化、催化剂活性下降、原材料变化和仪表漂移等因素而慢慢降低。因此,软测量模型需要不断地进行自适应更新,从而使得模型能有效地跟踪过程的变化,保证了过程数据的及时有效监测,并及时地做出控制策略的调整。研究学者为此已经提出一些不同的更新策略,比如递归模型、滑动窗模型和即时学习模型等。在信息技术发展过程中,工业过程也来到了大数据时代。与此同时,传感器数据急剧增加,数据产生速度越来越快,数据状态信息随时间变化而发生动态改变,形成了一种新的数据形式——流式大数据。流式大数据就是实时、连续、数据信息动态改变的有序序列。在流式大数据的分析中,无法存储全部数据流,通俗地讲,若将内存比作水库,批量大数据就是水库里的水,而流式大数据则是流进水库的水,但是流水量过于庞大以至于内存无法全部容纳。因此,流式计算不再存储流式数据,而是在内存中直接对到来的流式数据进行实时分析。而传统的工业过程自适应软测量方法需要在保存部分或者全部历史数据的前提下进行更新,面对实际流式大数据的实时特性时有较大的局限性;本专利技术针对工业流式大数据软测量场景,结合概率变分有监督因子分析方法,缓解了过拟合问题,并引入并行计算策略,提高了模型更新效率。
技术实现思路
针对目前工业大数据场景,本专利技术提出了一种面向流式大数据的并行概率变分软测量建模方法,该方法将流式变分推断和有监督因子分析结合,并引入了对称相对熵来决定先验的选取,又进一步结合并行计算策略提高模型更新效率,从而实现了工业流式大数据的自适应软测量。针对现有技术存在的问题,本专利技术具体技术方案如下:一种面向流式大数据的并行概率变分软测量建模方法,其中,所述的并行概率变分软测量建模方法步骤如下:(1)初始化先验超参数a,b,ρ,变分超参数λ和τ,并收集历史工业过程中的训练数据Fnm=[X,Y]T,Fnm∈RN×M,N表示样本个数,M表示过程变量个数,R表示实数集;(2)将训练数据F分为Z个数据块,并通过下式计算求得变分超参数λ和τ:其中,表示隐变量,t的均值,表示隐变量t的方差,τm表示噪声方差,<Wm>表示负载矩阵Wm的期望,<μm>表示均值μm的期望且Fmn表示训练数据,I表示单位矩阵,L为并行计算的参数部分。其中,表示负载矩阵Wm的均值,表示负载矩阵Wm的方差,<tn>表示隐变量t的期望即diag<α>表示α的对角矩阵,S为并行计算的参数部分。其中,和表示α的参数,其中,表示μm均值,表示μm方差,H为并行计算的参数部分。其中,Q为τm并行计算的参数部分。(3)将步骤(2)中Z个数据块中的变分超参数λ和τ整合,并不断保持参数更新直到最大变分上界收敛或者迭代次数达到最大并得到后验分布q(θ),其中如下式所示:其中,Eq(Θ)表示参数期望,lnp(F,Θ)表示联合概率分布的对数似然,lnq(Θ)变分参数概率分布的对数似然;(4)当新过程变量Xnew到来时,隐因子可由下式得到:其中,λt表示隐因子的期望,τx表示x上噪声方差,<Wx>表示x上负载矩阵的期望,<μx>表示x上均值的期望;那么软测量预测结果为:其中,<Wy>表示y上负载矩阵的期望,<μy>表示y上均值的期望;(5)当质量变量Ynew的输出获得时得到新训练数据Fnew=(Xnew,Ynew),将步骤(3)得到的后验分布q(θ)作为此次的先验分布,并将新训练数据再次分为Z个数据块,通过下式并行计算策略求得L,S,Q,H更新参数t,W,μ,τ,其中参数W,μ的更新公式变更为:这里,λ*表示通过计算新训练数据Fnew得到的后验分布。(7)对上述数据块Z求得的参数进行整合并不断更新参数直到更新模式下的最大变分上界收敛或者迭代次数达到最大,其中为:(7)通过下式计算新旧分布之间的对称相对熵:当结果KL(old,new)小于设定的阈值SKLts时,通过步骤(5)和(6)更新参数;否则,初始化参数λ的先验;(8)当有新数据集获得时,重复步骤(4)-(7),从而实现自适应并行软测量。有现有技术相比,本专利技术具有的有益效果是:在原始的变分有监督因子分析模型的基础上,分别引入流式更新方法和对称相对熵,根据实际流式大数据的变化而实时更新模型参数的后验分布和决定先验分布的选择,从而实现模型的自适应更新,并结合并行计算策略,进一步提高模型更新效率;相较于其他传统方法,本专利技术能够针对实时性要求较高的流式大数据场景,在一定程度上改善了模型性能,并结合并行计算策略提高了模型更新效率,达到了面对流式大数据自适应软测量的目的。附图说明图1是并行概率变分软测量模型的流程图;图2是即时学习概率变分软测量模型的预测输出结果图;图3是滑动窗概率变分软测量模型的预测输出结果图;图4是并行概率变分软测量模型的预测输出结果图。具体实施方式下面结合具体实施方式对本专利技术面向流式大数据的并行概率变分软测量建模方法作进一步的详述。一种面向流式大数据的并行概率变分软测量建模方法,其中,整个并行概率变分软测量模型的流程如图1所示,步骤具体如下:(1)初始化先验超参数a,b,ρ,变分超参数λ和τ,并收集历史工业过程中的训练数据Fnm=[X,Y]T,Fnm∈RN×M,N表示样本个数,M表示过程变量个数,R表示实数集;(2)将训练数据F分为Z个数据块,并通过下式计算求得变分超参数λ和τ:其中,表示隐变量t的均值,表示隐变量t的方差,τm表示噪声方差,<Wm>表示负载矩阵Wm的期望,<μm>表示均值μm的期望且Fmn表示训练数据,I表示单位矩阵,L为并行计算的参数部分。其中,表示负载矩阵Wm的均值,表示负载矩阵Wm的方差,<tn>表示隐变量t的期望即diag<α>表示α的对角矩阵,S为并行计算的参数部分。其中,和表示α的参数,其中,表示μm均值,表示μm方差,H为并行计算的参数部分。其中,Q为τm并行计算的参数部分。由于L,S,H,Q中参数计算部分是相互独立的,也就是说,该模型的计算效率可以通过并行策略进一步提高。而且,理论上并行计算和非并行计算得到的结果应该是一致的。因此,这里我们的出发点是为了进一步提高模型的更新效果而采用并行计算的策略。另一方面,这样做能够有效针对实时性要求较高的流式大数据场景,在一定程度上改善了模型性能。(3)将步骤(2)中Z个数据块中的变分超参数λ和τ整合,并不断保持参数更新直到最大变分上界收敛或者迭代次数达到最大并得到后验分布q(θ),其中如下式所示:其中,Eq(Θ)表示参数期望,lnp(F,Θ)表示联合概本文档来自技高网
...

【技术保护点】
1.一种面向流式大数据的并行概率变分软测量建模方法,其特征在于,所述并行概率变分软测量建模方法步骤如下:(1)初始化先验超参数a,b,ρ,变分超参数λ和τ,并收集历史工业过程中的训练数据Fnm=[X,Y]

【技术特征摘要】
1.一种面向流式大数据的并行概率变分软测量建模方法,其特征在于,所述并行概率变分软测量建模方法步骤如下:(1)初始化先验超参数a,b,ρ,变分超参数λ和τ,并收集历史工业过程中的训练数据Fnm=[X,Y]T,Fnm∈RN×M,N表示样本个数,M表示过程变量个数,R表示实数集;(2)将训练数据F分为Z个数据块,并通过下式计算求得变分超参数λ和τ:其中,表示隐变量,t的均值,表示隐变量t的方差,τm表示噪声方差,<Wm>表示负载矩阵Wm的期望,<μm>表示均值μm的期望且Fmn表示训练数据,I表示单位矩阵,L为并行计算的参数部分。其中,表示负载矩阵Wm的均值,表示负载矩阵Wm的方差,<tn>表示隐变量t的期望即diag<α>表示α的对角矩阵,S为并行计算的参数部分。其中,和表示α的参数,其中,表示μm均值,表示μm方差,H为并行计算的参数部分。其中,Q为τm并行计算的参数部分。(3)将步骤(2)中Z个数据块中的变分超参数λ和τ整合,并不断保持参数更新直到最大变分上界收敛或者迭代次数达到最大并得到后验分布q(θ),其中如下式所示:其中,Eq(Θ)表示参数期望,lnp(F,Θ)表...

【专利技术属性】
技术研发人员:葛志强杨泽宇
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1