当前位置: 首页 > 专利查询>东北大学专利>正文

稀疏数据过程建模方法技术

技术编号:2772541 阅读:297 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及应用过程神经网络模型建立稀疏数据过程预测模型的方法。在对稀疏的样本数据进行预处理的基础上,应用基于离散Walsh变换的学习算法,提高过程神经网络的学习效率和建模精度。为使建立的过程预测模型能够及时修正预测偏差,根据稀疏数据过程的特点,采用了数据采样周期间网络滚动学习的方法,通过最新的采样数据及时对预测网络模型进行在线修正,从而进一步提高了预测模型的准确性。本发明专利技术为解决一类稀疏数据过程的建模问题提供了一条有效的途径。

Sparse data process modeling method

The invention relates to a method for establishing a sparse data process prediction model by applying a neural network model. Based on the pretreatment of sparse sample data, the learning algorithm based on discrete Walsh transform is applied to improve the learning efficiency and modeling accuracy of the process neural network. The prediction model can timely correct the forecast error in order to make the process, according to the characteristics of sparse data process, using the method of data sampling during the week network rolling learning, by sampling the latest data timely prediction of network model for online correction, so as to further improve the accuracy of prediction model. The invention provides an effective way to solve the modeling problem of a sparse data process.

【技术实现步骤摘要】

本专利技术涉及一种应用智能信息处理技术的过程建模方法,特别是一种稀疏数据过程的建模方法。
技术介绍
在许多工业过程中,由于受到现场条件,工艺过程和检测设备等因素的影响,采集样本数据的时间间隔较长,数据量有限,造成了样本数据的稀疏。因此,如何根据稀疏数据过程的特点建立过程的预测模型,并通过预测模型产生较为连续的密集预报数据,从而有利于过程控制是一个重要的研究课题。 目前在系统建模方面,以神经网络为代表的辨识建模方法发展迅速。但是目前用于系统建模的神经网络大多是前馈网络,其特点是网络输入均为与时间无关的常量,主要解决数据空间上的映射问题,这对于密集采样数据过程的建模非常有效。但是对于稀疏数据过程,为了充分利用有限数据所包含的信息,仅仅考虑数据的空间聚合效应是不够的,还要充分考虑数据的时间累计效应,因为工业过程中的数据往往是与时间有关的。因此同时利用稀疏数据的空间与时间效应,产生密集的过程预报数据,及时修正网络模型的预报误差,以利于过程的监测与优化控制,是传统的神经网络建模方法难以解决的问题。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种基于过程神经网络的建模方法,以解决稀疏数据过程的建模问题,为稀疏数据过程的建模提供一条有效的途径。 本专利技术是通过以下技术方案实现的数据预处理,数据扩充,过程神经网络建模与在线滚动学习。通过对采样数据的预处理,平滑采样数据中因干扰而产生的伪数据;然后对处理后的数据进行扩充,产生所需时间间隔的较为密集的数据用于网络模型训练,目的是使网络预测模型能够输出所需要的时间点上的数据,弥补因检测困难而导致实际采样数据稀少、难以对过程进行有效监测与控制的问题;应用过程神经元建立过程的神经网络模型,过程神经元的输入和权值是随时间变化的函数或过程,其聚合运算既有对空间的多输入聚合,也有对时间过程的累积聚合,可以充分利用稀疏数据所包含的空间与时间信息;应用经过处理后的离线数据对过程神经网络模型离线训练后,将网络模型投入实际预测过程,在采样时刻间隙,当检测到预测值不正确时,则立即对已有的实际数据进行处理,采用处理后的数据在线训练网络,使网络在训练过程中学到新的信息。由于稀疏数据过程采样周期长,有些甚至是离线检测数据,因此上述采样时刻间隙滚动学习的方法是可行的。 以下对本
技术实现思路
作进一步的说明,具体内容如下 1、数据预处理 假设有n组现场采样数据,每组的采样数为m,不同组采样数据同一时刻的平均值 方差为σ,如果对应同一时刻各组的采样值都在 之间,表示该组数据中并不存在伪数据。若某个采样值xnm不在 之间时,则当时,取当时,取 对采样数据平滑后,对样本数据进行归一化处理。考虑到神经网络每层的激励函数都选用Sigmoid函数,因此将网络的输入输出数据限制在区间内,应用式(1)的变换,将网络的输入输出变量近似为正态标准分布。 式中x为经过伪数据处理的采样数据; 为经过归一化处理后的数据;xmin为神经网络输入或输出量的最小值;xmax为神经网络输入或输出量的最大值,ρ为比例系数,一般取ρ=0.1~0.9。 2、数据扩充 采用递推式邻均值生成法进行数据扩充,即利用两端的数据首先产生中间的扩充数据,再利用两端的数据和已得出的中间数据扩充出所有数据的一种方法。即将原始数列=扩充为数列,其中Φj(ki),(i=1,2,…m,j=1,2,…,n-1)为扩充的数据。 取Φi(k0)=X(j),Φj(km+1)=X(j+1),则 式中,imin为扩充数列的左端已知数据序列号,imax为扩充数列的右端已知数据序列号。重复应用公式(2),即可得到所需的扩充数据序列Φj(ki)。 3、过程神经元网络建模 过程神经元由加权,聚合和激励三部分组成,结构图如图1所示。图中,x1(t),x2(t),…,xn(t)为过程神经元输入函数;w1(t),w2(t),…,wn(t)为相应的权函数;K(t)为过程神经元的时间聚合基函数;f(·)为激励函数,可取线性函数、Sigmoid函数、Gauss型函数等。过程神经元的输入与输出之间的关系为 Y=f((W(t)X(t))K(·)-θ)(3) 这里θ为过程神经元输出阈值,y为过程神经元的输出值,表示某种空间聚合运算,表示某种时间(过程)聚合运算。这里取空间聚合运算为加权和,时间聚合运算为积分。 以过程神经元为基础,构造一种4层结构的过程神经元网络模型如图2所示,拓扑结构为n-m-K-1,即网络输入层有n个节点、过程神经元隐层有m个节点、非时变一般神经元隐层有K个节点,输出层有1个节点。过程神经元隐层完成对输入信息过程模式特征的提取和对时间的聚合运算,非时变一般神经元隐层用于提高网络对系统输入输出之间复杂关系的影射能力。 由图2可知,过程神经网络输入输出之间的关系为 图中模型的输入为X(t)=(x1(t),x2(t),…,xn(t)),模型输出为y,为时间采样区间,wij(t)为输入层与第1隐层的连接权函数,vjk为第1隐层与第2隐层的连接权值,μk为第2隐层到输出层的连接权值,θj(1)为第1隐层第j个过程神经元的输出阈值,θk(2)为第2隐层第k个过程神经元的输出阈值,f为第1隐层的激励函数,g为第2隐层的激励函数。取各层的激励函数均为Sigmoid函数,即 将随时间变化的离散采样数据进行Walsh变换,使之直接作为神经网络的输入,减少中间的拟合过程,消除拟合误差,其变换过程如下 给定Q个序列长度为2p的学习样本(若离散序列长度不为2p,可通过平滑插值得到)(xq1(tl),xq2(tl),…,xqn(tl),dq),其中q=1,2,…,Q,l=0,1,…,N-1,N=2p,p是满足插值精度要求的自然数,di为期望输出。对学习样本实施Walsh变换,得(wal(xq1(tl)),wal(xq2(tl)),…,wal(xqn(tl)),dq)。 离散数据经过Walsh变换作为网络的输入,于是网络的输入输出关系为 其中 网络的误差函数为 过程神经网络作用过程如图3所示。对上述过程神经网络模型应用误差反向传播的BP算法进行离线训练,得到预期的网络逼近精度。学习算法如下式所示 其中α,β,γ,η,λ为网络学习速率。 4、在线滚动学习 在第k个采样时刻,将预测值与采样值相比较,若误差超过精度要求,则对已采集数据进行处理后在线进行网络学习,否则保持网络模型的输出;在k+1时刻,重复上述检测与学习过程。这种“学习-预测-学习”的滚动流程如图4所示 本专利技术充分利用稀疏数据过程的特点,利用过程神经元并结合数据处理技术进行工业过程中一类稀疏数据过程的建模工作,有效解决了工业过程中因检测困难而导致过程采样数据稀少,从而使过程的监测与优化控制难以有效实施的问题,为稀疏数据过程的建模提供了一条有效的途径,并为该类工业过程实施优化控制奠定了基础。 附图说明 图1为过程神经元结构示意图。 图2为双隐层过程神经网络结构示意图。 图3为神经网络作用过程示意图。 图4为网络模型滚动学习示意图。 具体实施例方式 为更好理解本本文档来自技高网
...

【技术保护点】
一种稀疏数据过程的建模方法,包括数据预处理、过程神经网络建模和在线滚动学习三个步骤,其特征在于:所述的数据处理包括伪数据的修正和稀疏数据的填充;伪数据的修正是对采样数据中存在的伪数据进行平滑修正、处理,并对平滑后的数据进行归一化处理 ;稀疏数据的填充是对稀疏数据进行扩充,弥补已知时刻的未知数据,得到适当时间间隔的密集数据;所述的过程神经网络建模是应用过程神经元组成双隐层过程神经网络模型,应用预处理数据训练神经网络模型,得到符合精度要求的过程神经网络模型;过程神经 元由加权,聚合和激励三部分组成;输入和权值是随时间变化的函数;网络由输入层、过程神经元隐层、非时变一般神经元隐层和输出层组成,采用基于离散Walsh变换的方法对网络进行学习训练;x↓[1](t),x↓[2](t),…,x↓[n](t )为过程神经元输入函数;w↓[1](t),w↓[2](t),…,w↓[n](t)为相应的权函数;K(t)为过程神经元的时间聚合基函数;f(.)为激励函数,可取线性函数、或Sigmoid函数、或Gauss型函数等;过程神经元的输入与输出之间的关系为:Y=f((W(t)⊕X(t))*K(.)-θ)(1)这里θ为过程神经元输出阈值,y为过程神经元的输出值,⊕表示某种空间聚合运算,*表示某种时间(过程)聚合运算;这里取空间聚合运算为加权和,时间聚合运算为积分; 以过程神经元为基础,构造一种四层结构的过程神经元网络模型,拓扑结构为n-m-K-1,网络输入层有n个节点,过程神经元隐层有m个节点,非时变一般神经元隐层有K个节点,输出层有1个节点;过程神经元隐层完成对输入信息过程模式特征的提取和对时间 的聚合运算,非时变一般神经元隐层用于提高网络对系统输入输出之间复杂关系的影射能力;过程神经网络输入输出之间的关系为:y=*μ↓[k]g(*v↓[jk]f(∫↓[0]↑[T]*w↓[ij](t)x↓[i](t))dt-θ↓[J ]↑[(1)])-θ↓[k]↑[(2)])(2)模型的输入为X(t)=(x↓[1](t),x↓[2](t),…,x↓[n](t)),模型输出为y,[0,T]为时间采样区间,w↓[ij](t)为输入层与第1隐层的连接权函数,v↓[ jk]为第1隐层与第2隐层的连接权值,μ↓[k]为第2隐层到输出层的连接权值,θ↓[j]↑[(1)]为第1隐层第j个过程神经元的...

【技术特征摘要】

【专利技术属性】
技术研发人员:关守平尤富强
申请(专利权)人:东北大学
类型:发明
国别省市:89[中国|沈阳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利