一种基于SVAE-WGAN的过程工业软测量数据补充方法技术

技术编号:30363556 阅读:32 留言:0更新日期:2021-10-16 17:25
在工业领域中,随着软测量技术的广泛应用,软测量建模方法的快速发展,有效地应对了未来过程工业中大量过程变量和复杂工业环境带来的挑战。为了提升软测量模型的预测精度,如何在因为工业环境恶劣导致软测量模型训练数据集不足的情况下,通过有效的数据补充方法来补充软测量建模数据集是一个关键问题。为此,本文针对训练数据集不足提出了一种基于SVAE

【技术实现步骤摘要】
一种基于SVAE

WGAN的过程工业软测量数据补充方法


[0001]本专利技术涉及工业领域,是一种基于SVAE

WGAN的过程工业软测量数据补充方法。

技术介绍

[0002]软测量技术常作为工业中测量难以直接测量或不能测量的过程变量的方法,软测 量建模是该技术的关键,普遍采用基于数据驱动的软测量建模方法,这就需要海量的数 据支持。由于传统的硬件设备或离线的实验室分析仪器经常会受到技术条件、经济条 件、工业环境恶劣、维护困难、变量规模大、时间延迟等影响,导致很多关键变量难 以获取,从而造成数据不足和数据异常,解决此类问题的办法通常是为软测量模型提 供充足的训练数据集。目前,基于深度学习的生成数据补充方法广受欢迎,对解决软 测量数据不足问题具有重要意义。一方面,随着工业的发展,工业过程变量急剧增多, 如何实时测量关键变量变得非常重要。另一方面,在获取海量数据的条件下,软测量 模型的性能提升使得在测量过程变量的基础上尽可能达到精准。
[0003]基于深度学习的生成数据补充方法通常是采用数学的思维找到产生本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种工业领域中基于SVAE

WGAN的过程工业软测量数据补充方法,其特征在于包括下述步骤:步骤1:根据工业背景确定模型的输入输出,并选择合适的训练数据集,模型需要输入工业中采集到的时序数据,并要求输入的数据为无标签样本,同时,输出数据同样要求输出无标签样本。令输入数据其中表示从训练集中采集m个样本大小的数据集{x
(1)
,...,x
(m)
}作为模型的训练样本。令输出数据}作为模型的训练样本。令输出数据其中表示输出n个样本大小的数据集。步骤2:数据集预处理。首先对输入的训练数据集进行归一化处理,归一化方法使用最大最小归一化,将训练数据线性转换到[0,1]的范围,归一化公式为:归一化公式为:其中X
max
表示训练数据集中的最大值,X
min
表示训练数据集的最小值。其次将训练数据集和测试集的分布情况进行对比,根据两个分布,观察训练数据的特征是否与测试数据的特征拟合,若分布差异不一致,则该特征上的值存在异常,故需要删除该特征,得到最终的训练数据集。之后转入步骤3。步骤3:基于步骤2所得到训练数据集,构建堆叠变分自编码器;首先,根据步骤3.1构建变分自编码器,其次根据步骤3.2构建堆叠变分自编码器。之后转入步骤4;构建堆叠变分自编码器的具体步骤如下:步骤3.1:变分自编码器(VAE)由编码器和解码器两部分组成,首先编码器(Encoder)负责接收输入数据x,通过编码器计算编码器网络的输出分布得到隐变量z的均值μ和方差σ2,假定分布p(z)服从正态分布,隐变量z重采样自编码器的输出分布,重采样是一种解决连续可导的方法,引入ε变量(ε变量采样自标准正态分布由方式采样获取隐变量z,从而保证了梯度传播是连续的,同时也使模型可采用梯度下降算法计算误差并优化参数。其次解码器(Decoder)负责接收隐变量z输出目标变量通过解码器寻找一个与x分布近似的分布,使得x与近似相等。编码器和解码器分别用和θ网络参数化为函数和p
θ
(x|z)函数,令Decoder(z)=p
θ
(x|z),其中Encoder(x)表示编码器,Decoder(z)表示解码器。VAE模型的核心思想即找到一个后验分布然后采用变分推断,不断优化目标函数并得到该模型的损失函数,公式为:即:其中,损失函数第一项是编码器的重构误差函数,logp
θ
(x|z)表示解码器的似然概率,p(z)表示隐变量z符合的先验分布,D
KL
表示输出分布与先验分布p(z)之间的KL散度。步骤3.2:根据步骤3.1构建的变分自编码器,通过堆叠变分自编码器得到SVAE,将第一个变分自编码器的输出作为下一个变分自编码器的输入,从而得到深层次提取特征的深度
生成网络模型SVAE。根据变分自编码器的目标函数,得到SVAE网络的目标函数之后转入步骤4;其中,SVAE的损失函数公式为:式中,x表示输入的真实样本,i表示VAE模型的数量,z
i
表示第i个VAE的编码器的隐变量,x
i
表示第i个VAE生成的新样本。之后转入步骤4;步骤4:基于步骤3所得到的生成模型SVAE,接下来将结合SVAE和WGAN构建SVAE

WGAN生成模型;生成式对抗网络GAN包括生成网络和判别网络D(x),生成网络G(z)与步骤3.1的VAE的Decoder原理类似。首先从先验分布p
z
(z)中采样得到隐变量z,然后,通过生成网络D(x),它的数据集包括采样自真实样本分布p
z
(z)中采样得到隐变量z,其次,通过生成网络参数化的p
g
(x|z)分布得到生成分布p
g
(x|z),并获得生成样本根据判别网络D(x),它的关键是将预测值和真实值之间的交叉熵损失函数最小化,判别网络的损失函数可定义为:其中,D
θ
(x
r
)表示真实样本x
r
在判别器中的输出值,D
θ
(x

【专利技术属性】
技术研发人员:高世伟仇素龙田冉马忠彧刘颜星张青松许金鹏
申请(专利权)人:西北师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1