System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于数据增强的两阶段工业质量预测方法技术_技高网

一种基于数据增强的两阶段工业质量预测方法技术

技术编号:41284019 阅读:5 留言:0更新日期:2024-05-11 09:33
本发明专利技术公开了一种基于数据增强的两阶段工业质量预测方法,旨在解决工业过程变量高维、非线性和动态特性带来的建模挑战。传统预测方法难以应对这些复杂特性,同时高质量数据稀缺也限制了模型训练效果。针对这些问题,本发明专利技术提出了一种创新的建模框架,结合堆叠有监督变分自编码器的生成对抗网络(SSV‑WGANgp)和具有注意力机制的卷积神经网络(EBCNN)。第一阶段利用SSV‑WGANgp对少样本数据进行扩充,提高模型训练的泛化性能;第二阶段利用EBCNN进行工业质量预测建模,实现工业蒸汽量预测。通过该蒸汽量数据集验证,该发明专利技术有效解决了工业数据短缺和非线性预测问题,提高了预测精度,降低了对大量标注数据的依赖。

【技术实现步骤摘要】

本专利技术专利涉及一种工业质量预测方法,在工业生产领域具有重要的应用前景。


技术介绍

1、在工业生产中,长时间的运行常常引发一系列问题,如效率下降、质量不稳,甚至造成重大损失。为应对这些问题,可以通过建立有效的监控体系是关键,预测生成过程中的关键质量变量,提高生产效率,进而实现企业的持续发展并最大化其价值。然而,工业现场复杂的生产环境与欠佳的在线测量仪器使得这一过程充满挑战。

2、此时,软测量技术应运而生,它通常包含四个步骤:(1)辅助变量的选择;(2)数据预处理;(3)软测量建模;(4)模型的应用与矫正。其最关键的部分是软测量建模,目前软测量建模方法主要分为三大类:第一原理模型(基于过程机理建模方法)、基于数据驱动建模方法和基于混合模型建模方法。第一原理模型是基于物理和化学的知识基础上,这种方法往往耗时并且难以获得的,在大多数的工业生产中无法使用。

3、随着以分布式控制系统(dcs)为代表的各类信息系统在工业中的普及,大量的历史过程数据被记录和存储,这些数据为软测量建模提供了宝贵资源。基于数据驱动的软测量技术通过分析易测的辅助变量来构建质量变量的预测模型,具有高效、低成本、实时等优势,因此在工业生产中得到了广泛应用。它不仅有助于提高生产效率、降低能耗,还能助力企业实现可持续发展和价值最大化。


技术实现思路

1、卷积神经网络在软测量建模中展现了其独特的优势,得益于其局部感受野和权值共享的特点。然而,基于卷积神经网络的现有软测量建模方法仍面临两大挑战:(1)许多卷积神经网络及其变体需要大量数据才能进行有效的训练。数据不足可能导致过拟合问题,进而影响质量变量的预测精度。(2)现有的生成式模型主要关注生成样本的输入,而输出则完全依赖于基于标记样本构建的模型的预测。这种方法生成的输入与输出之间的相关性有限,尤其在训练样本稀缺的情况下,会降低预测模型的准确性。此外,生成样本的多样性对于构建高性能的软测量模型也至关重要。即使使用相同的训练样本,不同的生成模型通常会生成具有一定随机性的样本,这不利于确保模型预测的稳定性。因此,针对上述两个问题,本专利技术提出一种基于数据增强的两阶段工业质量预测方法

2、本专利技术主要包括六个部分:(1)获取数据,确定输入输出变量。(2)数据预处理。(3)构建并训练基于监督变分自编码器和对抗神经网络与梯度惩罚的数据增强模型。(4)将数据增强阶段的数据和原始数据结合得到混合数据。(5)建立基于卷积自编码器和带有注意力机制的卷积神经网络的工业质量预测模型。(6)使用混合数据训练预测模型,并用真实数据验证本专利技术提出的模型性能。下面详细介绍以上六部分的内容:

3、(1)、获取数据,确定输入变量和目标变量。首先,通过各种传感器和手段收集工业现场的真实数据。这些数据主要包括辅助变量,它们将作为模型的输入。而与工业过程产品密切相关的关键质量变量则被视为目标变量,用于模型的预测。

4、(2)、对数据进行预处理。真实工业场景下的数据并不能够直接使用,真实数据有部分数据存在异常,需要剔除异常数据和消除不同的辅助变量的量纲问题,增加了模型学习数据的挑战,因此这一部分主要负责对原始数据进行清洗和整理,包括去除异常值、缺失值处理以及不同量纲的归一化处理,以确保数据的一致性和准确性。

5、(3)、构建并训练基于监督变分自编码器和对抗神经网络与梯度惩罚的数据增强模型。在工程实践中,高质量数据的获取需要大量的人力和物力。如何充分利用有限的数据进行数据扩充是一个可行的方法。为了解决数据量不足的问题,采用变分自编码器和对抗神经网络进行数据增强。通过结合这两种方法来生成新的数据。这种技术可以在有限的数据基础上生成新的、多样化的样本,增强模型的泛化能力。

6、(4)、将数据增强阶段的数据和原始数据结合得到混合数据。在生成新的数据后,将增强阶段的数据与原始数据进行混合,以创建更丰富、更具代表性的训练集。

7、(5)、建立基于卷积自编码器和带有注意力机制的卷积神经网络的工业质量预测模型来预测目标变量值。这种模型结构能够更好地捕捉数据的内在特征和关联性,提高预测的准确性。

8、(6)、使用混合数据对预测模型进行训练,并用真实数据进行验证。通过比较预测结果与实际结果的误差,评估模型的性能。误差越小,模型的性能越好。

9、本专利技术所采用的技术方案的详细实施步骤如下:

10、步骤1:确定输入输出变量。利用各种传感器和手段获取真实工业场景下的数据,在训练数据增强模型时,挑选整个工业状况中与关键变量相关度较高的过程变量为辅助变量,必须满足其挑选的辅助变量能够简单并且容易测量。

11、步骤2:数据预处理。工业数据中采集到的实时数据往往由于传感器的问题,有部分数据存在异常,需要剔除异常数据和消除不同的辅助变量的量纲问题。因此在剔除异常数据后还需要进行最大最小归一化进行无量纲化操作,有助于提高模型的预测性能。本专利技术采用最大最小归一化将数据集变为[0,1]区间之内,即归一化后数据为x'=(x-xmin)/(xmax-xmin)。

12、步骤3:构建并训练基于监督变分自编码器和对抗神经网络与梯度惩罚的数据增强模型。该模型主要由对抗神经网络为基础网络,与传统对抗神经网络不同的是生成器输入的数据不是随机噪声,而是通过监督变分自编码器学习到的数据,然后与真实数据对抗训练。包括以下三个步骤:

13、步骤3.1:使用堆叠的监督变分自编码器进行数据的内部分布的学习。编码器将复杂的输入空间(x,y)映射到相对简单的潜在空间z,产生在该潜在空间上的分布,并且解码器通过编码器得到的解码z来实现输入变量的重构。堆叠的svae生成模型是svae叠加后的重建模型。通过双层svae构造深层生成模型,可以在深层挖掘重要特征。其中每一层的输入是svae已经被外部堆叠之后的前一层的输出。采用贪婪训练法逐层训练svae,然后训练整个堆叠的svae神经网络。svae模型图如图2所示。

14、步骤3.2:使用带有梯度惩罚的对抗神经网络。传统的gan训练困难,生成样本缺乏多样性,wgan解决了gan的问题,而wgan中的1-lipschitz函数可能会导致梯度消失或梯度爆炸,梯度惩罚允许生成器参数的平滑更新,并提高wgan的训练速度,gan的结构如图3所示。wgangp的损失函数定义为:

15、

16、

17、步骤3.3:采用一种新的数据增强模型ssv-wgangp,该模型利用svae的解码器作为wgan-gp的生成器。在堆叠的svae的指导下,生成器可以准确地探索输入的近似空间分布。两种神经网络可以相互补充,提高各自的模型性能,生成更接近原始样本的虚拟样本。ssv-wgangp的模型图如图4所示。ssv-wgangp模型的损失函数可以定义为

18、

19、步骤4:将数据增强阶段的数据和原始数据结合得到混合数据,创建更丰富、更具代表性的训练集。

20、步骤5:本文档来自技高网...

【技术保护点】

1.一种基于数据增强的两阶段工业质量预测方法,其特征在于:

【技术特征摘要】

1.一种基于数据增强的两阶段工...

【专利技术属性】
技术研发人员:苏文静高世伟陈洪全董晓辉党小超李延红王静宇李天桢
申请(专利权)人:西北师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1