一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法技术

技术编号：42630108 阅读：21 留言：0更新日期：2024-09-06 01:31

本发明专利技术公开了一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法，涉及工业测量技术领域，其技术要点为：包括以下步骤：步骤S1、初始化超参数；步骤S2、数据预处理，标准化数据集Dataset；步骤S3、初始化网络参数；步骤S4、开始训练模型；步骤S5、模型预测输出提出基于通道时空融合注意力的LSTM深度生成模型的软测量模型，充分提取多元变量时序关系特征，在设计特征模块时，融合通道和时空注意力机制，捕捉重要通道和时空的加权融合特征信息，有效提高预测精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及工业测量，具体涉及一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法。

技术介绍

1、在工业生产过程中，软测量技术作为一种重要的过程监测和控制手段，广泛的应用于化工、制药、能源等领域，以实现对关键过程中重要且难以测量的变量进行实时监测和预测。软测量技术利用工业生产过程中易于准确测量的辅助变量，通过分析工业生产过程机理，实现对目标变量的预测。目前，主要有三种主流软测量模型，分别是基于过程机制方法、基于知识的方法以及基于数据驱动的方式。基于过程机制方法和知识方法的建模在知道详细且准确的生成过程机制或者有丰富的生产过程经验和知识可实现精准测量，然而随着生产过程的复杂性日益增加，使得详细且准确的了解过程机制无法轻易实现，传统的软测量模型在面对多变、非线性、大时延的工业数据时往往表现不佳，未能充分挖掘数据的潜在规律，导致预测精度欠佳。

2、近些年，随着人工智能技术的发展，基于数据驱动的软测量建模被广泛应用于工业生产过程中，成为先进过程控制技术的重要组成部分，也是化工领域中应用难测过程变量检测的常用技术。基于数据驱动的软测量建模技术无需获取精确的机理模型，其通过对数据的深度分析构建易测变量和难测变量之间的数学模型，利用易测的辅助变量估计难测变量。因此基于数据驱动的建模方法已成为主流的建模方法，因深度学习强大的特征学习和表征学习能力为软测量模型的改进提供了新的可能性。

3、基于数据驱动的软测量方法主要是通过统计推理和机器学习技术，现有的软测量方法主要包括以下几种：(1)将主成分分析(pca)

4、上述的方法也存在缺陷，对时序的多元变量的关系特征(即通道特征)无法有效提取。

技术实现思路

1、本专利技术的目的是为了解决上述问题，提供一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法。

2、为了达到上述目的，本专利技术的技术方案如下：

3、本专利技术提供了一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法，包括以下步骤：

4、步骤s1、初始化超参数：输入dataset＝({xt},{yt}),t＝1,2,…k；其中k表样本数，n代表n个变量；

5、步骤s2、数据预处理，标准化数据集dataset；

6、步骤s3、初始化网络参数；

7、步骤s4、开始训练模型：迭代循环epoch，训练模型包括编码器部分和解码器部分；

8、步骤s5、模型预测输出预测的函数如下:

9、

10、本专利技术进一步设置为：编码器部分将输入序列编码转换成隐藏状态序列，接着将隐藏状态序列转换成固定长度向量表示，最后将之前固定长度的向量作为解码器的输入来进行目标输出序列；编码器-解码器的网络输入以滑动窗口t来表示，输入和输出的向量为{x1，x2，x3…，xt}和{y1，y2，y3，…，yl}，在编码器模块中，输入序列首先被编码为隐藏状态序列{h1，h2，h3，…，ht}，隐藏状态序列是从输入提取到的动态特征；通过一个简单的函数映射，将隐藏状态序列转换成固定长度的上下文向量c。其中上下文向量c包含整个输入序列特征信息。

11、本专利技术进一步设置为：lstm模型利用门控机制来控制信息的流动，具体包括输入门、遗忘门和输出门，相关的函数公式如下：

12、

13、

14、

15、

16、

17、ht＝ot·tanh(ct)，

18、其中：xt表示t时刻的信息输入；c表示细胞状态，用于保存网络提取到的序列特征信息；i表示输入门，控制xt输入至记忆细胞中的信息量；f表示遗忘门，控制t-1时刻的细胞状态ct-1输入t时刻细胞状态ct信息量；o表示输出门，控制ct传递至t时刻隐藏层状态ht的信息量；分别表示输入权重矩阵；分别表示隐藏层到输入门、遗忘门、输出门与细胞状态的权重矩阵；bi、bf、bo、bc分别表示偏置向量；σ表示sigmoid激活函数；tanh表示双曲正切激活函数。

19、本专利技术进一步设置为：所述步骤s4包括以下分步骤：

20、步骤s41、在编码器中引入通道注意力机制，通道注意力机制公式如下：

21、

22、其中σ是激活函数，是mlp的权重矩阵；

23、利用当前的输入序列x(t)和前一个时刻的隐藏状态s(t-1)来获取空间注意力权重值，相关的公式如下：

24、

25、

26、其中是可学习的参数，s(t-1)是t-1时刻的隐藏状态，表示在t时刻的第i个输入变量对预测值的注意力值，归一化的为空间注意力的权重；

27、步骤s42、当输入序列变量x(t)通过通道注意力机制和空间注意力捕捉特征后，设计通道注意力特征和空间注意力加权融合机制，即融合特征xf是通道注意力特征和空间注意力特征加权；

28、步骤s43、更新隐藏状态序列hf：将融合特征作为编码器lstm单元的输入，获取隐藏状态序列hf；

29、步骤s44、计算时间注意力权重将编码器部分输出的隐藏状态序列分配不同本文档来自技高网...

【技术保护点】

1.一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法，其特征是，包括以下步骤：

2.如权利要求1所述的一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法，其特征是：编码器部分将输入序列编码转换成隐藏状态序列，接着将隐藏状态序列转换成固定长度向量表示，最后将之前固定长度的向量作为解码器的输入来进行目标输出序列；编码器-解码器的网络输入以滑动窗口T来表示，输入和输出的向量为{x1，x2，x3…，xT}和{y1，y2，y3，…，yl}，在编码器模块中，输入序列首先被编码为隐藏状态序列{h1，h2，h3，…，hT}，隐藏状态序列是从输入提取到的动态特征；通过一个简单的函数映射，将隐藏状态序列转换成固定长度的上下文向量C，所述上下文向量C包含整个输入序列特征信息。

3.如权利要求1所述的一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法，其特征是：LSTM模型利用门控机制来控制信息的流动，具体包括输入门、遗忘门和输出门，相关的函数公式如下：

4.如权利要求3所述的一种基于通道时空融合注意力的LSTM模型用于软测

...

【技术特征摘要】

1.一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法，其特征是，包括以下步骤：

2.如权利要求1所述的一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法，其特征是：编码器部分将输入序列编码转换成隐藏状态序列，接着将隐藏状态序列转换成固定长度向量表示，最后将之前固定长度的向量作为解码器的输入来进行目标输出序列；编码器-解码器的网络输入以滑动窗口t来表示，输入和输出的向量为{x1，x2，x3…，xt}和{y1，y2，y3，…，yl}，在编码器模块中，输入序列首先被编码为隐藏状态序列{...

【专利技术属性】
技术研发人员：朱敏，杨晴，林磊，汪丽，骆立刚，卢鸯，龚超，吴婷桦，王一薇，
申请(专利权)人：浙江省轻工业品质量检验研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人