System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法技术_技高网

一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法技术

技术编号:42630108 阅读:21 留言:0更新日期:2024-09-06 01:31
本发明专利技术公开了一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法,涉及工业测量技术领域,其技术要点为:包括以下步骤:步骤S1、初始化超参数;步骤S2、数据预处理,标准化数据集Dataset;步骤S3、初始化网络参数;步骤S4、开始训练模型;步骤S5、模型预测输出提出基于通道时空融合注意力的LSTM深度生成模型的软测量模型,充分提取多元变量时序关系特征,在设计特征模块时,融合通道和时空注意力机制,捕捉重要通道和时空的加权融合特征信息,有效提高预测精度。

【技术实现步骤摘要】

本专利技术涉及工业测量,具体涉及一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法。


技术介绍

1、在工业生产过程中,软测量技术作为一种重要的过程监测和控制手段,广泛的应用于化工、制药、能源等领域,以实现对关键过程中重要且难以测量的变量进行实时监测和预测。软测量技术利用工业生产过程中易于准确测量的辅助变量,通过分析工业生产过程机理,实现对目标变量的预测。目前,主要有三种主流软测量模型,分别是基于过程机制方法、基于知识的方法以及基于数据驱动的方式。基于过程机制方法和知识方法的建模在知道详细且准确的生成过程机制或者有丰富的生产过程经验和知识可实现精准测量,然而随着生产过程的复杂性日益增加,使得详细且准确的了解过程机制无法轻易实现,传统的软测量模型在面对多变、非线性、大时延的工业数据时往往表现不佳,未能充分挖掘数据的潜在规律,导致预测精度欠佳。

2、近些年,随着人工智能技术的发展,基于数据驱动的软测量建模被广泛应用于工业生产过程中,成为先进过程控制技术的重要组成部分,也是化工领域中应用难测过程变量检测的常用技术。基于数据驱动的软测量建模技术无需获取精确的机理模型,其通过对数据的深度分析构建易测变量和难测变量之间的数学模型,利用易测的辅助变量估计难测变量。因此基于数据驱动的建模方法已成为主流的建模方法,因深度学习强大的特征学习和表征学习能力为软测量模型的改进提供了新的可能性。

3、基于数据驱动的软测量方法主要是通过统计推理和机器学习技术,现有的软测量方法主要包括以下几种:(1)将主成分分析(pca)和回归模型相结合的主成分回归(pcr)进行预测;(2)基于mrmr-bo优化stacking集成模型的nox浓度动态预测;(3)利用最小二乘法回归进行预测(4)利用支持向量机模型和人工神经网络。其中人工神经网络是被广泛使用的常用方法。然而浅层人工神经网络的特征表征能力有限,且多层网络结构易受到梯度消失和爆炸问题。近二十年,随着关键问题和技术突破,深度学习网络技术拥有足够多隐藏层和网络结构,可获得更好的特征学习和表征学习能力。利用dbn和sae等方法进行软测量预测建模,然而这些方法都需要假设样本数据是独立且同分布的前提条件,而实际工业生产过程本质上是复杂的非线性、非独立的的动态系统,采集到的样本数据具有非线性、大时延、高相关性等特征。鉴于此,为了进行时序序列建模,模型中必须能够在时间域中捕捉隐含序列的长期依赖关系。递归神经网络是一种专门处理序列数据动态神经网络,已被广泛用于捕捉时间序列数据中的时间动态行为。然而,在处理长序列时,rnn容易出现记忆丢失和梯度消失问题,导致网络难以继续训练。基于rnn的长短时记忆(long short-termmemory,lstm)网络能在一定程度上解决此问题,引入记忆细胞(memory cell)保存序列的长期信息,并通过门控机制(gate mechanism)增加或舍弃即将进入细胞状态中的信息,从而在一定程度上解决了传统rnn存在的梯度消失的问题,使得网络能够学习长期相关信息。为了增强网络的特征提取能力并考虑时间序列相关性,引入注意力机制。注意力机制的灵感来源于人类视觉所特有的信息处理机制。人类视觉会快速扫描全局信息,获得需要重点关注的目标区域信息之后,然后将更多注意力资源投入到关键信息中,从而提取关键的细节信息,同时抑制其他无用信息,注意力机制能够显著地提高信息处理的效率与准确性。

4、上述的方法也存在缺陷,对时序的多元变量的关系特征(即通道特征)无法有效提取。


技术实现思路

1、本专利技术的目的是为了解决上述问题,提供一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法。

2、为了达到上述目的,本专利技术的技术方案如下:

3、本专利技术提供了一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法,包括以下步骤:

4、步骤s1、初始化超参数:输入dataset=({xt},{yt}),t=1,2,…k;其中k表样本数,n代表n个变量;

5、步骤s2、数据预处理,标准化数据集dataset;

6、步骤s3、初始化网络参数;

7、步骤s4、开始训练模型:迭代循环epoch,训练模型包括编码器部分和解码器部分;

8、步骤s5、模型预测输出预测的函数如下:

9、

10、本专利技术进一步设置为:编码器部分将输入序列编码转换成隐藏状态序列,接着将隐藏状态序列转换成固定长度向量表示,最后将之前固定长度的向量作为解码器的输入来进行目标输出序列;编码器-解码器的网络输入以滑动窗口t来表示,输入和输出的向量为{x1,x2,x3…,xt}和{y1,y2,y3,…,yl},在编码器模块中,输入序列首先被编码为隐藏状态序列{h1,h2,h3,…,ht},隐藏状态序列是从输入提取到的动态特征;通过一个简单的函数映射,将隐藏状态序列转换成固定长度的上下文向量c。其中上下文向量c包含整个输入序列特征信息。

11、本专利技术进一步设置为:lstm模型利用门控机制来控制信息的流动,具体包括输入门、遗忘门和输出门,相关的函数公式如下:

12、

13、

14、

15、

16、

17、ht=ot·tanh(ct),

18、其中:xt表示t时刻的信息输入;c表示细胞状态,用于保存网络提取到的序列特征信息;i表示输入门,控制xt输入至记忆细胞中的信息量;f表示遗忘门,控制t-1时刻的细胞状态ct-1输入t时刻细胞状态ct信息量;o表示输出门,控制ct传递至t时刻隐藏层状态ht的信息量;分别表示输入权重矩阵;分别表示隐藏层到输入门、遗忘门、输出门与细胞状态的权重矩阵;bi、bf、bo、bc分别表示偏置向量;σ表示sigmoid激活函数;tanh表示双曲正切激活函数。

19、本专利技术进一步设置为:所述步骤s4包括以下分步骤:

20、步骤s41、在编码器中引入通道注意力机制,通道注意力机制公式如下:

21、

22、其中σ是激活函数,是mlp的权重矩阵;

23、利用当前的输入序列x(t)和前一个时刻的隐藏状态s(t-1)来获取空间注意力权重值,相关的公式如下:

24、

25、

26、其中是可学习的参数,s(t-1)是t-1时刻的隐藏状态,表示在t时刻的第i个输入变量对预测值的注意力值,归一化的为空间注意力的权重;

27、步骤s42、当输入序列变量x(t)通过通道注意力机制和空间注意力捕捉特征后,设计通道注意力特征和空间注意力加权融合机制,即融合特征xf是通道注意力特征和空间注意力特征加权;

28、步骤s43、更新隐藏状态序列hf:将融合特征作为编码器lstm单元的输入,获取隐藏状态序列hf;

29、步骤s44、计算时间注意力权重将编码器部分输出的隐藏状态序列分配不同本文档来自技高网...

【技术保护点】

1.一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法,其特征是,包括以下步骤:

2.如权利要求1所述的一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法,其特征是:编码器部分将输入序列编码转换成隐藏状态序列,接着将隐藏状态序列转换成固定长度向量表示,最后将之前固定长度的向量作为解码器的输入来进行目标输出序列;编码器-解码器的网络输入以滑动窗口T来表示,输入和输出的向量为{x1,x2,x3…,xT}和{y1,y2,y3,…,yl},在编码器模块中,输入序列首先被编码为隐藏状态序列{h1,h2,h3,…,hT},隐藏状态序列是从输入提取到的动态特征;通过一个简单的函数映射,将隐藏状态序列转换成固定长度的上下文向量C,所述上下文向量C包含整个输入序列特征信息。

3.如权利要求1所述的一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法,其特征是:LSTM模型利用门控机制来控制信息的流动,具体包括输入门、遗忘门和输出门,相关的函数公式如下:

4.如权利要求3所述的一种基于通道时空融合注意力的LSTM模型用于软测量模型预测的方法,其特征是:所述步骤S4包括以下分步骤:

...

【技术特征摘要】

1.一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法,其特征是,包括以下步骤:

2.如权利要求1所述的一种基于通道时空融合注意力的lstm模型用于软测量模型预测的方法,其特征是:编码器部分将输入序列编码转换成隐藏状态序列,接着将隐藏状态序列转换成固定长度向量表示,最后将之前固定长度的向量作为解码器的输入来进行目标输出序列;编码器-解码器的网络输入以滑动窗口t来表示,输入和输出的向量为{x1,x2,x3…,xt}和{y1,y2,y3,…,yl},在编码器模块中,输入序列首先被编码为隐藏状态序列{...

【专利技术属性】
技术研发人员:朱敏杨晴林磊汪丽骆立刚卢鸯龚超吴婷桦王一薇
申请(专利权)人:浙江省轻工业品质量检验研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1