当前位置: 首页 > 专利查询>重庆大学专利>正文

一种工艺参数驱动的天然气水露点在线预测方法技术

技术编号:29093113 阅读:19 留言:0更新日期:2021-06-30 10:01
本发明专利技术涉及天然气集输领域,针对常规天然气水露点检测仪易损坏,检测成本高及传统数据驱动方法不能有效反应实际脱水系统天然气水露点与各监测参数间的影响关系的缺点,公开了一种工艺参数驱动的天然气水露点在线预测方法,一种三甘醇脱水装置生产运行状态下的工艺监测数据,制作了一个多维样本序列原始训练数据集;通过选择对天然气水露点预测的关键参数,实现了无关冗余特征的剔除,建立了天然气水露点预测训练数据集;通过训练数据集对NP模型进行训练以学习三甘醇脱水装置各工艺监测参数的多元回归函数关系;将脱水装置实时工艺监测数据作为NP预测模型的目标集数据,实现天然气水露点在线预测。本发明专利技术与现有技术相比,具有准确度高的有益效果。具有准确度高的有益效果。具有准确度高的有益效果。

【技术实现步骤摘要】
一种工艺参数驱动的天然气水露点在线预测方法


[0001]本专利技术涉及天然气集输领域,具体涉及一种工艺参数驱动的天然气水露点在线预测方法。

技术介绍

[0002]天然气水露点是天然气气质的一项重要技术指标。游离水的积聚会导致管线容量降低和腐蚀加剧,以及因水露点偏高而形成的水合物会导致管线、阀门堵塞。因此脱去天然气中的游离水是实际生产的重要任务之一。在实际生产中,通常使用天然气水露点仪监测天然气水露点。由于在实际监测中检测仪存在堵塞、传感器损坏等局限性,常规的使用天然气露点仪监测天然气水露点的方法无法准确有效的监测脱水性能。使用数据驱动方法预测天然气水露点避免了检测仪的缺陷,传统方法使用天然气接触器温度、三甘醇浓度和天然气压力等参数预测天然气水露点。在实际的脱水系统中,不仅是接触器温度和三甘醇浓度对天然气水露点有影响,各监测参数与天然气水露点也存在相互间的影响关系。针对现有检测技术和传统数据驱动方法的局限性,本专利技术通过梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法评估天然气原始特征集参数对天然气水露点敏感性,减少冗余或无关参数对露点预测的影响,实现关键参数的选择。通过参数选择后的训练样本对神经过程(Nerual Process,NP)模型进行训练优化。优化后的NP预测模型可以通过脱水装置的工艺监测参数实时的在线预测天然气水露点,实现脱水装置脱水性能的评估。

技术实现思路

[0003]针对常规天然气水露点检测仪易损坏,检测成本高及传统数据驱动方法不能有效反应实际脱水系统天然气水露点与各监测参数间的影响关系的缺点,本专利技术公开了一种工艺参数驱动的天然气水露点在线预测方法,通过评估和选择对天然气水露点的关键参数,结合具有灵活执行非线性预测的NP模型,实现一种脱水装置工艺参数的天然气水露点在线预测。
[0004]本专利技术通过下述技术方案实现:
[0005]一种工艺参数驱动的天然气水露点在线预测方法,包括以下步骤:
[0006]步骤S1:对于具有N个工艺监测参数的脱水系统,将各参数依次编号为参数1至参数N,N个工艺参数和天然气水露点的历史监测数据组成预测模型原始训练数据集,数据集共有P个样本,将各样本依次编号为样本1至样本P,该数据集以N个工艺参数为变量,天然气水露点为标签或目标值;
[0007]步骤S2:建立用于选择关键参数的梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型。所述GBDT模型是由回归树组成的加法模型。最新的决策树根据以已建立好的决策树模型建立,即构建当前的第t棵回归树时以前t

1棵决策树的负梯度将作为回归树拟合的每个样本的新目标值,直至模型收敛时模型训练完成,当模型训练完成时计算N个工艺参数在各棵树中的平均重要程度来评估并选择重要参数,所述工艺参数j的
平均重要程度依据计算,所述M是GBDT建立的决策树的数量,L是二叉树的深度,假设每棵树都是二叉树,所述是节点t分裂前后的之后的平方损失依据l
t
=n
root
imp
root

n
l
imp
l

n
r
imp
r
计算,所述其中n
root
是节点分裂前的样本数量,n
l
是分裂后左节点的样本数量,n
r
是分裂后右节点的样本数量。imp
root
是节点分裂前的均方误差,imp
l
是分裂后左节点的均方误差,imp
r
是分裂后右节点的均方误差,确定所述GBDT模型的训练参数,损失函数,决策树的数量、决策树最大深度、学习率,所述损失函数决定决策树节点的分裂,所述决策树的数量、决策树最大深度和学习率是为了防止模型过拟合,利用训练集所有样本目标值的均值初始化模型F0(x);
[0008]步骤S3:训练模型第t棵回归树,所述1≤t≤M,计算第t

1棵树分裂完成后的模型F
t
‑1(x)的负梯度,将负梯度作为每个样本的新目标值,所述回归树训练是节点分裂的过程,当达到树的最大深度或节点只有一个样本时停止分裂,当所有节点停止分裂时该回归树训练完成,所述回归树的分裂过程通过最小平方误差函数选择最优分裂特征和值,其最优分裂属性计算过程为:依次遍历该节点所有参数特征h=1,2,...,N
g
和第h个参数在该节点的样本值,即将第h个参数特征作为分裂变量,及将该参数特征的某个样本值s作为分裂条件值,依据值,依据选择最优分裂特征和分裂值,所述y
i
为样本目标值,γ1为R1所有样本目标值的均值和γ2为R2所有样本目标值的均值,计算当前回归树各叶节点均值a
ti
,通过线性搜索确定模型权重更新模型F
t
(x)=F
t
‑1(x)+γ
t
a
t
,所述F
t
(x)为第t棵树分裂完成后的模型a
t
为第t棵回归树各叶节点a
ti
组成的向量,第t棵回归树训练完成;
[0009]步骤S4:重复步骤S3,直到所有回归树训练完成,得到工艺参数特征选择的GBDT模型;
[0010]步骤S5:分别计算原始数据集N个工艺参数在GBDT各棵树中的平均重要程度并排序,得到各工艺参数对天然气水露点的重要程度,设定阈值选择关键工艺参数,得到特征选择后的N

个工艺参数,将选择的N

个参数依次编号为参数1至参数N

,N

个工艺参数为变量数据和天然气水露点监测数据为标签值或目标值组成特征选择后的数据集;
[0011]步骤S6:将特征选择后的训练数据集,按7∶3的比例划分训练上下文集和训练目标集,建立天然气水露点预测的神经过程(Nerual Process,NP)模型,所述NP模型结合了神经网络和高斯过程的优点,NP模型由编码器和解码器组成,模型通过编码器生成高维随机隐变量z,将高斯过程的目标分布的预测转化为对隐变量z的计算,所述高维随机隐变量z服从多维高斯分布,所述编码器通过多层感知器(Multilayer Perceptron,MLP)生成中间变量并利用中间变量参数化高维随机隐变量z,该分布由中间变量通过MLP得到分布的均值向量和方差向量建立,所述中间变量利用N

个工艺参数数据和天然气水露点组成的点集通过MLP生成的数组取均值得到,所述生成中间变量的神经网络,输入层神经元个数由输入数据决定,共包含三个隐藏层,每个隐藏层128个神经元,输出层由128个神经元组成,对中间变量的神经网络的输出值取均值,并经一个128神经元的隐藏层和两个128神经元的输出层分
别生成高维随机隐变量z的均值向量μ和方差向量σ,对高维随机隐变本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工艺参数驱动的天然气水露点在线预测方法,其特征在于,包括以下步骤:步骤S1:对于具有N个工艺监测参数的脱水系统,将各参数依次编号为参数1至参数N,N个工艺参数和天然气水露点的历史监测数据组成预测模型原始训练数据集,数据集共有P个样本,将各样本依次编号为样本1至样本P,该数据集以N个工艺参数为变量,天然气水露点为标签或目标值;步骤S2:建立用于选择关键参数的梯度提升决策树(Gradient Boosting Decision Tree,GBDT)模型。所述GBDT模型是由回归树组成的加法模型。最新的决策树根据以已建立好的决策树模型建立,即构建当前的第t棵回归树时以前t

1棵决策树的负梯度将作为回归树拟合的每个样本的新目标值,直至模型收敛时模型训练完成,当模型训练完成时计算N个工艺参数在各棵树中的平均重要程度来评估并选择重要参数,所述工艺参数j的平均重要程度依据计算,所述M是GBDT建立的决策树的数量,L是二叉树的深度,假设每棵树都是二叉树,所述是节点t分裂前后的之后的平方损失依据l
t
=n
root
imp
root

n
l
imp
l

n
r
imp
r
计算,所述其中n
root
是节点分裂前的样本数量,n
l
是分裂后左节点的样本数量,n
r
是分裂后右节点的样本数量。imp
root
是节点分裂前的均方误差,imp
l
是分裂后左节点的均方误差,imp
r
是分裂后右节点的均方误差,确定所述GBDT模型的训练参数,损失函数,决策树的数量、决策树最大深度、学习率,所述损失函数决定决策树节点的分裂,所述决策树的数量、决策树最大深度和学习率是为了防止模型过拟合,利用训练集所有样本目标值的均值初始化模型F0(x);步骤S3:训练模型第t棵回归树,所述1≤t≤M,计算第t

1棵树分裂完成后的模型F
t
‑1(x)的负梯度,将负梯度作为每个样本的新目标值,所述回归树训练是节点分裂的过程,当达到树的最大深度或节点只有一个样本时停止分裂,当所有节点停止分裂时该回归树训练完成,所述回归树的分裂过程通过最小平方误差函数选择最优分裂特征和值,其最优分裂属性计算过程为:依次遍历该节点所有参数特征h=1,2,...,N
g
和第h个参数在该节点的样本值,即将第h个参数特征作为分裂变量,及将该参数特征的某个样本值s作为分裂条件值,依据R1(h,s)={x|x
(h)
≤s},R2(h,s)={x|x
(h)
>s}选择最优分裂特征和分裂值,所述y
i
为样本目标值,γ1为R1所有样本目标值的均值和γ2为R2所有样本目标值的均值,计算当前回归树各叶节点均值a
ti
,通过线性搜索确定模型权重更新模型F
t
(x)=F
t
‑1(x)+γ
t
a
t
,所述F
t
(x)为第t棵树分裂完成后的模型a
t
为第t棵回归树各叶节点a
ti
组成的向量,第t棵回归树训练完成;步骤S4:重复步骤S3,直到所有回归树训练完成,得到工艺参数特征选择的GBDT模型;步骤S5:分别计算原始数据集N个工艺参数在GBDT各棵树中的平均重要程度并排序,得到各工艺参数对天然气水露点的重要程度,设定阈值选择关键工艺参数,得到特征选择后的N

个工艺参数,将选择的N

个参数依次编号为参数1至参数N

,N

个工艺参数为变量数据和天然气水露点监测数据为标签值或目标值组成特征选...

【专利技术属性】
技术研发人员:尹爱军谭治斌任宏基何彦霖
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1