一种原料油及重馏分油中氢含量的预测方法及其系统技术方案

技术编号:37419879 阅读:9 留言:0更新日期:2023-04-30 09:42
本发明专利技术提供了一种原料油及重馏分油中氢含量的预测方法及其系统,仅依靠理化性质的常规化验报告的D86蒸馏曲线和密度计算原料油及重馏分油氢含量的方法。该系统分为四个模块:分别是(1)选出建模特征变量的特征选择模块;(2)将数据标准化为能直接进行建模的数据标准化模块;(3)建立基于栈式自编码器和神经网络的氢含量预测模型的模型训练模块;(4)进行模型结构、参数优化和模型检验的模型评价模块。参数优化和模型检验的模型评价模块。参数优化和模型检验的模型评价模块。

【技术实现步骤摘要】
一种原料油及重馏分油中氢含量的预测方法及其系统


[0001]本专利技术涉及石油加工
,具体涉及一种原料油及重馏分油中氢含量的预测方法及系统。

技术介绍

[0002]原油和重质馏分油是各种复杂有机化合物的混合物,包括由碳和氢组成的烃类化合物和由碳和氢气以及其他元素组成的非烃类化合物。这些烃类化合物和非烃类化合物的结构和含量决定了重质馏分油及其产品的性质。石油加工过程主要是原油中碳、氢和其他元素的再平衡过程,包括脱碳和加氢,则相应的技术路线为脱碳技术路线和加氢技术路线。
[0003]装置氢平衡计算分析可以评价石油加工装置产物分布合理性、氢利用效率等。在实际生产中,有关液化气、干气的成分分析已在工业生产中广泛进行,炼油企业都有运用相关仪器设备进行气态烃的全组成分析,它们的氢含量也可以根据组成计算得到。然而,大多数炼油企业都未有专门配备测定液相油品中氢含量的设备,需要将相关油品样本送至专业机构进行检测,时效性差。此外,相关研究人员提供的液相油品经验测算公式所需要的油品性质参数不全是炼油企业的常规分析项目,若要使用相关经验公式计算液相油品的氢含量,需要专门测定某些特定的理化性能参数,因而经验公式的使用不够便捷。
[0004]综上,如何解决现有技术的限制,提供一种适用于原料油及重馏分油中氢含量的便捷计算方法,用于分析评价装置产品分布、操作运行合理性,即为本领域技术人员的研究方向所在。

技术实现思路

[0005]针对现有技术中的缺陷,本专利技术提出一种原料油及重馏分油中氢含量的预测方法,与现有技术手段相比,本专利技术仅需通过炼油厂常规理化性质分析数据,就能实现氢含量的精确计算,避免了化学分析反馈周期长、成本高的不足。本专利技术提出的原料油及重馏分油中氢含量的预测方法和系统可以快速计算原料油及重馏分油的氢含量,起到对生产的启发和指导作用。
[0006]本专利技术的具体技术方案是:一种原料油及重馏分油中氢含量的预测方法,包括如下步骤:
[0007]步骤一,基于皮尔逊相关分析的模型特征变量选择方法。通过对样本数据氢含量和常规理化性质进行相关性分析,确定建立机器学习模型的特征变量。所述的常规理化性质包括:密度(x1)、D86蒸馏曲线的初馏点(x2)、10%馏出温度(x3)、20%馏出温度(x4)、30%馏出温度(x5)、40%馏出温度(x6)、50%馏出温度(x7)、60%馏出温度(x8)、70%馏出温度(x9)、80%馏出温度(x
10
)、90%馏出温度(x
11
)、终馏点(x
12
)。根据算出的皮尔逊相关系数的值,并通过设定的临界值λ(λ的取值范围为[0,1]),可以确定建立模型所需的常规理化性质。
[0008]下面介绍皮尔逊特征选择的原理:
[0009]皮尔逊相关系数是一种衡量特征变量和目标变量之间关系的方法,该方法衡量的是变量之间的线性相关性。变量x
i
(第i个常规理化性质)和变量y(设为氢含量分析值)的皮尔逊相关系数就是用x
i
,y的协方差除以x
i
和y的标准差,可以看成一种剔除了两个变量量纲影响、标准化之后的特殊协方差。协方差是度量各个维度偏离其均值的程度,协方差的值为正值说明两者是正相关的,否则是负相关的。变量x
i
,y的皮尔逊相关系数的计算公式如下:
[0010][0011]结果的取值区间是[

1,1],

1表示完全负相关,1表示完全正相关,0表示没有线性相关,绝对值的大小表示相关性的强弱。
[0012]若第i个变量被挑选为模型输入变量。
[0013]通过使用基于皮尔逊相关性分析的特征选择模块,可以去除与目标变量无关的冗余变量,能有效提高预测模型的预测精度。
[0014]步骤二,构建原料油及重馏分油氢含量预测模型样本的数据标准化处理方法,能够将样本数据进行标准化处理后成为适合建立机器学习模型的数据。
[0015]数据标准化使用最大最小标准化方法。数据标准化是数据挖掘的一项基础工作,在现实生活中,一个目标变量可以认为是由多个特征变量影响和控制的,而这些特征变量的量纲和数值的量级可能不同,若不进行处理可能会影响数据分析的结果,为了消除指标之间的量纲和取值范围差异而采取的数据处理措施就叫数据标准化。
[0016]最大最小标准化也叫离差标准化,是对原始数据的线性变换,将数据值映射到[0,1]之间。转换公式如下:
[0017][0018]最大最小标准化保留了原来数据中存在的关系,是消除量纲和数据取值范围影响的最简单方法。
[0019]步骤三,构建原料油及重馏分油氢含量模型训练及预测模块的方法,可以利用石化企业提供的常规理化报告(即密度和D86蒸馏曲线)及对应氢含量的样本,建立基于栈式自编码器的机器学习预测模型。
[0020]下面介绍栈式自编码器的原理及模型结构:
[0021]自编码器(AE)是一种无监督的数据维度压缩和数据特征表达方式,自编码器是一种包含三层神经元的前向神经网络,经过训练后能将输入复制到输出,自编码器由编码器和解码器组成。编码器部分的作用是将原始输入投影到特征空间,可以将编码器用于降维,解码器部分的作用是从特征空间中重构原始输入。自编码器的数学原理如下:
[0022]对于一个m维的输入样本x,自编码器的编码器部分f1(
·
和解码器部分f2(
·
)的表达式如下:
[0023]f1(
·
):z=δ1(W1x+b1)
[0024][0025]其中,z是编码器部分输出的特征空间的向量,是最终的预测输出。δ1(
·
)表示神
经网络中的激活函数,包括Sigmoid函数、正切函数、线性整流单元函数等。W1、W2是网络层之间的权重,b1、b2是对应层的偏置值。
[0026]自编码的目标是使输入与重构的输出尽可能相同,即假设训练集输入x包含n个样本,故自编码器的目标函数如下:
[0027][0028]其中,表示误差函数,一般使用均方误差,即
[0029][0030]由于普通的自编码器只有一层隐藏层作为变换,因此可以通过增加神经网络的层数与神经元的个数来增强模型编码和解码能力,于是引入了栈式自编码器(SAE)的概念。栈式自编码器是将多个自编码器堆叠在一起,前一个自编码器的编码部分的输出作为后续编码器的输入,栈式自编码的神经网络结构通常是关于中间隐藏层对称的。栈式自编码器除结构与自编码不同,其计算的数学原理和目标函数都与自编码器相同。
[0031]本专利技术所提出的一种原料油及重馏分油中氢含量预测方法和系统的模型基于栈式自编码器。首先使用油品挑选出的理化性质以及对应的氢含量组合成的输入空间[x|y]训练一个栈式自编码器,则栈式自编码器的输出中包含所需的氢含量的预测值。由于氢含量是需要预测的目标变量,故在进行实际预测时不能将氢含量作为输入,因此,将栈式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种原料油及重馏分油中氢含量的预测系统,其特征在于包含以下四个模块:该系统分为四个模块:第一模块是特征选择模块;该模块基于皮尔逊相关性分析方法,分析各输入变量与输出变量的相关程度,挑选出与氢含量相关性较大的输入变量作为特征变量;第二模块是数据标准化模块;该模块能消除输入变量之间量纲不同对模型结果的影响,获得可直接进行机器学习建模的数据,标准化方法使用的是最大最小标准化方法;第三模块是模型训练模块;模型是基于栈式自编码器模型和神经网络模型的组合模型,将标准化后的特征变量作为模型输入,氢含量作为模型输出,建立基于数据驱动的原料油及重馏分油氢含量预测模型;第四模块是模型参数寻优和模型评价模块;该模块使用逐层驱动的策略确定模型网络结构,利用交叉验证方法结合网格搜索策略进行参数寻优,同时选用均方根误差、平均绝对误差、决定系数的模型评价方法评价模型的预测能力。2.根据权利要求1所述的原料油及重馏分油中氢含量的预测系统,其特征在于,所述特征选择模块,选自原料油及重馏分油常规理化性质取密度、D86蒸馏曲线初馏点、10%馏出温度、20%馏出温度、30%馏出温度、40%馏出温度、50%馏出温度、60%馏出温度、70%馏出温度、80%馏出温度、90%馏出温度、终馏点,常规理化性质和对应的氢含量组成一组样本数据;基于收集的样本数据,使用皮尔逊相关分析方法,分析各常规理化性质与氢含量的皮尔逊相关系数值;若某一常规理化性质与氢含量的皮尔逊相关系数绝对值大于临界值λ(λ的取值范围为[0,1]),则挑选为建模的特征变量。3.根据权利要求1所述的原料油及重馏分油中氢含量的预测系统,其特征在于,所述数据标准化模块,使用最大最小标准化的方法,将挑选的建模特征变量组成的样本数据进行标准化处理,使其成为可直接进行机器学习建模的数据。4.根据权利要求1所述的原料油及重馏分油中氢含量的预测系统,其特征在于,所述的模型训练模块,建立一个栈式自编码器和一个神经网络模型,将二者组合起来,实现通过油品的常规理化性质预测相应的氢含量。5.根据权利要求1所述的原料油及重馏分油中氢含量的预测系统,其特征在于,所述的模型训练模块,栈式自编码器和神经网络模型组合方法为:将由特征变量和对应的氢含量组成的样本数据标准化处理后同时作为输入和输出训练一个栈式自编码器;然后将栈式自编码器的中间隐藏层的输出作为目标变量,将栈式自编码器的训练样本数据去掉氢含量后作为输入,训练一个神经网络模型,该神经网络模型的结构与栈式自编码器模型编码器部分结构相似,最后把神经网络模型的输出作为栈式自编码器模型解码器部分的输入,就可以获得氢含量的预测值。6.根据权利要求5所述的原料油及重馏分油中氢含量的预测系统,其特征在于,模型的预测流程为,将标准化后的建模特征变量组成的样本数据输入到训练好的神经网络模型中,再把神经网络模型的输出输入到训练好的栈式自编码器的解码器部分进行解码,就可以仅通过常规理化性质预测原料油及重馏分油的氢含量。7.根据权利要求1所述的原料油及重馏分油中氢含量的预测系统,其特征在于,使用逐层驱动的策略,通过逐层训练自编码器得到栈式自编码器模型的网络结构,神经网络模型的网络结构参考栈式自编码器中编码器部分的网络结构;模型的超参数使用交叉验证结合
网格搜索策略进行选择。8.一种原料油及重馏分油中氢含量的预测方法,包括如下步骤:步骤一,基于皮尔逊相关分析的模型特征变量选择方法;通过对样本数据氢含量和常规理化性质进行相关性分析,确定建立机器学习模型的特征变量;所述的常规理化性质包括:密度(x1)、D86蒸馏曲线的初馏点(x2)、10%馏出温度(x3)、20%馏出温度(x4)、30%馏出温度(x5)、40%馏出温度(x6)、50%馏出温度(x7)、60%馏出温度(x8)、70%馏出温度(x9)、80%馏出温度(x<...

【专利技术属性】
技术研发人员:颜学峰林茂强杨建东林宸雨
申请(专利权)人:华东理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1