一种自适应的原油性质近红外快速预测方法技术

技术编号:20328217 阅读:48 留言:0更新日期:2019-02-13 05:12
本发明专利技术公开了一种自适应的原油性质近红外快速预测方法。构建用于原油性质预测的模型的方法包括:(1)测定原油样本的性质数据;(2)测定所述原油样本的近红外光谱图;(3)对步骤(2)获得的近红外光谱图进行预处理,建立初始训练集;(4)采用主成分分析(PCA)结合Hotelling T2统计的方法剔除初始训练集中异常的样本点,得到最终训练集;(5)对步骤(4)获得的样本进行主成分分析,保存特征值贡献率大于95%的载荷向量记为Ppca;(6)利用Ppca对待测样本的近红外光谱进行降维后,通过相似性指标(SI)选择局部训练集;(7)根据局部训练集确定一个或多个波数段,利用偏最小二乘法(PLS)建立原油性质的局部模型。

【技术实现步骤摘要】
一种自适应的原油性质近红外快速预测方法
本专利技术涉及一种自适应的原油性质近红外快速预测方法。
技术介绍
随着现代工业的迅速发展,石油作为国家物资在国民经济中发挥着至关重要的作用。原油作为炼化企业的最主要原料,原油的需求量剧增、进口量扩大、价格居高不下且波动频繁。根据《BP世界能源统计年鉴2016》报道,2015年,中国石油净进口量增长77万桶/日,中国再次成为全球最大的石油进口国,进口原油的种类非常多,其中有不少是所谓的“机会油”,它们或者比重很大,或者含酸很高,或者杂质很多。这些给炼化企业带来了巨大的压力。及时获得当前原油的性质评价数据——即原油快速评价,将为原油贸易、原油输送、原油调合、原油加工、全厂生产计划、生产调度等生产过程优化提供支撑。此外,随着世界范围原油的不断重质化,我国炼厂加工的重质油甚至超重质油的比例越来越高,对重油加工的要求也越来越精细和高效。因此采用传统的评价方法已不能满足实际应用的需求。目前不断发展的计算机技术,使在极短时间内分析大量数据得以实现,促进了现代分析仪器技术的飞速发展,这些都为原油快速评价奠定了坚实的基础。近红外分析技术是目前最有前景且应用最广泛的快速分析方法之一。近几年来光纤在近红外光谱
的应用使近红外光谱技术从实验室走向现场,光纤化学和热稳定性、对电磁干扰不敏感、传输信号能量集中、灵敏度高、价格低廉等优点,使得近红外光谱仪可以在恶劣、危险的环境中进行远距离快速在线分析。原油组分复杂,属于黏稠深色液体。原油的待测性质多,并且其近红外光谱吸收带较宽且重叠严重。且由于近红外分析仪是二次测量仪表,即近红外分析仪并不能直接测量物质属性,而必须先建立待测物质的属性与近红外光谱之间的数学模型然后根据模型来测量物质属性。因此,建立精度高、鲁棒性好的近红外模型是近红外技术能否有效应用的关键。原始的建模方法一般都属于静态模型的范畴,光谱的预处理、变量选择、模型建立以及模型更新和维护等关键步骤都需要离线进行,并在应用过程保持不变。对于流程工业,生产的连续性往往需要模型能够对现场工况进行实时跟踪;并且在模型与当前工况发生较大的偏差、预测精度无法满足在线检测的需求时,模型能够进行及时有效地更新。
技术实现思路
鉴于上述问题,本专利技术提出了一种基于近红外光谱检测的自适应的原油性质快速预测方法。该方法利用离线/在线近红外分析仪采集原油近红外光谱图的基础上,采用减去一条直线的方法对采集到的原油样本近红外光谱进行预处理,以消除干扰;对预处理后的光谱数据进行训练集样本的选择,剔除异常样本点;对于每一个新得到的待测光谱根据相似性指标SI从样本库中选择n个样本建立局部训练集,并根据该训练集确定建模用波数范围,并利用PLS建立局部模型,用于预测待测样品的相关性质。本专利技术提供的自适应的基于近红外光谱的原油属性建模方法包括以下步骤:步骤一:构建原油样本库,测定训练集中原油样本的性质数据;步骤二:测量样本库中所有样本的近红外光谱图;步骤三:对步骤二获得的原油近红外光谱进行预处理,获得样本库;步骤四:对预处理后的光谱数据进行训练集样本的选择,剔除异常样本点;步骤五:对样本库中的所有样本进行PCA主成分分析,并选取特征值贡献率大于95%的载荷向量记为Ppca;步骤六:当获得新的待测光谱xp时,利用Ppca对待测光谱xp进行降维,并根据相似性指标SI从样本库中选择n个样本建立局部训练集S;步骤七:根据局部训练集S确定波数范围;步骤八:根据确定的波数范围,利用PLS在局部训练集上建立局部模型,并预测待测光谱xp的属性值。在一个或多个实施方案中,步骤一中用于构建训练集的原油20℃的密度在0.7-1.1g/cm3的范围内,硫含量在0.03%-5.50%的范围内,酸值在0.01-12.00mgKOH/g的范围内;和/或所述原油性质包括密度、残炭、酸值、硫含量、氮含量、蜡含量、胶质含量、沥青质含量和实沸点数据中的一个或多个。在一个或多个实施方案中,所述步骤二包括,将训练集样品放置于低于35℃温度下的某一温度,待原油样品温度达到稳定状态后,测定该原油样品的近红外光谱数据;在一个或多个实施方案中,步骤二中,扫描范围为4000-12500cm-1,扫描次数为10-100次。在一个或多个实施方案中,所述步骤三中,所述近红外光谱预处理方法为利用减去一条直线对对步骤二获得的波数范围为12500-4000cm-1区域的原油样本近红外光谱图进行预处理,用以消除背景干扰与基线漂移;在一个或多个实施方案中,所述步骤四包括,采用主成分分析结合HotellingT2统计的方法,计算初始训练集中的每个样本的T2统计量,根据预设的T2统计量阈值,剔除初始训练集中异常的样本点,构成最终的训练集;优选地,采用主成分分析结合HotellingT2统计的方法剔除异常样本点的过程为:首先对样本光谱进行主成分分析,然后利用主成分得分作为特征变量,计算每个样本的T2统计量,根据预设的T2统计量阈值,剔除初始训练集中异常的样本点,构成最终的训练集。在一个或多个实施方案中,对剔除异常样本采用T2统计来检测异常值,并将T2统计量较大的样本从中剔除;优选地,T2统计的描述公式如下:式中,t为原始光谱矩阵X经过PCA降维后的变量,σ为t的标准差,Iter为提取的主成分个数;由于异常样本的T2值会远远大于正常样本,所以计算所有样本库中的光谱样本的T2值,并以99%的置信区间为阈值上限,按照下式,并查F分布表,计算得到阈值,将样本库中所有样本的T2值与阈值进行比较,剔除大于阈值的样本,建立最终训练集。步骤五中对光谱矩阵X进行PCA分析等效于对矩阵X的协方差矩阵XTX进行特征向量分解,载荷向量就是协方差矩阵XTX的特征向量。若令λ表示XTX的特征值,那么前k个主成分的累积贡献率可按下式计算:m为光谱的波长点个数。在一个或多个实施方案中,所述步骤六中的相似性指标SI的计算步骤如下所示:(a)通过Ppca对样本库中所有光谱和待测光谱xp降维后得到新的样本库K’和xp’;(b)根据下式计算xp’与样本库K’中所有样本之间的欧式距离dip式中,dip:第i个样本与待测样本xp’之间的欧式距离;m:为主成分个数;xi:为第i个样本的主成分得分;k:为主成分数;(c)根据下式计算xp’与样本库K’中所有样本之间的夹角余弦值cos(θi)式中,cos(θip):第i个样本与待测样本xp’之间的夹角余弦值;N:为主成分个数;xik:为第i个样本的第k个主成分得分;k:为主成分数。为待测样本的第k个主成分得分;(d)将(b)、(c)中计算得到的欧式距离dip和夹角余弦值cos(θip)直接带入下式,计算相似度指标SIipSIip=ρexp(-dip)+(1-ρ)cos(θip),0≤ρ≤1(e)对SI从大到小进行排序,选择前n个样本加入训练集,建立局部训练集S。在一个或多个实施方案中,所述步骤六中选择的加入训练集的样本数占样本总数的50%-90%;需根据具体情况进行调整。在一个或多个实施方案中,所述步骤七中的波数范围确定步骤如下所示,(i)首先对每个变量设定初始权值m为总变量数;取迭代次数t=1,…,g,重复以下步骤:(ii)计算每一个变量的采样概率并且根据采样概率从所有波数点中抽取k个本文档来自技高网
...

【技术保护点】
1.一种构建用于原油性质预测的模型的方法,其特征在于,所述方法包括:(1)测定原油样本的性质数据;(2)测定所述原油样本的近红外光谱图;(3)对步骤(2)获得的近红外光谱图进行预处理,建立初始训练集;(4)采用主成分分析(PCA)结合Hotelling T2统计的方法剔除初始训练集中异常的样本点,得到最终训练集;(5)对步骤(4)获得的样本进行主成分分析,保存特征值贡献率大于95%的载荷向量记为Ppca;(6)利用Ppca对待测样本的近红外光谱进行降维后,通过相似性指标(SI)选择局部训练集;(7)根据局部训练集确定一个或多个波数段,利用偏最小二乘法(PLS)建立原油性质的局部模型。

【技术特征摘要】
1.一种构建用于原油性质预测的模型的方法,其特征在于,所述方法包括:(1)测定原油样本的性质数据;(2)测定所述原油样本的近红外光谱图;(3)对步骤(2)获得的近红外光谱图进行预处理,建立初始训练集;(4)采用主成分分析(PCA)结合HotellingT2统计的方法剔除初始训练集中异常的样本点,得到最终训练集;(5)对步骤(4)获得的样本进行主成分分析,保存特征值贡献率大于95%的载荷向量记为Ppca;(6)利用Ppca对待测样本的近红外光谱进行降维后,通过相似性指标(SI)选择局部训练集;(7)根据局部训练集确定一个或多个波数段,利用偏最小二乘法(PLS)建立原油性质的局部模型。2.如权利要求1所述的方法,其特征在于,所述原油性质选自:密度、残炭、酸值、硫含量、氮含量、蜡含量、胶质含量、沥青质含量和实沸点数据中的一个或多个;优选地,步骤(1)中的原油20℃的密度在0.7-1.1g/cm3的范围内,硫含量在0.03%-5.50%的范围内,酸值在0.01-12.00mgKOH/g的范围内;更优选地,步骤(1)中原油样本的数量不少于200份。3.如权利要求1或2所述的方法,其特征在于,步骤(2)中采用离线或在线近红外分析仪采集原油样本的近红外光谱数据;优选地,光谱扫描范围为4000-12500cm-1,分辨率为16-32cm-1,重复扫描10-100次,取平均近红外光谱值;更优选地,测定低于35℃的原油样本的近红外光谱数据。4.如权利要求1-3中任一项所述的方法,其特征在于,步骤(3)所述近红外光谱预处理方法为利用减去一条直线对全谱图进行预处理,以消除背景干扰与基线漂移。5.如权利要求1-4中任一项所述的方法,其特征在于,步骤(4)包括,采用主成分分析结合HotellingT2统计的方法,计算初始样本库中的每个样本的T2统计量,根据预设的T2统计量阈值,剔除初始样本库中异常的样本点;优选地,采用主成分分析结合HotellingT2统计的方法剔除异常样本点的过程为:首先对样本光谱进行主成分分析,然后利用主成分得分作为特征变量,计算每个样本的T2统计量,根据预设的T2统计量阈值,剔除样本库中异常的样本点。6.如权利要求5所述的方法,其特征在于,对剔除异常样本采用T2统计来检测异常值,并将T2统计量较大的样本从中剔除;优选地,T2统计的描述公式如下:式中,t为原始光谱矩阵X经过PCA降维后的变量,σ为t的标准差,Iter为提取的主成分个数;由于异常样本的T2值会远远大于正常样本,所以计算所有样本库中的光谱样本的T2值,并以99%的置信区间为阈值上限,按照下式,并查F分布表,计算得到阈值,将样本库中所有样本的T2值与阈值进...

【专利技术属性】
技术研发人员:钱锋钟伟民杨明磊杜文莉隆建
申请(专利权)人:华东理工大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1