当前位置: 首页 > 专利查询>渤海大学专利>正文

一种基于时间序列的油井产液量集成预测方法技术

技术编号:17705978 阅读:75 留言:0更新日期:2018-04-14 18:37
本发明专利技术属于石油生产技术领域,具体提供了一种基于时间序列的油井产液量集成预测方法,利用历史数据建立油井产液量数据集,采用经验模态分解方法对油井产液量数据集{Xi}中的数据进行处理;原数据集分解成k个IMF分量数据集和一个余项数据集;采用集成预测方法,分别由基于ELM方法和基于ESN方法以并行的方式同时对k个IMF分量数据集和一个余项数据集进行预测;将每个序列由两种方法所得到的预测值求平均值,然后将所有序列的预测值求和得到最终结果。本发明专利技术提供的这种预测方法,由过去一段时间的数据去预测未来某个时间点的值,原理简单,计算复杂性低,准确度高,可以有效降低异常数据的影响。

【技术实现步骤摘要】
一种基于时间序列的油井产液量集成预测方法
本专利技术涉及石油生产
,具体涉及一种基于时间序列的油井产液量集成预测方法。
技术介绍
油井产液量是油田生产的一个重要指标,不仅关系到油井的生产寿命,还与企业的经济效益密切相关。对其进行准确的预测,对合理评价油井生产状况、及时调整抽汲参数和开采方案等都具有重要的意义。油井采油过程动态变化,会受到流体特性、油藏条件、人力干扰等的影响,很难在机理上掌握产油量的变化规律。目前的油田生产只能从井下采出油液后判断油井的实际生产状况,无法提前获知产液量的变化趋势。这使得油井开采方案的制定或调整总是滞后于油井的实际生产状况,影响企业生产效益。
技术实现思路
本专利技术的目的是克服现有技术的缺陷,提供一种基于时间序列的油井产液量集成预测方法,由已有的过去一段时期的油井产液量数据预测下一个时间点的产液量数据。本专利技术的技术方案如下:一种基于时间序列的油井产液量集成预测方法,包括如下步骤:1)利用历史数据建立油井产液量数据集为{xi,i=1,2,…,n},n为数据点的个数;2)采用经验模态分解(EMD,EmpiricalModeDecomposition)方法即EMD方法对油井产液量数据集{xi}中的数据进行处理;3)将{xi}中所有极大值点用三次样条插值函数拟合,得到{xi}的上包络线;将{xi}中所有极小值点用三次样条插值函数拟合,得到{xi}的下包络线;{xi}的上下包络线的平均值记作将原数据集{xi}减去该平均值得到一个新的数据集{h1(i)},记作:4)若{h1(i)}满足条件,则将该{h1(i)}看作{xi}的第一个IMF分量,记为c1(i)=h1(i);若{h1(i)}不满足条件,则使{h1(i)}取代原数据集{xi},重复步骤3)直至计算得到一个满足条件的IMF分量,记为{c1(i)};5)用{xi}减去{c1(i)}得到剩余值数据集{x1(i)},有:x1(i)=xi-c1(i);把{x1(i)}作为一个新的待分解数据集,重复步骤3)和步骤4),依次提取出第2个、第3个直至第k个IMF分量,以及原数据集的余项{rres(i)};当满足终止条件时结束分解,终止条件为最新的数据集不能再提取IMF分量;原数据集{xi}分解成k个IMF分量数据集{ck(i)}和一个余项数据集{rres(i)};6)将k个IMF分量数据集{ck(i)}和一个余项数据集{rres(i)}中的数据进行相空间重构,得到时间序列模型,输入表示为:Xt=[xt,xt+τ,…,xt+(m-1)τ],其中,t=1,2,…,M,m为嵌入维数,τ为延迟时间,M=n-(m-1)τ,n为数据集中数据的个数;将每个时间序列的输出表示为:Yt=xt+1+(m-1)τ;7)采用集成预测方法,分别由基于ELM方法(极限学习机的方法)和基于ESN方法(回声状态网络)以并行的方式同时对k个IMF分量数据集{ck(i)}和一个余项数据集{rres(i)}进行预测;8)对于k个IMF分量数据集时间序列和一个余项数据集时间序列,首先将每个序列由两种方法所得到的预测值求平均值,然后将所有序列的预测值求和得到最终结果;计算公式如下:其中,表示第i个IMF分量数据集时间序列由ELM方法得到的预测值;表示第i个IMF分量数据集时间序列由ESN方法得到的预测值;表示余项数据集时间序列由ELM方法得到的预测值;表示余项数据集时间序列由ESN方法得到的预测值。所述步骤7)中根据极限学习机(ELM)方法建立k个IMF分量数据集{ck(i)}和一个余项数据集{rres(i)}的时间序列模型;每个模型的输入和输出分别为Xt和Yt,ELM方法的基本原理如下:设有W个训练样本其中uq为输入向量,vq为输出向量,设定包含L个隐含层,激活函数为f(·)以及模型的训练输出表示为Q=[g1,g2,…,gq]T,ELM模型由如下方程组进行描述:其中,βlq为第l个隐含层神经元与第q个输出神经元之间的连接权值;ω1为隐含层神经元与输入神经元之间的连接权值;b1为第l个隐含层神经元的偏置;如果训练模型能以零误差逼近W个训练样本,即有那么对于式(1)有下式成立,那么ELM模型的数学描述可以改写成如下矩阵形式:Hβ=V(3)式(3)中,有:H为隐含层输出矩阵,ω和b在初始化时已随机给定。那么,ELM模型的训练可以转化成一个求解非线性方程最小值的问题,即:输出权值矩阵β*可以由下式求出,β*=H+V(6)其中,H为隐含层输出矩阵H的Moore-Penrose广义逆;那么,ELM的训练过程可以归纳为如下最优化问题:其中,G(·)表示由ω和b所决定的函数,G(ω,b)表示当ω和b分别取不同值时的函数输出值;ELM训练的目的就是找到最优的β*,使模型的训练输出值gq和真实值vq之间的误差最小;对于激活函数f(·)的选择,本专利技术专利采用高斯函数,定义如下:其中,z表示输入向量,σ2为高斯函数的宽度参数。进一步地,所述基于极限学习机方法建立时间序列模型的计算步骤如下:初始化,随机生成隐含层输入权值ω,隐含层神经元的偏置b,高斯函数的宽度参数σ2;根据公式(4)计算隐含层输出矩阵H;根据公式(6)计算输出权值矩阵β*;根据公式(7)计算函数输出值。进一步地,由ELM方法建立时间序列模型的过程中,m、τ、ω、b和σ2的取值决定了ELM模型的计算精度,采用一种改进的果蝇优化算法(IFOA,ImprovedFruitOptimizationAlgorithm)对m、τ、ω、b和σ2的取值进行优化选取;IFOA算法的数学描述如下:(1)设定果蝇群体的位置区间[plow,pup],在位置区间内随机给定每个果蝇的初始位置Axis_xi和Axis_yi如下:Axis_xi=plow+rand1·(pup-plow)(9)Axis_yi=plow+rand2·(pup-plow)(10)其中,i=1,2,...,sizepop,sizepop为果蝇群体中果蝇的个数;rand1和rand2分别为[0,1]区间内的随机数。(2)果蝇个体利用嗅觉搜寻食物,每个个体的位置更新公式如下:其中,Axis_Xi和Axis_Yi表示第i个果蝇个体移动后的位置坐标;BestAxis_x和BestAxis_y表示当前最优个体的位置坐标;Ite和Itemax分别表示当前迭代次数和最大迭代次数;rand3和rand4分别为[-1,1]区间内的随机数;rand5为[0,1]区间内的随机数。(3)计算果蝇个体与原点的距离,如下:(4)计算味道浓度判定值,如下:(5)由果蝇个体的味道浓度判定值计算每个果蝇个体的味道浓度值,如下:Smellt=fitness(St)(15)其中,fitness为适应度函数,用以评价待优化参数的取值。(6)找到果蝇群体中的最优个体,如下:[bestSmellbestIndex]=min/max(Smell)(16)其中,bestSmell表示最优的味道浓度值,bestIndex表示最优味道浓度值对应的果蝇个体的序号;min/max表示最小或最大。进一步地,IFOA的计算步骤如下:步骤(1)、产生初始的与待优化参数数量相同的果蝇群体,根据待优化参数的取值范围设定每个果蝇群体的位置区间[plow本文档来自技高网...
一种基于时间序列的油井产液量集成预测方法

【技术保护点】
一种基于时间序列的油井产液量集成预测方法,其特征在于,包括如下步骤:1)利用历史数据建立油井产液量数据集为{xi,i=1,2,…,n},n为数据点的个数;2)采用经验模态分解方法对油井产液量数据集{xi}中的数据进行处理;3)将{xi}中所有极大值点用三次样条插值函数拟合,得到{xi}的上包络线;将{xi}中所有极小值点用三次样条插值函数拟合,得到{xi}的下包络线;{xi}的上下包络线的平均值记作

【技术特征摘要】
1.一种基于时间序列的油井产液量集成预测方法,其特征在于,包括如下步骤:1)利用历史数据建立油井产液量数据集为{xi,i=1,2,…,n},n为数据点的个数;2)采用经验模态分解方法对油井产液量数据集{xi}中的数据进行处理;3)将{xi}中所有极大值点用三次样条插值函数拟合,得到{xi}的上包络线;将{xi}中所有极小值点用三次样条插值函数拟合,得到{xi}的下包络线;{xi}的上下包络线的平均值记作将原数据集{xi}减去该平均值得到一个新的数据集{h1(i)},记作:4)若{h1(i)}满足条件,则将该{h1(i)}看作{xi}的第一个IMF分量,记为c1(i)=h1(i);若{h1(i)}不满足条件,则使{h1(i)}取代原数据集{xi},重复步骤3)直至计算得到一个满足条件的IMF分量,记为{c1(i)};5)用{xi}减去{c1(i)}得到剩余值数据集{x1(i)},有:x1(i)=xi-c1(i);把{x1(i)}作为一个新的待分解数据集,重复步骤3)和步骤4),依次提取出第2个、第3个直至第k个IMF分量,以及原数据集的余项{rres(i)};当满足终止条件时结束分解,终止条件为最新的数据集不能再提取IMF分量;原数据集{xi}分解成k个IMF分量数据集{ck(i)}和一个余项数据集{rres(i)};6)将k个IMF分量数据集{ck(i)}和一个余项数据集{rres(i)}中的数据进行相空间重构,得到时间序列模型,输入表示为:Xt=[xt,xt+τ,…,xt+(m-1)τ],其中,t=1,2,…,M,m为嵌入维数,τ为延迟时间,M=n-(m-1)τ,n为数据集中数据的个数;将每个时间序列的输出表示为:Yt=xt+1+(m-1)τ;7)采用集成预测方法,分别由基于ELM方法和基于ESN方法以并行的方式同时对k个IMF分量数据集{ck(i)}和一个余项数据集{rres(i)}进行预测;8)对于k个IMF分量数据集时间序列和一个余项数据集时间序列,首先将每个序列由两种方法所得到的预测值求平均值,然后将所有序列的预测值求和得到最终结果;计算公式如下:其中,表示第i个IMF分量数据集时间序列由ELM方法得到的预测值;表示第i个IMF分量数据集时间序列由ESN方法得到的预测值;表示余项数据集时间序列由ELM方法得到的预测值;表示余项数据集时间序列由ESN方法得到的预测值。2.如权利要求1所述的方法,其特征在于:所述步骤7)中根据ELM方法建立k个IMF分量数据集{ck(i)}和一个余项数据集{rres(i)}的时间序列模型;每个模型的输入和输出分别为Xt和Yt,ELM方法的基本原理如下:设有W个训练样本其中uq为输入向量,vq为输出向量,设定包含L个隐含层,激活函数为f(·)以及模型的训练输出表示为Q=[g1,g2,…,gq]T,ELM模型由如下方程组进行描述:其中,βlq为第l个隐含层神经元与第q个输出神经元之间的连接权值;ωl为隐含层神经元与输入神经元之间的连接权值;bl为第l个隐含层神经元的偏置;如果训练模型能以零误差逼近W个训练样本,即有那么对于式(1)有下式成立,那么ELM模型的数学描述可以改写成如下矩阵形式:Hβ=V(3)式(3)中,有:H为隐含层输出矩阵,ω和b在初始化时已随机给定;那么,ELM模型的训练可以转化成一个求解非线性方程最小值的问题,即:输出权值矩阵β*可以由下式求出,β*=H+V(6)其中,H+为隐含层输出矩阵H的Moore-Penrose广义逆;那么,ELM的训练过程可以归纳为如下最优化问题:其中,G(·)表示由ω和b所决定的函数,G(ω,b)表示当ω和b分别取不同值时的函数输出值;对于激活函数f(·)的选择,本发明专利采用高斯函数,定义如下:其中,z表示输入向量,σ2为高斯函数的宽度参数。3.如权利要求2所述的方法,其特征在于:所述基于ELM方法建立时间序列模型的计算步骤如下:初始化,随机生成隐含层输入权值ω,隐含层神经元的偏置b,高斯函数的宽度参数σ2;根据公式(4)计算隐含层输出矩阵H;根据公式(6)计算输出权值矩阵β*;根据公式(7)计算函数输出值。4.如权利要求3所述的方法,其特征在于:由ELM方法建立时间序列模型的过程中,采用一种改进的果蝇优化算法对m、τ、ω、b和σ2的取值进行优化选取;果蝇优化算法的数学描述如下:(1)设定果蝇群体的位置区间[plow,pup],在位置区间内随机给定每个果蝇的初始位置Axis_xi和Axis_yi如下:Axis_xi=plow+rand1·(pup-plow)(9)Axis_yi=plow+rand2·(pup-plow)(10)其中,i=1,2,...,sizepop,sizepop为果蝇群体中果蝇的个数;rand1和rand2分别为[0,1]区间内的随机数;(2)果蝇个体利用嗅觉搜寻食物,每个个体的位置更新公式如下:其中,Axis_Xi和Axis_Yi表示第i个果蝇个体移动后的位置坐标;BestAxis_x和BestAxis_y表示当前最优个体的位置坐标;Ite和Itemax分别表示当前迭代次数和最大迭代次数;rand3和rand4分别为[-1,1]区间内的随机数;rand5为[0,1]区间内的随机数;(3)计算果蝇个体与原点的距离,如下:(4)计算味道浓度判定值,如下:

【专利技术属性】
技术研发人员:李琨韩莹张志强张爱华魏泽飞宿文肃
申请(专利权)人:渤海大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1