一种基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法技术

技术编号:36205249 阅读:65 留言:0更新日期:2023-01-04 12:00
本发明专利技术提供了一种基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法,包括以下步骤:对区块内相应油水井的静、动态数据进行筛选和提取,构建多源数据集;挑选出与产液剖面相关性较强的影响因素;对数据集中数据进行处理,建立产液剖面预测样本数据集;对比三种机器学习算法建立的分层产液剖面预测模型,选择使用XGBoost算法进行分层产液剖面预测模型的搭建;对选择的模型进行相应的模型训练及调参优化;将模型预测结果与KH劈分结果进行对比,选择二者的均值作为模型的最终输出;基于训练好的预测模型,进行油田现场多层合采生产井产液剖面的预测。本发明专利技术可充分利用油田现场数据和计算资源,实现对多层合采产量进行低成本且准确的劈分预测。准确的劈分预测。准确的劈分预测。

【技术实现步骤摘要】
一种基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法


[0001]本专利技术属于石油
,尤其是涉及一种基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法。

技术介绍

[0002]油田开发过程中,剖面测试相关资料在动态分析中扮演重要角色,但对于海上油田,测试费用高昂,且影响实际生产,因此针对海上油田实际产液剖面测试数据少。同时,现有劈分方法考虑因素少,准确度低,纵向多层合采产液剖面难以准确判别,如何充分利用现有剖面测试数据及海上油田地质开发资料,实现对纵向多层合采产液剖面的准确预测,从而指导提出有效的调整措施,是目前海上油田面临的一个难点问题。因此,如何对分层合采产量进行低成本且准确的劈分成为研究热点,但现有方法对油藏分层产液情况认识不全面,注水受效情况不明确。

技术实现思路

[0003]有鉴于此,本专利技术旨在提出一种基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法,可充分利用油田现场数据和计算资源,实现对多层合采产量进行低成本且准确的劈分预测。
[0004]为达到上述目的,本专利技术的技术方案是这样实现的:一种基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法,包括以下步骤:
[0005]步骤一:对区块内相应油水井的静态数据及动态数据进行筛选和提取,构建多源数据集;
[0006]步骤二:进行影响因素相关性分析,然后结合油田现场数据可获得的难易程度与油藏工程知识,挑选出与产液剖面相关性较强的影响因素;
[0007]步骤三:对数据集中数据进行油藏工程预处理以及异常值和标准化处理,建立产液剖面预测样本数据集;
[0008]步骤四:对比三种机器学习算法建立的分层产液剖面预测模型,选择使用XGBoost算法进行分层产液剖面预测模型的搭建;
[0009]步骤五:对选择的模型进行相应的模型训练及调参优化;
[0010]步骤六:将模型预测结果与KH劈分结果进行对比,选择二者的均值作为模型的最终输出;
[0011]步骤七:基于训练好的油藏纵向多层合采产液剖面预测模型,进行油田现场多层合采生产井产液剖面的预测。
[0012]进一步的,所述步骤一包括:
[0013](11)静态数据包括待预测井、有产液剖面测试的井及其周围井点的小层孔隙度、渗透率、有效厚度、变异系数、井距、完井方式、合采合注信息和射孔数据;
[0014](12)动态数据包括待预测井、有产液剖面测试的井及其周围井点的井口压力、日产液量、日注入量、累产液量、含水率和产液剖面测试数据。
[0015]进一步的,所述步骤2具体为:
[0016](21)进行变量间相关性的描述;
[0017]变量间的相关性是用来度量变量间变动状况一致性的重要指标,变量间的相关性越强,说明两变量的变动状况一致,即变量L1可以用变量L表示,见下式:
[0018]L1=f(L)
[0019]a.使用距离相关系数来进行变量间相关性的描述;
[0020]距离相关系数着重衡量了变量间的非线性相关程度,变量X、Y的距离相关系数的计算方法见下式:
[0021][0022]式中,dCor(X,Y):变量X,Y的距离协方差;dVar(X):变量X所有元素的距离方差;dVar(Y):变量Y所有元素的距离方差;
[0023]b.使用Pearson相关系数来进行变量间相关性的描述:
[0024]可以描述两个变量间的线性关系,两个变量的协方差越大,它们在一系列数据点范围内的取值所呈现出的趋势就越相近;
[0025]数据通常假设来自于正态分布,并且实验数据之间的差距不能太大,Pearson相关性系数受异常值的影响比较大,计算方法见下式:
[0026][0027]c.使用Spearman秩相关系数来进行变量间相关性的描述:
[0028]Spearman秩相关系数,相关系数范围为

1到1,负值为负相关,0为不相关,见下式:
[0029][0030](22)计算相关系数后采用热力图来表示各变量间相关系数。
[0031]进一步的,所述步骤三的具体步骤为:
[0032](31)基于油藏工程知识的预处理;
[0033]a.选择将小层的分层产液强度作为模型学习的目标,采用如下公式对小层分层产液量进行处理后作为样本学习的标签值:
[0034][0035]式中,I
str
表示小层的分层产液强度,I
vol
表示小层的分层产液量,h表示小层的砂厚;
[0036]b.小层压力
[0037]小层压力的计算根据井口压力和静液柱压力折算得到,具体计算公式如下:
[0038]P
i
=P
I
+ρgh
i
[0039]式中,P
i
表示小层i的压力,P
I
表示井口压力,ρ表示井筒流体密度,g表示重力参数,h
i
表示小层i的油藏中深;
[0040](32)数据标准化处理;
[0041]数据标准化处理是用于构建一个模型样本数据库的一项数据基础性处理工作,以消除在学习样本时由于不同的数量级及单位的影响;
[0042]min

max归一化方法是对原始数据进行线性变换,其作用是将原始值映射到[0

1]之间,具体的转换函数见下式:
[0043][0044]式中,x0为归一化之前数据;X为将X0归一化之后的数据;Max为样本数据的最大值;Min为样本数据的最小值;
[0045](33)异常值处理;
[0046]判断异常值时以四分位数和四分位间距作为判断标准,多达25%的数据可以变得任意远而不会扰动这个标准;
[0047]首先计算数据的上四分位数、中位数以及下四分位数,分别是将数据点按照大小排列后的四分之一、二分之一、四分之三处的数据,其中,上四分位数和下四分位数之差被称为分位距;而后计算上下边缘,分别指非异常范围内的最大值和最小值,计算如下:
[0048]上边缘=上四分位数+1.5
×
分位距;
[0049]下边缘=下四分位数

1.5
×
分位距。
[0050]进一步的,所述步骤四的具体方法为:
[0051]最终选择XGBoost算法进行预测模型的搭建,其原理如下:
[0052]XGBoost核心思想是不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(x),去拟合上次预测的残差,当训练完成得到k棵树,需要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数,最后只需要将每棵树对应的分数加起来就是该样本的预测值,预测模型表示如下:
[0053][0054]其中k为树的总个数,f...

【技术保护点】

【技术特征摘要】
1.一种基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法,其特征在于,包括以下步骤:步骤一:对区块内相应油水井的静态数据及动态数据进行筛选和提取,构建多源数据集;步骤二:进行影响因素相关性分析,然后结合油田现场数据可获得的难易程度与油藏工程知识,挑选出与产液剖面相关性较强的影响因素;步骤三:对数据集中数据进行油藏工程预处理以及异常值和标准化处理,建立产液剖面预测样本数据集;步骤四:对比三种机器学习算法建立的分层产液剖面预测模型,选择使用XGBoost算法进行分层产液剖面预测模型的搭建;步骤五:对选择的模型进行相应的模型训练及调参优化;步骤六:将模型预测结果与KH劈分结果进行对比,选择二者的均值作为模型的最终输出;步骤七:基于训练好的油藏纵向多层合采产液剖面预测模型,进行油田现场多层合采生产井产液剖面的预测。2.根据权利要求1所述的基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法,其特征在于,所述步骤一包括:(11)静态数据包括待预测井、有产液剖面测试的井及其周围井点的小层孔隙度、渗透率、有效厚度、变异系数、井距、完井方式、合采合注信息和射孔数据;(12)动态数据包括待预测井、有产液剖面测试的井及其周围井点的井口压力、日产液量、日注入量、累产液量、含水率和产液剖面测试数据。3.根据权利要求1所述的基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法,其特征在于,所述步骤2具体为:(21)进行变量间相关性的描述;变量间的相关性是用来度量变量间变动状况一致性的重要指标,变量间的相关性越强,说明两变量的变动状况一致,即变量L1可以用变量L表示,见下式:L1=f (L)a.使用距离相关系数来进行变量间相关性的描述;距离相关系数着重衡量了变量间的非线性相关程度,变量X、Y的距离相关系数的计算方法见下式:式中,dCor(X,Y):变量X,Y的距离协方差;dVar(X):变量X所有元素的距离方差;dVar(Y):变量Y所有元素的距离方差;b.使用Pearson相关系数来进行变量间相关性的描述:可以描述两个变量间的线性关系,两个变量的协方差越大,它们在一系列数据点范围内的取值所呈现出的趋势就越相近;数据通常假设来自于正态分布,并且实验数据之间的差距不能太大,Pearson相关性系
数受异常值的影响比较大,计算方法见下式:c.使用Spearman秩相关系数来进行变量间相关性的描述:Spearman秩相关系数,相关系数范围为

1到1,负值为负相关,0为不相关,见下式:(22)计算相关系数后采用热力图来表示各变量间相关系数。4.根据权利要求1所述的基于XGBoost与CV交叉函数的多层合采产液剖面劈分方法,其特征在于,所述步骤三的具体步骤为:(31)基于油藏工程知识的预处理;a.选择将小层的分层产液强度作为模型学习的目标,采用如下公式对小层分层产液量进行处理后作为样本学习的标签值:式中,I
str
表示小层的分层产液强度,I
vol
表示小层的分层产液量,h表示小层的砂厚;b.小层压力小层压力的计算根据井口压力和静液柱压力折算得到,具体计算公式如下:P
i
=P
I
+ρgh
i
式中,P
i
表示小层i的压力,P
I
表示井口压力,ρ表示井筒流体密度,g表示重力参数,h
i
表示小层i的油藏中深;(32)数据标准化处理;数据标准化处理是用于构建一个模型样本数据库的一项数据基础性处理工作,以消除在学习样本时由于不同的数量级及单位的影响;min

max归一化方法是对原始数据进行线性变换,其作用是将原始值映射到[0

1]之间,具体的转换函数见下式:式中,X0为归一化之前数据;X为将X0归一化之后的数据;Max为样本数据的最大值;Min为样本数据的最小值;(33)异常值处理;判断异常值时以四分位数和四分位间距作为判断标准,多达25%的数据可以变得任意远而不会扰动这个标准;首先计算数据的上四分位数、中位数以及下四分位数,分别是将数据点按照大小排列后的四分之一、二分之一、四分之三处的数据,其中,上四分位数和下四分位数之差被称为分位距;而后计算上下边缘,分别指...

【专利技术属性】
技术研发人员:陈凯姚为英张强张震张海勇胡云亭赵云斌
申请(专利权)人:中海油能源发展股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1