一种预测页岩气井最终可采储量的方法技术

技术编号:33133005 阅读:95 留言:0更新日期:2022-04-17 00:53
本发明专利技术公开了一种预测页岩气井最终可采储量的方法,包括以下步骤:S1,获取页岩气单井的地质数据、压裂数据、测试和生产数据;S2,进行数据预处理和特征工程,其中包括数据探索、缺失值填补、异常值的处理以及特征筛选;S3,对特征工程处理后的数据进行标准化处理,并划分数据集;S4,采用42种机器学习算法的基模型对训练集进行训练和并用测试集对其进行评估;S5,筛选出评价结果较好的3种基模型,进行调参;S6,将S5中得到模型采用集成学习方法进行模型融合;S7,使用模型融合得到的新模型进行训练和预测。本发明专利技术在页岩气井新井的EUR预测中能取得较好的结果,对页岩气井的开发技术政策调整具有实际意义。策调整具有实际意义。策调整具有实际意义。

【技术实现步骤摘要】
一种预测页岩气井最终可采储量的方法


[0001]本专利技术涉及油气田开发领域,具体涉及一种预测页岩气井最终可采储量的方法。

技术介绍

[0002]页岩气藏储层致密,自然条件下难以获得工业气流,常采用分段式压裂水平井技术进行储层改造,并采用控压生产制度进行商业开发。国内外生产实践表明,控压生产有助于抑制支撑剂回流,降低储层应力敏感效应,改善气井生产效果,提高气井最终可采储量(EUR)。但与此同时,由于频繁变更气井工作制度,导致气井生产数据波动剧烈,增大了数据拟合难度,降低了EUR计算效率和精度。因此,如何快速、准确预测控压生产下的页岩气井EUR显得尤为重要。现有方法主要有解析模型法、数值模拟法、物质平衡法、现代产量递减法、经验产量递减法和概率法等,传统模型和方法通常基于较为理想化的假设条件,而页岩气藏强非均质性特征及生产数据的大幅波动限制了传统方法计算 EUR的准确性,有必要开展相关研究工作。

技术实现思路

[0003]本专利技术主要是针对现有技术中的不足之处,本专利技术的目的是提供一种预测页岩气井最终可采储量的方法。
[0004]为达到以上技术目的,本专利技术采用以下技术方案:
[0005]一种预测页岩气井最终可采储量的方法,其特征在于,包括以下步骤:
[0006]S1:获取页岩气单井的地质数据、压裂数据、测试和生产数据;
[0007]S2:对特征类型进行划分和统计:
[0008]S2.1:首先采用one

hot方法将非数值型特征数值化,对于数值型特征,需要观察其正态分布图,计算峰度和偏度,查看变量与变量间的关系;
[0009]S2.2:其次,统计各特征变量缺失值所占的比例,对于缺失过多的特征或样本采用删除的策略,而缺失量不大的特征或样本采用KNN算法进行填补;考虑到KNN算法本身对于观测点间距离计算的特点以及地理位置相近的井更可能具有相似的地质特征,于是将该观测点间距离替换为井眼坐标的距离,由此计算出两样本间的距离,在此基础上进行缺失值的填补;
[0010]KNN算法是考虑两样本之间的“距离”,选取最接近的几个观测样本的平均值或距离加权作为有缺失的样本的填补值;其中,两观测样本的距离定义是:
[0011][0012]式中:len(x)为特征x的长度;x为一组样本值;y为另一组样本值;∑(!is.na(x

y))为x与y不相等的值的个数;x
i
为x中的第i个数据;y
i
为y中的第 i个数据;
[0013]有了距离的定义后,就可以选取k个最近邻,并根据距离加权和作为缺失值的预测值,本专利技术中对KNN算法进行改进,使用实际矿场上井间距离描述两个样本间的距离,再选
取k个最近邻,对缺失值进行填补;
[0014]S2.3:对各特征绘制箱型图,删除远超正常值范围的异常样本;
[0015]S2.4:最后计算Pearson相关性系数对特征进行筛选。
[0016]Pearson相关性系数计算公式为两个变量的协方差除以两个边量标准差的乘积:
[0017][0018]其中,X和Y变量的协方差公式如下所示:
[0019][0020]式中:ρ
X,Y
为X和Y变量的Pearson相关系数;X为一组变量的值;Y为另一组变量的值;σ
X
为X变量的标准差;σ
Y
为Y变量的标准差;n为样本个数;为X变量的平均值;为Y变量的平均值;
[0021]S3:对S2中处理后的数据进行标准化处理,并按8:2的比例划分数据集,分为训练集和测试集;
[0022]数据标准化处理的方法采用的是z

score标准化方法,将特征变量处理为均值等于0,标准差等于1的新数据;z

score标准化转换公式为:
[0023][0024]其中,标准差公式为:
[0025][0026]式中:N为样本数量;x
i
为第i个样本的值;μ为样本均值;σ为样本方差;
[0027]S4:采用42种机器学习算法的基模型对训练集进行训练,然后用测试集对基模型进行初步评估;所采用的基模型有随机森林、GBDT、线性回归、岭回归、 lightGBM、Adaboost、决策树、贝叶斯回归等42种算法,不进行任何参数调整,直接代入训练集进行训练,并用测试集验证;评价基模型效果的参数为均方根误差(RMSE),其计算公式为:
[0028][0029]式中:m为样本数量;y
i
为第i个预测值;为第i个真实值;均方根误差越小,基模型效果越好;
[0030]S5:在S4的基础上,筛选出评价结果较好的3种基模型,通过网格搜索的方法对超参数进行调整,以得到更好的预测结果;
[0031]S6:采用模型融合中的stacking方法将S5中得到的3个模型进行融合;利用训练好的3个不同模型的输出作为输入,来训练一个新的模型,从而得到最终的页岩气井EUR预测模型。
[0032]有益效果:
[0033]与现有技术相比,本专利技术具有以下有益效果:
[0034]1、相较于传统方法有更高的计算速度,且结果与实际相近;
[0035]2、改进了KNN算法对于距离的度量,使之更适用于EUR预测;
[0036]2、提出了一套页岩气井EUR预测新方法,该方法操作简便,可用于页岩气井EUR快速评价。
附图说明
[0037]图1方法流程图;
[0038]图2改进KNN算法填补缺失值验证图;
[0039]图3模型融合方法示意图;
[0040]图4筛选出的模型误差对比图。
具体实施方式
[0041]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0042]实施例
[0043]一种预测页岩气井最终可采储量的方法,具体的计算方法包括以下步骤:
[0044]S1:获取页岩气单井的地质数据、压裂数据、测试和生产数据;
[0045]S2:对特征类型进行划分和统计:
[0046]S2.1:首先采用one

hot方法将非数值型特征数值化,对于数值型特征,需要观察其正态分布图,计算峰度和偏度,查看变量与变量间的关系;
[0047]S2.2:其次,统计各特征变量缺失值所占的比例,对于缺失过多的特征或样本采用删除的策略,而缺失量不大的特征或样本采用KNN算法进行填补;考虑到KNN算法本身对于观测点间距离计算的特点以及地理位置相近的井更可能具有相似的地质特征,于是将该观测点间距离替换为井眼坐标的距离,由此计算出两样本间的距离,在此基础上进行缺失值的填补;
[0048]KNN算法是考虑两样本之间的“距离”,选取最接近的几个观测样本的平均值或距离加权作为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测页岩气井最终可采储量的方法,其特征在于,包括以下步骤:S1:获取页岩气单井的地质数据、压裂数据、测试和生产数据;S2:进行数据预处理和特征工程,其中包括原始数据探索及特征类型、采用基于井口大地坐标改进的KNN算法对缺失数据进行处理、对异常值的处理以及采用PCA等算法进行特征筛选;S3:对S2中处理后的数据进行标准化处理,并划分数据集,分为训练集和测试集;S4:采用42种机器学习算法的基模型对训练集进行训练和并用测试集对基模型进行初步评估;S5:筛选出评价结果较好的3种基模型,进行超参数调整得到更好的预测结果;S6:采用stacking方法将步骤5中得到的三个模型进行模型融合;S7:对S6中得到的新模型进行训练并对页岩气井EUR进行预测。2.根据权利要求1所述的方法,其特征在于,需要获取页岩气单井的地质数据、压裂数据、测试和生产数据。3.根据权利要求1所述的方法,其特征在于,进行数据预处理和特征工程包括如下内容:首先需要采用one

hot方法将非数值型特征数值化,对于数值型特征,需要观察其正态分布图,计算峰度和偏度,查看变量与变量间的关系;其次,统计各特征变量缺失值所占的比例,对于缺失过多的特征或样本采用删除的策略,而缺失量不大的特征或样本采用KNN算法进行填补,但考虑到KNN算法本身对于观测点间距离计算的特点以及地理位置相近的井更可能具有相似的地质特征,于是将该数值的距离替换为井眼坐标的距离,由此计算出两样本间的距离,在此基础上进行缺失值的填补:KNN算法是考虑两样本之间的“距离”,选取最接近的几个观测样本的平均值或距离加权作为有缺失的样本的填补值;其中,两次观测样本的距离定义是:式中:len(x)为特征x的长度;x为一组样本值;y为另一组样本值;∑(!is.na(x

y))为x与y不相等的值的个数;x
i
为x中的第i个数据;y
i
为y中的第i个数据;有了距离的定义后,就可以选取k个最近邻,并根据距离加权和作为缺失值的预测值;本发明中对KNN算法进行改进,使用实际矿场上井间距离描述两个样...

【专利技术属性】
技术研发人员:赵玉龙陈雲祚刘香禺张烈辉佘朝毅王建君吴建发常程张鉴胡浩然
申请(专利权)人:西南石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1