一种基于XGBoost特征选择的有利储层发育区预测方法技术

技术编号:20364639 阅读:36 留言:0更新日期:2019-02-16 17:19
本发明专利技术公开了一种基于XGBoost特征选择的有利储层发育区预测方法,其特征在于利用规范化方法处理地震属性以及岩性剖面数据,通过对储层发育区的分类标准进行规定,形成带有类别标签的样本集;进而采用XGBoost算法对地震属性集进行特征选择,选择相关性大的地震属性构成关键属性集;最后采用支持向量机(SVM)分类算法对未知区域的储层发育区类别进行预测。本发明专利技术提供的方法可以有效的提高有利储层发育区预测的准确率,辅助地质人员快速地圈定有利目标。

【技术实现步骤摘要】
一种基于XGBoost特征选择的有利储层发育区预测方法
本专利技术属于地球物理勘探领域和机器学习领域,具体涉及一种基于XGBoost特征选择的有利储层发育区预测方法。
技术介绍
在进行有利储层发育区预测的过程中,传统的方式是通过地震属性分析得到沉积相和层位构造,通过测井曲线得到砂岩位置,通过多个井的测井曲线对比得到储层的分布,最后依据上述得到的数据分析物源和油气聚集区。而以上步骤部分是不确定性的,是根据人工经验进行的。随着云计算、物联网、大数据的发展,勘探过程中对数据精度要求越来越高,而传统手段预测有利储层发育区时间花费长、利用的地震属性种类少,忽略了未使用的地震属性可能存在的对分类结果的支配作用,导致预测结果往往不准确。机器学习中分类预测的相关技术可应用到有利储层发育区预测,为地质人员圈定有利储层发育区起到了辅助作用。但是地震属性数量众多,其中可能存在不重要以及冗余的属性,属性个数越多,分析属性、训练模型所需的时间就越长且容易引起“维度灾难”。而好的属性能够提升分类模型的性能,提高预测的准确率,因此,特征选择显得尤为重要。
技术实现思路
为了克服传统有利储层发育区预测过程中遇到的困难,辅助地质人员快速圈定有利储层发育区,本专利技术提供了一种基于XGBoost特征选择的有利储层发育区预测方法:首先采用XGBoost特征选择,得到与类别标签相关性大的若干地震属性。其次,采用基于监督学习的SVM分类预测算法,用于预测未知区域是否为有利储层发育区。为实现上述目的,本专利技术技术方案主要包括以下四个步骤:A.数据采集及预处理:从勘探数据库、地震数据体等数据源中提取地震属性以及岩性剖面数据,采用规范化方法对地震属性进行预处理,将属性数值映射到[0,1]区间,获得样本集。在此采用的规范化方法为Min-Max标准化,计算公式如下:B.制定储层发育区分类标准:根据时窗对应的深度范围内砂岩的累计厚度或者单层砂岩的连续厚度将类别标签划分为3类,分别是非有利储层发育区(标记为0)、储层发育区(标记为1)、有利储层发育区(标记为2)。C.采用XGBoost选择关键属性:采用XGBoost方法对所有地震属性进行相关性分析,研究地震属性与储层发育区类别标签之间的相关性大小,选择相关性大的地震属性构成关键属性子集,去除不必要及冗余属性。D.采用支持向量机预测分类:以特征选择出的关键地震属性集作为输入变量,储层发育区类别标签(0,1,2)作为输出变量,将预处理后的地震数据及类别标签构成训练样本,采用支持向量机(SVM)分类模型进行训练,利用训练好的模型对未知区域进行有利储层发育区预测。本专利技术的有益效果是:XGBoost是一种优化算法,具有很高的分类精度。采用基于XGBoost的特征选择方法,可以有效的考虑到多种地震属性之间的隐含关系,从而使预测结果更加准确。融入机器学习中关于特征选择以及分类预测的相关知识为地质人员在有利储层发育区预测上提供了辅助作用。附图说明图1是本专利技术的流程图上图中:11.地震属性,12.岩性剖面数据,13.Min-Max标准化,14.XGBoost方法,15.关键属性子集,16.SVM分类器,17.未知区域的地震属性集。具体实施方式下面结合图1对本专利技术作进一步详细的描述:A.数据采集及预处理:从勘探数据库、地震数据体等数据源中提取地震属性11以及岩性剖面数据12,因不同地震属性的衡量规格不同,容易影响分类模型学习效率,于是采用规范化方法对地震属性进行预处理,将属性数值映射到[0,1]区间,作为输入变量X,记作X={x1,x2…xn},其中n为地震属性的个数。在此采用的规范化方法为Min-Max标准化13,计算公式如下:B.制定储层发育区分类标准:通过A提取的岩性剖面数据为:砂岩、页岩等具体类型,根据时窗对应的深度范围内砂岩的累计厚度或者单层砂岩的连续厚度将类别标签划分为3类,举例如下:①砂岩累计厚度低于4m标记为0,表示非有利储层发育区;②砂岩累计厚度4m-10m或者单个小层(连续砂岩)厚度3m以上标记为1,表示储层发育区;③砂岩累计厚度10m以上标记为2,表示有利储层发育区。将类别标签作为输出变量Y,记作Y={y1,y2,y3}={1,2,3}。C.采用XGBoost选择关键属性:根据XGBoost方法14对所有地震属性进行相关性分析,研究地震属性与储层发育区类别标签之间的相关性大小,选择相关性大的地震属性构成关键属性子集15,去除不必要及冗余属性。(1)XGBoost特征选择的原理:通过以下公式计算各个地震属性的增益,进而选择增益最大地震属性去做分裂,最后各地震属性的重要性为各地震属性在所有树中出现的次数之和。式中:G表示节点损失函数的一阶导数之和,H表示节点损失函数的二阶导数之和,L代表左子树,R代表右子树。(2)根据XGBoost原理计算地震属性集中每个属性xi与类y1、y2、y3的相关性,根据相关性大小按降序排列,只取重要性得分大于0的属性作为关键属性,记作X={x1,x2…xk},其中k为特征选择后的属性个数。D.采用支持向量机(SVM)预测分类:采用SVM分类器16进行预测分类的步骤如下:(1)优先选择径向基核函数。在一般情况下,径向基核作为第一选择,具有较少的数值计算困难。(2)通过交叉验证选择惩罚参数以及核函数参数的最优取值。(3)利用选取的最佳参数进行训练。以样本集X={x1,x2…xk}及对应的类别标签Y作为训练数据,进行SVM分类模型的训练,使误差达到最小。(4)运用该分类器进行预测。通过输入未知区域的地震属性集17,预测该区域是否为有利储层发育区,进而对有利储层发育区进行圈定。以上所述,仅是本专利技术的较佳实施例,任何熟悉本专业的技术人员可能利用上述阐述的技术方案加以改型或变更为等同变化的等同实例。凡未脱离本专利技术技术方案内容,依据专利技术的技术方案对上述实施例进行的任何简单修改、变更或改型,均属于专利技术技术方案的保护范围。本文档来自技高网...

【技术保护点】
1.一种基于XGBoost特征选择的有利储层发育区预测方法,其特征在于,包括以下步骤:从勘探数据库、地震数据体等数据源中提取地震属性以及岩性剖面数据,采用规范化方法Min‑Max标准化对地震属性进行预处理,将属性数值映射到[0,1]区间,获得样本集;根据时窗对应的深度范围内砂岩的累计厚度或者单层砂岩的连续厚度将类别标签划分为3类,分别是非有利储层发育区、储层发育区、有利储层发育区;采用XGBoost方法对所有地震属性进行相关性分析,研究地震属性与储层发育区类别标签之间的相关性大小,选择相关性大的地震属性构成关键属性子集,去除不必要及冗余属性;以关键属性子集作为输入变量,储层发育区类别标签作为输出变量,将预处理后的地震数据及类别标签构成训练样本,采用支持向量机(SVM)分类模型进行训练,利用训练好的模型对未知区域进行有利储层发育区预测。

【技术特征摘要】
1.一种基于XGBoost特征选择的有利储层发育区预测方法,其特征在于,包括以下步骤:从勘探数据库、地震数据体等数据源中提取地震属性以及岩性剖面数据,采用规范化方法Min-Max标准化对地震属性进行预处理,将属性数值映射到[0,1]区间,获得样本集;根据时窗对应的深度范围内砂岩的累计厚度或者单层砂岩的连续厚度将类别标签划分为3类,分别是非有利储层发育区、储层发育区、有利...

【专利技术属性】
技术研发人员:李克文周广悦焦宗浩林亚林
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1