一种储层油气预测的方法技术

技术编号:11362669 阅读:101 留言:0更新日期:2015-04-29 13:12
本发明专利技术是石油地球物理勘探地震储层预测方法。根据已知储层确定训练样本,计算平均值并标准化,训练构建分类器得到在不同弱分类器个数下的各个堆类中心,各个堆类所属的类别及组合分类器系数,对标准化后的每个标准化后的待分类样本数据进行分类,根据标准化后待分类样本所属类别预测储层的油气分布。本发明专利技术可以较好地应用基于属性聚类算法进行储层油气预测。

【技术实现步骤摘要】

本专利技术属于石油地球物理勘探地震储层预测技术,具体是利用基于属性聚类的自适应增强算法进行储层油气预测的方法。技术背景模式识别技术在石油地球物理勘探领域被广泛的应用到储层预测方面,利用模式识别技术可进行油气预测、岩性预测和储层参数估算等等。根据分类器生成的训练阶段是否用到已知样本,现有的地震属性模式识别方法可分为两大类:无监督方法和有监督方法。无监督方法不需要已知样本信息而将数据分为不同的类,而有监督方法利用已知样本(例如井信息)来构建分类器,通过利用先验信息,有监督方法可以提供更高的精度。目前在石油地震勘探储层油气预测中常用的有监督模式识别方法有k-近邻法和BP神经网络算法等。其中k-近邻法是对一个新样本,找离它最近的k个学习样本,这k个学习样本中属于哪一类的样本最多,就判断新样本属于那一类。k-近邻法虽然简便,但是一个样本是一个点,是一个随机变量或向量,因此,稳定性不够好。而BP法一般只用于两类分类,专利200410013772公开了这种方法。尽管BP神经网络是石油地震勘探储层和油气预测方法中应用的比较广泛,但在复杂岩性油气储层油气预测中,因储层及围岩的厚度和岩性在横向上的变化,其地震响应特征也变化加大,使得BP神经网络对复杂样本集的训练难以收敛且BP网络隐层个数及隐层节点数难以确定。所以,目前的有监督模式识别方法对储层油气预测效果并不理想,精度低。目前有用堆近邻法代替点近邻法克服k-近邻稳定性不好的缺点,堆近邻就是把学习样本分成若干个小堆的,用一堆的均值中心代表这一堆。首先需要把学习样本分堆,生成得到堆分类器,可以用聚类方法。直接用学习样本数据进行聚类的方法是k均值算法和模糊C均值算法,这两种算法都是建立在最小平方准则基础上的。最小平方准则对噪声比较敏感,会使结果不稳定。为了改进k均值算法和模糊C均值算法,程乾生在1998年9月刊的《系统工程理论与实践》提出了属性聚类方法。属性聚类方法是一种新的聚类方法,由于它引进了稳态函数,因此它比常规的k均值算法和模糊C均值算法更加稳定,抗干扰能力更强。其次是需要把多个堆分类器合成为一个更好的分类器。多个分类器合成有多种方法,但是近年来基于统计学习的Adaboost算法引人注目,效果良好,成为应用较多的一种有监督模式识别方法。Adaboost算法主要针对分类器在学习阶段的调节,可以将任何弱分类器经过组合成一个可达到很高精度的强分类器。此算法计算简单,运算速度快,同时也可与其他方法结合以实现快速分类算法。目前对AdaBoost研究及应用的专利有很多,专利201010280835公开了一种改进的AdaBoost分类器构造方法,专利201110200287公开了一种基于AdaBoost算法的人脸检测方法。属性聚类抗干扰能力强,但它属于无监督方法,不能利用已知信息(已知油气分布情况)进行分类。AdaBoost算法能将任何弱分类器经过组合成一个可达到很高精度的强分类器,但是其抗干扰能力不强。本专利技术吸取属性聚类和AdaBoost的优势,把这两种方法结合起来,形成一种提高储层油气预测精度的方法。
技术实现思路
本专利技术目地在于提供一种提高精度的储层油气预测的方法。本专利技术通过以下具体步骤实现:1)在目的层段提取的对储层油气敏感的地震属性,根据已知钻井信息确定训练样本数据、测试样本数据和待分类样本数据;步骤1)中的训练样本数据是根据已知钻井信息确定的,是已知目标层段含油气情况的地震属性数据。步骤1)中的测试样本数据是根据已知钻井信息确定的,是已知目标层段含油气情况的地震属性数据,用来验证本专利技术对油气预测的正确性。步骤1)中的待分类样本数据是没有钻井地方,不知道分类情况的地震属性数据,用于本专利技术进行油气预测的数据。2)计算训练样本数据的平均值,对训练样本数据、测试样本数据和待分类样本数据进行标准化;标准化过程如下所述:步骤2)所述的计算训练样本数据的平均值是:avgj=1train_numΣi=1train_numtrainijj=1,···dim]]>其中train_num为训练样本数据的总个数,trainij表示训练样本数据,dim为训练样本数据的维数,即地震属性个数。步骤2)中的训练样本数据标准化是:其中为标准化后的测试样本数据,trainij为训练样本数据;步骤2)中的测试样本数据标准化是:其中为标准化后的测试样本数据,testij为测试样本数据;步骤2)中的待分类样本数据标准化是:其中为标准化的待分类样本数据,sampleij为待分类样本数据;3)利用属性均值聚类结合AdaBoost方法对标准化后的训练样本数据进行训练,构建分类器;步骤3)所述的构建分类器过程是:(1)对权值weight排序,得到当前弱分类器需要迭代样本;所述的弱分类器最大个数为K,初始所有标准化后训练样本数据的权值weight为1;所述的弱分类器最大个数K为10-15。(2)定义聚类堆数P=I+knumber-1,使用k-均值算法计算堆数P的初始聚类中心m;其中:P为聚类堆数,I为已知训练样本数据的实际分类数,knumber为当前的弱分类器个数;所述的实际分类数I是根据实际储层情况确定:若储层含油、气、水,则实际分类数为3,类别1代表油,类别2代表气,类别3代表水。(3)使用属性均值聚类求取各个聚堆类中心m;首先初始化以下变量:迭代次数time=0,初始化计算初始目标函数P(μ,m):P(μ,m)=Σp=1PΣn=1Nρ(||μnp(xn-mp)||)]]>其中:xn为已知标准化后的训练样本数据;n为某个标准化后训练样本,N为训练样本总数,P为聚类堆数,p为某个类中心,μnp为第n个样本属于第p类的属性测度;mp为第p类的类中心;Σ为求和公式;|| ||表示2-范数;ρ为指数型稳态函数;用属性均值聚类求取各个堆类中心m的迭代过程如下:①迭代次数time增加一次②类中心的迭代mp(i+1)=Σn=1Nω(||μnp(i)(xn-mp(i)||)(μnp(i))2xnΣn=1Nω(||μnp(i)(xn-mp(i)||)(μnp(i))2]]>其中i为前一次的迭代次数,为time-1;i+1为当前的迭代次数,为本文档来自技高网
...
一种储层油气预测的方法

【技术保护点】
一种储层油气预测的方法,特点是通过以下具体步骤实现: 1)在目的层段提取对储层油气敏感的地震属性,根据已知钻井信息确定训练样本数据、测试样本数据和待分类样本数据; 2)计算训练样本数据的平均值,对训练样本数据、测试样本数据和待分类样本数据进行标准化; 3)利用属性均值聚类结合AdaBoost方法对标准化后的训练样本数据进行训练,构建分类器; 4)利用步骤3)构建的分类器对标准化后的测试样本数据进行分类,计算标准化后的测试样本数据的分类正确性; 若标准换后的测试样本的分类正确性大于90%,则认为由步骤3)得到的分类器是合适的,否则调整最大弱分类器个数,重新进行步骤3); 5)通过步骤3)分类器的构建,得到在不同弱分类器个数下的各个堆类中心m,各个堆类所属的类别及组合分类器系数α;利用步骤3)构建的分类器对标准化后的每个标准化后的待分类样本数据进行分类; 分类步骤如下: (1)在不同弱分类器个数下,求取标准化后的待分类样本x与各个堆类中心m的欧式距离,寻找两者距离最近的堆类; (2)对所属的类别相同的最近的堆类,弱分类器的组合分类器系数相加; (3)比较各个类别下的组合分类数系数大小,标准化后的待分类样本属于组合分类系数最大所对应的类别; 6)根据标准化后待分类样本所属类别预测储层的油气分布。...

【技术特征摘要】
1.一种储层油气预测的方法,特点是通过以下具体步骤实现: 
1)在目的层段提取对储层油气敏感的地震属性,根据已知钻井信息确定训练样本数据、测试样本数据和待分类样本数据; 
2)计算训练样本数据的平均值,对训练样本数据、测试样本数据和待分类样本数据进行标准化; 
3)利用属性均值聚类结合AdaBoost方法对标准化后的训练样本数据进行训练,构建分类器; 
4)利用步骤3)构建的分类器对标准化后的测试样本数据进行分类,计算标准化后的测试样本数据的分类正确性; 
若标准换后的测试样本的分类正确性大于90%,则认为由步骤3)得到的分类器是合适的,否则调整最大弱分类器个数,重新进行步骤3); 
5)通过步骤3)分类器的构建,得到在不同弱分类器个数下的各个堆类中心m,各个堆类所属的类别及组合分类器系数α;利用步骤3)构建的分类器对标准化后的每个标准化后的待分类样本数据进行分类; 
分类步骤如下: 
(1)在不同弱分类器个数下,求取标准化后的待分类样本x与各个堆类中心m的欧式距离,寻找两者距离最近的堆类; 
(2)对所属的类别相同的最近的堆类,弱分类器的组合分类器系数相加; 
(3)比较各个类别下的组合分类数系数大小,标准化后的待分类样本属于组合分类系数最大所对应的类别; 
6)根据标准化后待分类样本所属类别预测储层的油气分布。 
2.根据权利要求1的方法,特点是步骤1)中的训练样本数据是根据已知钻井信息确定的,是已知目标层段含油气情况的地震属性数据。 
3.根据权利要求1的方法,特点是步骤1)中的测试样本数据是根据已 知钻井信息确定的,是已知目标层段含油气情况的地震属性数据,用来验证本发明对油气预测的正确性。 
4.根据权利要求1的方法,特点是步骤1)中的待分类样本数据是没有钻井地方,不知道分类情况的地震属性数据,用于本发明进行油气预测的数据。 
5.根据权利要求1的方法,特点是步骤2)所述的计算训练样本数据的平均值是: 
其中train_num为训练样本数据的总个数,trainij表示训练样本数据,dim为训练样本数据的维数,即地震属性个数。 
6.根据权利要求1的方法,特点是步骤2)中的训练样本数据标准化是: 其中为标准化后的测试样本数据,trainij为训练样本数据。 
7.根据权利要求1的方法,特点是步骤2)中的测试样本数据标准化是: 其中为标准化后的测试样本数据,testij为测试样本数据。 
8.根据权利要求1的方法,特点是步骤2)中的待分类样本数据标准化是:其中为标准化的待分类样本数据,sampleij为待分类样本数据。 
9.根据权利要求1的方法,特点是步骤3)所述的构建分类器过程是: 
(1)对权值weight排序,得到当前弱分类器需要迭代样本; 
(2)定义聚类堆数P=I+knumber-1,使用k-均值算法计算堆数P的初始聚类中心m; 
其中:P为聚类堆数,I为已知训练样本数据的实际分类数,knumber为当前的弱分类器个数;所述的实际分类数I是根据实际储层情况确定:若储层 含油、气、水,则实例分类数为3,类别1代表油,类别2代表气,类别3代表水。 
(3)使用属性均值聚类求取各个聚堆类中心m; ...

【专利技术属性】
技术研发人员:熊伟詹仕凡万忠宏陈茂山李磊幸华刚赵佳瑜
申请(专利权)人:中国石油天然气集团公司中国石油集团东方地球物理勘探有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1