一种基于误分类代价的钻井早期溢流智能监测方法技术

技术编号:33617390 阅读:63 留言:0更新日期:2022-06-02 00:35
本发明专利技术公开了一种基于误分类代价的钻井早期溢流智能监测方法,该方法选择立管压力差、总池体积差、进出口流量差、进出口钻井液密度差、进出口钻井液温度差、进出口钻井液电导率、钻时这7个参数作为溢流预警的特征参数,以误分类代价最低为模型的优化目标,构建基于代价敏感的早期溢流监测模型;该模型由依次进行的特征转换模块、代价敏感数据集构建模块、集成学习模块这三个模块构成;特征转换模块用于将输入数据集进行归一化处理及转换原始的特征空间;代价敏感数据集构建模块用于构建包含代价信息的训练数据集;集成学习模块用于集成多个弱分类器以得到强分类器。该方法克服了传统的机器学习算法存在的精度低、泛化能力差问题。题。题。

【技术实现步骤摘要】
一种基于误分类代价的钻井早期溢流智能监测方法


[0001]本专利技术涉及油气开采
,尤其是一种基于误分类代价的钻井早期溢流智能监测方法。

技术介绍

[0002]作为井控安全的第一道屏障,早期溢流监测技术应用与发展对预防井喷具有重要理论及实践意义。随着机器学习技术的高速发展,根据溢流发生时井口各参数响应时间,优选特征参数结合智能算法实现快速发现溢流,是早期溢流监测技术发展的趋势。目前众多学者通过选取不同的特征参数搭配各类机器学习算法,训练出多种智能模型应用于早期溢流监测中。
[0003]可将早期溢流监测视为一个二元分类的问题,我们将发生溢流的样本称为正类样本,未发生溢流的样本称为负类样本。在现实中,我们用于训练模型的数据集中,负类样本数量远大于正类样本,这是显而易见的。因此,早期溢流监测属于典型的不平衡小样本数据集二元分类问题。传统的机器学习是在特定的、拥有大量数据的数据集中,假定各类样本数目是均衡的,以误分率最小或预测准确率最高作为优化目标,学习出一个分类模型,使得模型对于测试数据集上的数据的分类准确率最高。因此,传统的机器学习算法应用于早期溢流监测领域中存在以下问题:1)需要大量的数据才能够保障传统的机器学习算法获得一个高性能的模型,而在现实中难以提供足够的正类样本数据,尤其是在区块的早期开发中;2)不平衡样本会导致训练模型侧重样本数目较多的类别,而“轻视”样本数目较少类别,模型在测试数据上的泛化能力受到极大的限制。针对不平衡的小样本数据集分类问题,已有很多学者提出了不同的解决方案。现有的方法可以分为采样方法、集成学习方法及代价敏感学习方法。采样方法包括欠采样(Liu,Wu,and Zhou 2009;Zheng et al.2021;)和过采样(Chawla et al.2002;Barua et al.2014;Li and Xiong 2020)。欠采样方法通过删除负类样本实现正负类样本的平衡,但可能会将一些重要的样本从多数类中删除。过采样方法多次复制少数样本,容易造成模型过拟合;集成学习方法(Seiffert et al.2010;Alam et al.2018;Fang et al.2019;Niu andZhang 2020)通常采用多数投票,但可能会因为“不稳定样本”的存在而导致结果有偏差。

技术实现思路

[0004]本专利技术的目的是针对传统的机器学习算法在早期溢流监测领域中难以克服数据量不足带来的分类精度低、泛化能力差的问题,提供一种基于误分类代价的钻井早期溢流智能监测方法。
[0005]本专利技术提供的基于误分类代价的钻井早期溢流智能监测方法,选择选择立管压力差、总池体积差、进出口流量差、进出口钻井液密度差、进出口钻井液温度差、进出口钻井液电导率、钻时这7个参数作为溢流预警的特征参数,以误分类代价最低为模型的优化目标,将代价敏感引入到早期溢流监测中,构建基于代价敏感的早期溢流监测模型,用于监测早
期溢流。该模型由依次进行的特征转换模块、代价敏感数据集构建模块、集成学习模块这三个模块构成。其中,所述特征转换模块,用于将输入数据集进行归一化处理及转换原始的特征空间;所述代价敏感数据集构建模块,用于构建包含代价信息的训练数据集;所述集成学习模块,用于集成多个弱分类器以得到强分类器。
[0006]本专利技术的钻井早期溢流智能监测方法,步骤如下:
[0007]S1、选择立管压力差、总池体积差、进出口流量差、进出口钻井液密度差、进出口钻井液温度差、进出口钻井液电导率、钻时这7个参数作为溢流预警的特征参数。
[0008]S2、建立基于代价敏感的早期溢流监测模型,其中,
[0009]所述特征转换模块,将各特征参数下一时刻相对于上一时刻的累积变化量作为输入参数输入到特征转换模块进行预处理,获得归一化及特征降维处理后的数据集。
[0010]所述代价敏感数据集构建模块,将预处理后的数据集送入代价敏感数据集构建模块中,正类样本得到扩增,扩增后的正类样本与负类样本构成代价敏感的训练集。
[0011]所述集成学习模块,用于集成多个弱分类器以得到强分类器。
[0012]S3、以某区块真实的钻井数据对基于代价敏感的早期溢流监测模型进行训练及测试。该步骤中使用误分类总代价、准确率、召回率、精确率、F

measure及AUC这六个指标评估基于代价敏感的早期溢流监测模型性能。
[0013]上述方法中,所述特征转换模块,对原始数据进行线性变换,转换函数如下:
[0014][0015]式中,max和min分别为原始数据的最大值和最小值,一个原始值x通过min

max标准化映射成区间[0,1]中的值x


[0016]采用KPCA算法转换特征,通过非线性映射Φ,将低维输入空间每一个X=(x1,x2,

,x
p
)(x
i
∈R
n
,i=1,2,

,p)中不可分的数据映射到高维特征空间Y,即:
[0017][0018]式中,R
n
—原始低维空间,Y—映射后的高维空间;Φ是一个非线性映射,Φ将X中所有样本都映射到特征空间Y中,得到一个新矩阵Φ(X)。
[0019]在高维特征空间中进行数据处理,使输入空间中不可分的数据在高维特征空间中变得可分,再在这个更高的维度空间中利用特征的协方差矩阵判断变量间的方差一致性,寻找出变量之间的最佳的线性组合,来代替特征,从而达到降维的目的。
[0020]KPCA算法中,采用的多项式核函数如下:
[0021]k(x,y)=(ax
t
y+c)
d
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0022]式中,d—多项式函数的最高此项次数,a—用来设置核函数中的gamma参数设置,c—系数。
[0023]所述代价敏感数据集构建模块包括以下操作:
[0024](1)代价敏感采用代价矩阵表示分类器错分时需要付出的代价,c0为正类样本,c1为负类样本,C(i,j)表示将i错分为j要付出的代价;
[0025](2)通过代价矩阵获取代价信息后,根据代价嵌入过程的不同,将代价敏感学习分为三类方法:数据前处理方法、直接的代价敏感学习方法与结果后处理方法;
[0026](3)通过扩增数据集中正类样本的数量,改变数据集不平衡比,将代价信息嵌入到数据集中。扩增正类样本数量采用GAN模型,具体方法如下:
[0027]GAN模型由生成器G与判别器D构成;GAN模型的目标函数定义为:
[0028][0029]式中,E—数学期望;logD(x)—判别器D的损失;z—随机输入;G(z)—新生成的样本;P
data(x)
—真实样本的分布;P
z(z)
—生成样本的分布。
[0030]在每一轮的训练中,G随机从噪声分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于误分类代价的钻井早期溢流智能监测方法,其特征在于,该方法选择选择立管压力差、总池体积差、进出口流量差、进出口钻井液密度差、进出口钻井液温度差、进出口钻井液电导率、钻时这7个参数作为溢流预警的特征参数,以误分类代价最低为模型的优化目标,将代价敏感引入到早期溢流监测中,构建基于代价敏感的早期溢流监测模型,用于监测早期溢流;该模型由依次进行的特征转换模块、代价敏感数据集构建模块、集成学习模块这三个模块构成;其中,所述特征转换模块,用于将输入数据集进行归一化处理及转换原始的特征空间;所述代价敏感数据集构建模块,用于构建包含代价信息的训练数据集;所述集成学习模块,用于集成多个弱分类器以得到强分类器。2.如权利要求1所述的基于误分类代价的钻井早期溢流智能监测方法,其特征在于,步骤如下:S1、选择立管压力差、总池体积差、进出口流量差、进出口钻井液密度差、进出口钻井液温度差、进出口钻井液电导率、钻时这7个参数作为溢流预警的特征参数;S2、建立基于代价敏感的早期溢流监测模型,其中,所述特征转换模块,将各特征参数下一时刻相对于上一时刻的累积变化量作为输入参数输入到特征转换模块进行预处理,获得归一化及特征降维处理后的数据集;所述代价敏感数据集构建模块,将预处理后的数据集送入代价敏感数据集构建模块中,正类样本得到扩增,扩增后的正类样本与负类样本构成代价敏感的训练集;所述集成学习模块,用于集成多个弱分类器以得到强分类器;S3、以某区块真实的钻井数据对基于代价敏感的早期溢流监测模型进行训练及测试。3.如权利要求2所述的基于误分类代价的钻井早期溢流智能监测方法,其特征在于,所述特征转换模块中,对原始数据进行线性变换,转换函数如下:采用KPCA算法转换特征,通过非线性映射Φ,将低维输入空间每一个X=(x1,x2,

,x
p
)(x
i
∈R
n
,i=1,2,

,p)中不可分的数据映射到高维特征空间Y,即:在高维特征空间中进行数据处理,使输入空间中不可分的数据在高维特征空间中变得可分,再在这个更高的维度空间中利用特征的协方差矩阵判断变量间的方差一致性,寻找出变量之间的最佳的线性组合,来代替特征,从而达到降维的目的。4.如权利要求3所述的基于误分类代价的钻井早期溢流智能监测方法,其特征在于,KPCA算法中,采用的多项式核函数如下:k(x,y)=(ax
t
y+c)
d
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)5.如权利要求2所述的基于误分类代价的钻井早期溢流智能监测方法,其特征在于,所述代价敏感数据集构建模块包括以下操作:(1)代价敏感采用代价矩阵表示分类器错分时需要付出的...

【专利技术属性】
技术研发人员:李庆峰彭炽付建红张小敏苏昱
申请(专利权)人:西南石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1