一种基于PCA-XGBOOST算法的井漏预警方法技术

技术编号:35596350 阅读:14 留言:0更新日期:2022-11-16 15:15
本发明专利技术公开了一种基于PCA

【技术实现步骤摘要】
一种基于PCA

XGBOOST算法的井漏预警方法


[0001]本专利技术属于石油钻井井漏预测
,具体涉及一种基于PCA

XGBOOST算法的井漏预警方法。

技术介绍

[0002]石油是一种黏稠的、深褐色液体,被称为“工业的血液”,是一种重要的能源,近年来,石油工程中油气勘探的活动向更深入的地层方向发展,综合录井技术由于能搞表征地下状态信息而被广泛应用在钻井工程中,综合录井技术即包含了钻井工程参数信息又包含了相应的地址信息,能够有效表征不同工况下钻井工程的参数变化趋势,为钻井工程实现钻前预测、钻中预警以及钻后评估提供了解决方案。
[0003]综合录井技术中有井深、大钩负荷、钻压、立管压力和总池体积等特征参数,数据采集的频率为3秒一次,数据量较大,从中直接提取出所需要的信息是比较困难的,因此需要从综合录井时间序列中提取出主要的特征参数。
[0004]井下情况复杂是钻井过程中经常面临的一个问题,井漏是石油钻井工程中最常见的风险之一,一旦发生井漏,将会导致不同程度的钻探事故,从而造成人员伤亡和财产资源损失,甚至会造成井塌,从而引发一系列严重后果。
[0005]目前通常采用综合录井技术对钻井工程的特征参数进行采集,根据采集到的特征参数对井漏风险进行预测,由于综合录井信息采集到的数据未经过相应的处理,存在着数据质量不佳的情况,不能对井漏风险进行准确预警。
[0006]因此,针对上述技术问题,有必要提供一种基于PCA

XGBOOST算法的井漏预警方法。

技术实现思路

[0007]本专利技术的目的在于提供一种基于PCA

XGBOOST算法的井漏预警方法,以解决上述钻井工程中不能对井漏进行准确预警的问题。
[0008]为了实现上述目的,本专利技术一实施例提供的技术方案如下:
[0009]一种基于PCA

XGBOOST算法的井漏预警方法,包括以下步骤:
[0010]S1、建立综合录井时间序列矩阵,根据钻井运行的状态信息,将综合录井时序数据根据不同工况分别标记,正常工况标记为0,井漏事故下的数据标记为1;
[0011]S2、数据预处理,通过拉依达法则剔除综合录井时序数据的离群点,并对剔除后的综合录井时序数据采用Savitzky

Golay滤波对综合录井时序数据进行平滑处理;
[0012]S3、关键特征参数提取,将S2中预处理之后的综合录井时间序列矩阵,采用PCA算法先后计算得到各特征参数的重要性排名,根据设定的重要性阈值提取出关键特征参数,并剔除弱关联参数;
[0013]S4、模型训练,将S4中提取后的关键参数的时间序列矩阵输入XGBoost回归模型中,通过交叉验证选择损失函数即均方根误差最小的超参数;
[0014]S5、事故概率预测,将S4中设置好超参数后再次训练得到最佳的模型,将实时工况数据输入模型中得到井漏发生的概率值;
[0015]S6、输出告警信息,根据XGBoost回归模型预测的井漏发生概率值结果进行分级,当井漏故障发生概率处于某一个限度内时,输出相应的告警信息,从而提前预防井漏事故发生。
[0016]进一步地,所述S2中拉依达法则可具体描述为:假设一个特征参数下有测量值x1,x2,

,x
n
,计算出算数平均值x及剩余误差vi=xi

x(i=1,2,

,n),并计算出标准差σ,若某个测量值x
i
的剩余误差v
i
(1<=i<=n),满足下式:|v
i
|=|x
i

x|>3σ,则认为应当剔除。
[0017]进一步地,所述S2中通过Savitzky

Golay滤波对综合录井时间序列做平滑处理,依次选择参数特征,考虑当前参数特征下以n=0为中心的2M+1个数据,M为设定的窗口大小,用下列公式来拟合:
[0018]进一步地,所述拟合后的参数特征通过求解k

1次方程得到输出值卷积的加权以多项式形式给出,为减少滤波器引入的偏差,其最小二乘拟合的残差为:
[0019]进一步地,所述综合录井时间序列平滑的简化最小二乘卷积的一般方程如下所示:
[0020][0021]式中,Y是综合录井信息某参数特征的原始数据,Y
*
是该原始数据平滑滤波后的目标值。
[0022]进一步地,所述要求ε
N
最小对各个参数求偏导应等于0,则有:
[0023][0024]等式两边整理可得:
[0025][0026]引入辅助矩阵A,令A={a
nk
},a
nk
=n
k


M≤n≤M,0≤i≤N,再设一个辅助矩阵B使得B=A
T
A,则有:
[0027][0028]定义:则可以得到:Ba=A
T
Aa=A
T
x,a=(A
T
A)
‑1A
T
x=Hx,式中H的第一行行向量即为所求卷积系数。
[0029]进一步地,所述S3中PCA算法可具体描述为:基于预处理好后的综合录井时间序列矩阵X,计算得到各个参数特征下n个样本数据的平均值并将每个参数特征下的数值减
去各自的平均值。
[0030]进一步地,所述PCA算法对参数进行相关性分析,采用下列公式计算得到协方差矩阵A:
[0031][0032]对任意矩阵中总存在一个奇异值分解A,利用SVD分解矩阵A,通过下面公式计算得到A的特征值和特征向量:
[0033]A=U∑V
T
[0034]式中,U阵和V阵分别是AA
T
和A
T
A单位化的特征向量构成的矩阵;对角矩阵∑由AA
T
或A
T
A的特征值求平方根得到,对角线元素成为奇异值,除了对角线其余元素为0。
[0035]进一步地,所述特征值按从大到小排序,根据预先设定的K值,将前面K个对应的特征向量分别做行向量组成特征向量矩阵P,将数据转换到K个特征向量构建的新空间中,即Y=PX,综合得分及排序的计算公式为:F=WP,式中F阵表示每个特征参数因子的权重,W=(w1,w2,

w
k
),权重w
i
的计算公式为:
[0036][0037]通过上述分析可以求出各个参数特征的重要性,从大到小排序后将大于设定阈值的认定为井漏事故下的强关联参数,其余的则为弱关联参数。
[0038]进一步地,所述S6中XGBoost回归算法的本质是将若干CART回归树模型集合成为一个基于CART回归树的模型集合。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于PCA

XGBOOST算法的井漏预警方法,其特征在于,包括以下步骤:S1、建立综合录井时间序列矩阵,根据钻井运行的状态信息,将综合录井时序数据根据不同工况分别标记,正常工况标记为0,井漏事故下的数据标记为1;S2、数据预处理,通过拉依达法则剔除综合录井时序数据的离群点,并对剔除后的综合录井时序数据采用Savitzky

Golay滤波对综合录井时序数据进行平滑处理;S3、关键特征参数提取,将S2中预处理之后的综合录井时间序列矩阵,采用PCA算法先后计算得到各特征参数的重要性排名,根据设定的重要性阈值提取出关键特征参数,并剔除弱关联参数;S4、模型训练,将S4中提取后的关键参数的时间序列矩阵输入XGBoost回归模型中,通过交叉验证选择损失函数即均方根误差最小的超参数;S5、事故概率预测,将S4中设置好超参数后再次训练得到最佳的模型,将实时工况数据输入模型中得到井漏发生的概率值;S6、输出告警信息,根据XGBoost回归模型预测的井漏发生概率值结果进行分级,当井漏故障发生概率处于某一个限度内时,输出相应的告警信息,从而提前预防井漏事故发生。2.根据权利要求1所述的一种基于PCA

XGBOOST算法的井漏预警方法,其特征在于,所述S2中拉依达法则可具体描述为:假设一个特征参数下有测量值x1,x2,

,x
n
,计算出算数平均值x及剩余误差vi=xi

x(i=1,2,

,n),并计算出标准差σ,若某个测量值x
i
的剩余误差v
i
(1<=i<=n),满足下式:|v
i
|=|x
i

x|>3σ,则认为应当剔除。3.根据权利要求1所述的一种基于PCA

XGBOOST算法的井漏预警方法,其特征在于,所述S2中通过Savitzky

Golay滤波对综合录井时间序列做平滑处理,依次选择参数特征,考虑当前参数特征下以n=0为中心的2M+1个数据,M为设定的窗口大小,用下列公式来拟合:4.根据权利要求3所述的一种基于PCA

XGBOOST算法的井漏预警方法,其特征在于,所述拟合后的参数特征通过求解k

1次方程得到输出值卷积的加权以多项式形式给出,为减少滤波器引入的偏差,其最小二乘拟合的残差为:5.根据权利要求3所述的一种基于PCA

XGBOOST算法的井漏预警方法,其特征在于,所述综合录井时间序列平滑的简化最小二乘卷积的一般方程如下所示:式中,Y是综合录井信息某参数特征的原...

【专利技术属性】
技术研发人员:李坚黄琦李岢任曾胡维昊张真源易建波井实蔡东升赵梓旭
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1