一种基于随机森林的溢流漏失实时识别方法技术

技术编号:18658742 阅读:16 留言:0更新日期:2018-08-11 14:44
本发明专利技术提供了一种基于随机森林的溢流漏失实时识别方法,包括以下步骤:①溢流、漏失原始数据集的自动生成;②溢流、漏失数据集的预处理,使之成为可用于随机森林算法的训练数据集;③基于Bootstrap抽样技术的溢流、漏失子数据集的生成;④采用CART算法,为每个子数据集创建分类树;⑤对于新样本,集合n棵树的预测结果,采用投票方式决定其类别,并利用各分类树投票结果,识别溢流、漏失的发生。本发明专利技术的方法根据钻井实时数据,自动判断钻井状态,计算预期井口流量并与测量的井口流量进行比较,因此可对不同钻井状态下发生的溢流、漏失进行实时判断;基于随机森林的溢流、漏失实时判断方法,建模方法更加简单,对事故的预测更为准确。

A real-time identification method for overflow leakage based on random forest

The invention provides a real-time identification method for overflow and leakage based on random forest, which comprises the following steps: (1) automatic generation of the original data set of overflow and leakage; (2) preprocessing of the data set of overflow and leakage, which makes it a training data set for random forest algorithm; (3) overflow and leakage based on Bootstrap sampling technology. The generation of missing sub-data sets; 4) Using CART algorithm to create classification trees for each sub-data set; _For new samples, set the prediction results of n trees, use voting method to determine their categories, and use the voting results of each classification tree to identify the occurrence of overflow and omission. The method of the invention automatically judges the drilling state according to the real-time drilling data, calculates the expected wellhead flow and compares it with the measured wellhead flow, so the overflow and leakage under different drilling conditions can be judged in real-time; the method of real-time judgment of overflow and leakage based on random forest makes the modeling method simpler. The prediction of accidents is more accurate.

【技术实现步骤摘要】
一种基于随机森林的溢流漏失实时识别方法
本专利技术涉及钻井工程
,特别是涉及钻井过程中溢流和漏失事故的实时识别方法。
技术介绍
钻井是勘探开发石油天然气的重要手段,在钻井施工作业中,钻井复杂情况和事故自始至终威胁着钻井的整个过程,严重影响着钻井速度、建井质量和勘探开发效益。其中,井漏和溢流是影响钻井施工安全最为常见的两种井下复杂事故。井漏和溢流不仅会带来严重的储层损害,增加勘探开发投入成本,造成油气开发效率低下,而且一旦控制不力,还会诱发卡钻、井塌、井喷等重大恶性事故,造成损失及负面社会影响。因此,钻井过程中溢流、漏失的实时识别判断具有重要意义。目前,国内外在溢流、漏失监测方面展开了较多研究,取得了丰硕的成果,形成的技术有:井口监测技术、井下随钻监测技术、人工智能监测技术。井口监测技术成熟,能比较准确地监测出溢流,但这种方法只适应井控要求较低的环境,而且监测结果存在滞后性,不能很好地解决高压气井、深水钻井等特殊环境下的井下溢流、漏失监测问题。井下随钻监测方法的出现解决了这一问题,近钻头随钻测量技术能够快速、早期监测到溢流和漏失,目前井下随钻监测以PWD监测或LWD监测的方法为主;但井下随钻监测技术成本较高,并且随钻测量仪器存在失效的风险。近些年,随着信息技术和人工智能理论的飞速发展,国内外钻井研究人员在利用现有的溢流监测设备的基础上,引入人工智能技术对测量数据进行综合分析和判断,从而使溢流监测结果更加准确。Hargreaves(2001年)采用贝叶斯概率对深海钻井溢流进行了监测,其通过分析声波数据采用贝叶斯模型对溢流发生的概率进行计算,得出可能发生溢流的概率。Nybo(2008年)采用邻井钻井施工数据,通过构建BP神经网络预测模型,预测出一条当前钻井的基于时间序列上的出口流量曲线,通过和正钻井的实际出口流量数据进行对比,对溢流情况进行实时预警。此方法采用静态神经网络进行计算,并没有对数据进行实时动态计算。Kamyab(2010年)提出一种动态神经网络溢流预警方法,该方法采用聚焦时间延迟动态神经网络进行溢流早期的实时监测,通过对动态钻井参数的神经网络实时计算来监测溢流。这些人工智能的方法建模较为复杂,推广较难。如申请号为CN201310398400.8的专利技术公开了一种油气井钻井过程中溢流在线综合监测与预警方法,选择现场可获取的溢流特征参数,当判断系统中有训练好的贝叶斯模型可用时,将溢流特征参数输入训练好的贝叶斯模型进行溢流判别;若没有,则用基于事先确定好判别规则的专家系统进行溢流判别;以概率的形式给出最终的溢流判别结果并显示;若判断有溢流发生,则将相应的特征向量写入溢流特征数据库,对贝叶斯模型进行训练,更新贝叶斯模型。上述专利技术采用贝叶斯模型经过多次训练才能获取溢流概率数据,溢流监测与识别存在的实时性及可靠性较差的问题。申请号为CN201610817774.2的专利技术提供了一种基于多信息融合的钻井漏失层位识别方法,属于钻井勘探领域,能够根据漏失发生必备条件能够准确确定漏失发生层位及计算漏层性质参数。本专利技术的基于多信息融合的钻井漏失层位识别方法,具体步骤包括:(一)根据钻井液总结和录井综合记录资料,锁定漏失发生的深度范围及在其深度范围内地层所发育的岩性;(二)利用测井、地质资料对上述步骤中锁定的漏失发生的深度范围内岩性、物性参数进行解释及计算;(三)利用测井及工程资料计算钻井液当量循环密度、地层孔隙压力当量密度及地层破裂压力当量密度;(四)根据上述步骤(一)-(三)获得的数据整理绘制得综合成果图,通过综合成果图进行漏失层位识别,分析漏失机理。该申请采用传统的资料解释和计算方法,并以综合成果图的形式呈现计算结果,监测结果存在滞后性,不能很好地解决高压气井、深水钻井等特殊环境下的井下溢流、漏失监测问题。随机森林是由Breiman提出的一种基于CART决策树的组合分类器,具有预测精度高、泛化误差可控、收敛速度快、调节参数少等优点,可有效避免“过拟合”现象,尤其适用于高维数据的运算。该机器学习算法已在国外的生物、医学、经济、管理等众多领域得到了广泛应用,其优越的性能也使其可应用到钻井领域中。
技术实现思路
针对现有溢流、漏失监测识别方法存在的问题,本专利技术提供了一种基于随机森林的机器学习算法,对钻井历史数据进行学习,并利用机器学习所生成的一系列决策树,通过投票方式对新样本数据进行溢流、漏失实时识别的方法。本专利技术解决前述技术问题所采用的技术方案是,一种基于随机森林的溢流漏失实时识别方法,包括以下步骤:①溢流、漏失原始数据集的自动生成;②溢流、漏失数据集的预处理,使之成为可用于随机森林算法的训练数据集;③基于Bootstrap抽样技术的溢流、漏失子数据集的生成;④采用CART(ClassificationandRegressionTree)算法,为每个子数据集创建分类树;⑤对于新样本,集合n棵树的预测结果,采用投票方式决定其类别,并利用各分类树投票结果,识别溢流、漏失的发生。优选的是,步骤①进一步包括,提取以文本方式存储的钻井井史数据中溢流和漏失事故的信息,根据事故发生时间和类别,将其转化成以时间为索引的钻井实时数据格式,并综合录井数据和控压数据,生成溢流、漏失原始数据集。上述任一方案优选的是,生成的溢流、漏失原始数据集是以时间为索引的多维数据,原始数据集的分类结果为离散值:0代表无事故发生,1代表有溢流发生,2代表有漏失发生,3代表溢流、漏失同时发生。上述任一方案优选的是,溢流、漏失原始数据集属性包括,入口流量、出口流量、PWD环空压力、环空温度、大钩载荷、井深、钻头深度、总池体积,立管压力,钻速,钻井液出口密度,钻井液出口温度。上述任一方案优选的是,原始的每口井的钻井实时数据是以时间先后为顺序排列的数据集,很难直接用于溢流漏失的实时识别,因此需要对原始的实时数据集进行预处理。步骤②数据的预处理进一步包括,a钻井状态的计算:根据井深(HDEP)、钻头深度(BDEP)、大钩载荷(HKLD)数据,计算每个时间点对应的钻井状态;b预期出口流量的计算:对于每一口井,根据钻井状态、钻头深度的变化、入口流量以及下入或起出钻杆直径和壁厚信息,计算期望的出口流量;c计算各维度的钻井实时数据在ΔT时间内的均值;d计算各维度钻井实时数据的变化量。上述任一方案优选的是,步骤a所述钻井状态包括:钻进、起钻、下钻、接单根和其他。上述任一方案优选的是,步骤a中,钻井状态计算方法为,在时间Ti,若HDEP(Ti)=BDEP(Ti),HDEP(Ti)>HDEP(Ti-1),HKLD(Ti)>0,则钻井状态DS(Ti)为钻进;在时间Ti,若HDEP(Ti)>BDEP(Ti),HKLD(Ti)>0,BDEP(Ti)>BDEP(Ti-1),则钻井状态DS(Ti)为下钻;在时间Ti,若HDEP(Ti)>BDEP(Ti),HKLD(Ti)>0,BDEP(Ti)<BDEP(Ti-1),则钻井状态DS(Ti)为起钻;在时间Ti,若BDEP(Ti)=BDEP(Ti-1),HKLD(Ti)=0则钻井状态DS(Ti)为接单根;在时间Ti,若BDEP(本文档来自技高网
...

【技术保护点】
1.一种基于随机森林的溢流漏失实时识别方法,包括以下步骤:①溢流、漏失原始数据集的自动生成;②溢流、漏失数据集的预处理,使之成为可用于随机森林算法的训练数据集;③基于Bootstrap抽样技术的溢流、漏失子数据集的生成;④采用CART算法,为每个子数据集创建分类树;⑤对于新样本,集合n棵树的预测结果,采用投票方式决定其类别,并利用各分类树投票结果,识别溢流、漏失的发生。

【技术特征摘要】
1.一种基于随机森林的溢流漏失实时识别方法,包括以下步骤:①溢流、漏失原始数据集的自动生成;②溢流、漏失数据集的预处理,使之成为可用于随机森林算法的训练数据集;③基于Bootstrap抽样技术的溢流、漏失子数据集的生成;④采用CART算法,为每个子数据集创建分类树;⑤对于新样本,集合n棵树的预测结果,采用投票方式决定其类别,并利用各分类树投票结果,识别溢流、漏失的发生。2.根据权利要求1所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤①进一步包括,提取以文本方式存储的钻井井史数据中溢流和漏失事故的信息,根据事故发生时间和类别,将其转化成以时间为索引的钻井实时数据格式,并综合录井数据和控压数据,生成溢流、漏失原始数据集。3.根据权利要求2所述的基于随机森林的溢流漏失实时识别方法,其特征在于:生成的溢流、漏失原始数据集是以时间为索引的多维数据,原始数据集的分类结果为离散值:0代表无事故发生,1代表有溢流发生,2代表有漏失发生,3代表溢流、漏失同时发生。4.根据权利要求3所述的基于随机森林的溢流漏失实时识别方法,其特征在于:溢流、漏失原始数据集属性包括,入口流量、出口流量、PWD环空压力、环空温度、大钩载荷、井深、钻头深度、总池体积,立管压力,钻速,钻井液出口密度,钻井液出口温度,大钩速度。5.根据权利要求1所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤②数据的预处理进一步包括,a钻井状态的计算:根据井深(HDEP)、钻头深度(BDEP)、大钩载荷(HKLD)数据,计算每个时间点对应的钻井状态;b预期出口流量的计算:对于每一口井,根据钻井状态、钻头深度的变化、入口流量以及下入或起出钻杆直径和壁厚信息,计算期望的出口流量;c计算各维度的钻井实时数据在ΔT时间内的均值;d计算各维度钻井实时数据的变化量。6.根据权利要求5所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤a所述钻井状态包括:钻进、起钻、下钻、接单根和其他。7.根据权利要求6所述的基于随机森林的溢流漏失实时识别方法,其特征在于:步骤a中,钻井状态计算方法为,在时间Ti,若HDEP(Ti)=BDEP(Ti),HDEP(Ti)>HDEP(Ti-1),HKLD(Ti)>0,则钻...

【专利技术属性】
技术研发人员:史肖燕周英操蒋宏伟刘伟付加胜
申请(专利权)人:中国石油集团工程技术研究院有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1