一种基于随机森林的溢流漏失实时识别方法技术

技术编号：18658742 阅读：16 留言：0更新日期：2018-08-11 14:44

本发明专利技术提供了一种基于随机森林的溢流漏失实时识别方法，包括以下步骤：①溢流、漏失原始数据集的自动生成；②溢流、漏失数据集的预处理，使之成为可用于随机森林算法的训练数据集；③基于Bootstrap抽样技术的溢流、漏失子数据集的生成；④采用CART算法，为每个子数据集创建分类树；⑤对于新样本，集合n棵树的预测结果，采用投票方式决定其类别，并利用各分类树投票结果，识别溢流、漏失的发生。本发明专利技术的方法根据钻井实时数据，自动判断钻井状态，计算预期井口流量并与测量的井口流量进行比较，因此可对不同钻井状态下发生的溢流、漏失进行实时判断；基于随机森林的溢流、漏失实时判断方法，建模方法更加简单，对事故的预测更为准确。

A real-time identification method for overflow leakage based on random forest

The invention provides a real-time identification method for overflow and leakage based on random forest, which comprises the following steps: (1) automatic generation of the original data set of overflow and leakage; (2) preprocessing of the data set of overflow and leakage, which makes it a training data set for random forest algorithm; (3) overflow and leakage based on Bootstrap sampling technology. The generation of missing sub-data sets; 4) Using CART algorithm to create classification trees for each sub-data set; _For new samples, set the prediction results of n trees, use voting method to determine their categories, and use the voting results of each classification tree to identify the occurrence of overflow and omission. The method of the invention automatically judges the drilling state according to the real-time drilling data, calculates the expected wellhead flow and compares it with the measured wellhead flow, so the overflow and leakage under different drilling conditions can be judged in real-time; the method of real-time judgment of overflow and leakage based on random forest makes the modeling method simpler. The prediction of accidents is more accurate.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于随机森林的溢流漏失实时识别方法
本专利技术涉及钻井工程
，特别是涉及钻井过程中溢流和漏失事故的实时识别方法。
技术介绍
钻井是勘探开发石油天然气的重要手段，在钻井施工作业中，钻井复杂情况和事故自始至终威胁着钻井的整个过程，严重影响着钻井速度、建井质量和勘探开发效益。其中，井漏和溢流是影响钻井施工安全最为常见的两种井下复杂事故。井漏和溢流不仅会带来严重的储层损害，增加勘探开发投入成本，造成油气开发效率低下，而且一旦控制不力，还会诱发卡钻、井塌、井喷等重大恶性事故，造成损失及负面社会影响。因此，钻井过程中溢流、漏失的实时识别判断具有重要意义。目前，国内外在溢流、漏失监测方面展开了较多研究，取得了丰硕的成果，形成的技术有：井口监测技术、井下随钻监测技术、人工智能监测技术。井口监测技术成熟，能比较准确地监测出溢流，但这种方法只适应井控要求较低的环境，而且监测结果存在滞后性，不能很好地解决高压气井、深水钻井等特殊环境下的井下溢流、漏失监测问题。井下随钻监测方法的出现解决了这一问题，近钻头随钻测量技术能够快速、早期监测到溢流和漏失，目前井下随钻监测以PWD监测或LWD监测的方法为主；但井下随钻监测技术成本较高，并且随钻测量仪器存在失效的风险。近些年，随着信息技术和人工智能理论的飞速发展，国内外钻井研究人员在利用现有的溢流监测设备的基础上，引入人工智能技术对测量数据进行综合分析和判断，从而使溢流监测结果更加准确。Hargreaves(2001年)采用贝叶斯概率对深海钻井溢流进行了监测，其通过分析声波数据采用贝叶斯模型对溢流发生的概率进行计算，得出可能发生溢...

【技术保护点】
1.一种基于随机森林的溢流漏失实时识别方法，包括以下步骤：①溢流、漏失原始数据集的自动生成；②溢流、漏失数据集的预处理，使之成为可用于随机森林算法的训练数据集；③基于Bootstrap抽样技术的溢流、漏失子数据集的生成；④采用CART算法，为每个子数据集创建分类树；⑤对于新样本，集合n棵树的预测结果，采用投票方式决定其类别，并利用各分类树投票结果，识别溢流、漏失的发生。

【技术特征摘要】
1.一种基于随机森林的溢流漏失实时识别方法，包括以下步骤：①溢流、漏失原始数据集的自动生成；②溢流、漏失数据集的预处理，使之成为可用于随机森林算法的训练数据集；③基于Bootstrap抽样技术的溢流、漏失子数据集的生成；④采用CART算法，为每个子数据集创建分类树；⑤对于新样本，集合n棵树的预测结果，采用投票方式决定其类别，并利用各分类树投票结果，识别溢流、漏失的发生。2.根据权利要求1所述的基于随机森林的溢流漏失实时识别方法，其特征在于：步骤①进一步包括，提取以文本方式存储的钻井井史数据中溢流和漏失事故的信息，根据事故发生时间和类别，将其转化成以时间为索引的钻井实时数据格式，并综合录井数据和控压数据，生成溢流、漏失原始数据集。3.根据权利要求2所述的基于随机森林的溢流漏失实时识别方法，其特征在于：生成的溢流、漏失原始数据集是以时间为索引的多维数据，原始数据集的分类结果为离散值：0代表无事故发生，1代表有溢流发生，2代表有漏失发生，3代表溢流、漏失同时发生。4.根据权利要求3所述的基于随机森林的溢流漏失实时识别方法，其特征在于：溢流、漏失原始数据集属性包括，入口流量、出口流量、PWD环空压力、环空温度、大钩载荷、井深、钻头深度、总池体积，立管压力，钻速，钻井液出口密度，钻井液出口温度，大钩速度。5.根据权利要求1所述的基于随机森林的溢流漏失实时识别方法，其特征在于：步骤②数据的预处理进一步包括，a钻井状态的计算：根据井深(HDEP)、钻头深度(BDEP)、大钩载荷(HKLD)数据，计算每个时间点对应的钻井状态；b预期出口流量的计算：对于每一口井，根据钻井状态、钻头深度的变化、入口流量以及下入或起出钻杆直径和壁厚信息，计算期望的出口流量；c计算各维度的钻井实时数据在ΔT时间内的均值；d计算各维度钻井实时数据的变化量。6.根据权利要求5所述的基于随机森林的溢流漏失实时识别方法，其特征在于：步骤a所述钻井状态包括：钻进、起钻、下钻、接单根和其他。7.根据权利要求6所述的基于随机森林的溢流漏失实时识别方法，其特征在于：步骤a中，钻井状态计算方法为，在时间Ti，若HDEP(Ti)＝BDEP(Ti)，HDEP(Ti)>HDEP(Ti-1),HKLD(Ti)>0，则钻...

【专利技术属性】
技术研发人员：史肖燕，周英操，蒋宏伟，刘伟，付加胜，
申请(专利权)人：中国石油集团工程技术研究院有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人