一种基于深水油气钻井过程阶段性特征的数据预处理方法技术

技术编号:22330796 阅读:37 留言:0更新日期:2019-10-19 12:24
本发明专利技术涉及一种基于深水油气钻井过程阶段性特征的数据预处理方法,包括以下步骤:1)取得完整原始油气钻井过程数据流后,筛选剔除数据流中的无效数据,得到一次清理数据;2)针对实际油气钻井过程的停钻、工况发生情况,清理一次清理数据中的离群数据和冗余数据,得到二次清理数据;3)对二次清理数据进行特征工程提取:针对基本钻井监测数据和静态数据,对数据进行量化处理和归一化处理,得到基本特征归一化参数;对非基本钻井监测数据进行特征分类,对类内参数采用熵权法确定权重,同时采用滑窗法进行阶段性特征提取,得到五个类别特征归一化参数;4)将基本特征归一化参数和类别特征归一化参数输入到相应的钻速优化模型或工况预测模型中进行拟合,得到最终的预测/优化结果。

A data preprocessing method based on the phased characteristics of deep water oil and gas drilling process

【技术实现步骤摘要】
一种基于深水油气钻井过程阶段性特征的数据预处理方法
本专利技术涉及一种数据挖掘方法,具体是关于一种基于深水油气钻井过程阶段性特征的数据预处理方法,属于海洋油气开发及大数据应用领域。
技术介绍
深水油气钻井过程中由于环境和地质的复杂性,往往会造成较大的风险性和不确定性,在钻速优化和预测方面需要进一步深入钻进过程分析,此时可以考虑借助数据挖掘的手段进行钻进过程的优化。同时,在钻井过程中会伴随着海量的监测数据产生,这为数据分析提供了便利的基础条件。由于钻井数据监测指标众多且相关性较强,因而利于数据分析中的关联分析和模型构建。但是,钻井数据受到监测设备和复杂钻井环境的影响,会产生很大的数据误差和遗漏数据,阶段间的不连贯性也增加了分析的难度。另外,动态数据和静态数据的不协调同步更新也是亟需解决的问题。
技术实现思路
针对上述问题,本专利技术的目的是提供一种基于深水油气钻井过程阶段性特征的数据预处理方法。为实现上述目的,本专利技术采取以下技术方案:一种基于深水油气钻井过程阶段性特征的数据预处理方法,包括以下步骤:步骤一:取得完整原始油气钻井过程数据流后,针对监测设备的运行情况和实际钻井过程的影响因素,根据参数概念和专家经验筛选剔除数据流中的无效数据,得到一次清理数据;步骤二:针对实际油气钻井过程的停钻、工况发生情况,清理一次清理数据中的离群数据和冗余数据,得到二次清理数据;步骤三:对二次清理数据进行特征工程提取;步骤四:将基本特征归一化参数和类别特征归一化参数输入到相应的钻速优化模型或工况预测模型中进行拟合,并应用拟合后的模型得到最终的预测/优化结果。所述的数据预处理方法,优选的,在进行上述步骤三时,具体包括如下步骤:步骤1:将二次清理数据划分为基本钻井监测数据与静态数据以及非基本钻井监测数据两大类;步骤2:对基本钻井监测数据与静态数据进行one-hot量化处理和归一化处理,得到基本特征归一化参数;步骤3:对非基本钻井监测数据进行特征分类,并对分类后的类内参数采用熵权法确定权重,同时采用滑窗法进行阶段性特征提取,得到类别特征归一化参数。所述的数据预处理方法,优选的,在进行上述步骤3时,具体包括如下步骤:步骤①:采用聚类算法对非基本钻井监测数据进行特征分类,并结合各监测指标的实际含义,将非基本钻井监测数据划分为钻压系列指标、转速系列指标、水利参数、牙齿磨损量和压差参数五个聚类类别;步骤②:熵权法确定权重,在五个聚类类别中,对每个类内参数进行归一化处理:其中,Xij表示第i个聚类类别Ci中第j个参数的具体数据;Yij表示Xij归一化后的类内参数;得到归一化的类内参数后,分别计算五个聚类类别中每个参数Xij的信息熵Eij:其中,n表示表示第i个聚类类别Ci中第j个参数的数据个数;pij表示聚类过程中每个参数对该类别的贡献率,范围在[0,1]之间;根据每个参数的信息熵确定类内ki个参数的权重Wij及最终的类别特征归一化参数Ei:步骤③:采用滑窗法进行阶段性特征提取,设定滑动窗口大小winl,根据实际的时间序列数据tv计算出滑动窗口中的当前值cv:所述的数据预处理方法,优选的,在上述步骤①中,使用聚类算法进行特征分类的目标是减小每个监测指标数据x与第i个聚类类别Ci中心μi之间距离的均方误差E:其中,i表示类别序号;k表示类别总数;μi表示第i个类别Ci的聚类中心。本专利技术由于采取以上技术方案,其具有以下优点:本专利技术通过规范化石油钻井数据处理流程,构建了完善的深水石油钻井过程数据处理框架,采用滑动窗的方法,在原始数据的基础上进一步提取了深层次的时序特征,同时考虑了监测参数之间的类别关联关系,并采用熵权法为类别参数的影响因子提供了参考,由此实现了深水石油钻井过程深层次的信息挖掘,进而为深水石油钻井过程的钻速优化、工况预警等需求提供帮助。附图说明图1是本专利技术的流程框图;图2是滑窗法的原理示意图;图3(a)-(c)是不同滑动窗口进行监测参数TVA特征提取的结果示意图。具体实施方式以下将结合附图对本专利技术的较佳实施例进行详细说明,以便更清楚理解本专利技术的目的、特点和优点。应理解的是,附图所示的实施例并不是对本专利技术范围的限制,而只是为了说明本专利技术技术方案的实质精神。如图1所示,本专利技术提供的基于深水油气钻井过程阶段性特征的数据预处理方法,包括以下步骤:步骤一:取得完整原始油气钻井过程数据流后,针对监测设备的运行情况和实际钻井过程的影响因素,根据参数概念和专家经验筛选剔除数据流中的无效数据,得到一次清理数据;步骤二:针对实际油气钻井过程的停钻、工况发生情况,清理一次清理数据中的离群数据和冗余数据,以减少数据建模分析过程中带来的系统误差,得到二次清理数据;步骤三:对二次清理数据进行特征工程提取,具体包括如下步骤:步骤1:将二次清理数据划分为基本钻井监测数据与静态数据以及非基本钻井监测数据两大类;步骤2:对基本钻井监测数据与静态数据(如钻头型号、地质情况等)进行one-hot量化处理和归一化处理,得到基本特征归一化参数;步骤3:对非基本钻井监测数据进行特征分类,并对分类后的类内参数采用熵权法确定权重,同时采用滑窗法进行阶段性特征提取,得到类别特征归一化参数,具体包括如下步骤:步骤①:采用聚类算法对非基本钻井监测数据进行特征分类,并结合各监测指标的实际含义,将非基本钻井监测数据划分为钻压系列指标、转速系列指标、水利参数、牙齿磨损量和压差参数五个聚类类别;在本实施例中,使用聚类算法进行特征分类的目标是减小每个监测指标数据x与第i个聚类类别Ci中心μi之间距离的均方误差E:其中,i表示类别序号;k表示类别总数;μi表示第i个聚类类别Ci的聚类中心。步骤②:熵权法确定权重,在五个聚类类别中,对每个类内参数进行归一化处理:其中,Xij表示第i个聚类类别Ci中第j个参数的具体数据;Yij表示Xij归一化后的类内参数。得到归一化的类内参数后,分别计算五个聚类类别中每个参数Xij的信息熵Eij:其中,n表示表示第i个聚类类别Ci中第j个参数的数据个数;pij表示聚类过程中每个参数对该类别的贡献率,范围在[0,1]之间。根据每个参数的信息熵确定类内ki个参数的权重Wij及最终的类别特征归一化参数Ei:步骤③:采用滑窗法进行阶段性特征提取,设定滑动窗口大小winl,根据实际的时间序列数据tv计算出滑动窗口中的当前值cv:如图2、图3所示,由于油气钻井过程是一个具有明显周期性的时间序列过程,因此根据滑动窗口技术进行周期性时序特征的提取和挖掘,可以减小监测设备误差带来的系统误差。图3(a)-(c)中是将TVA参数根据不同的滑动窗口大小进行特征提取得到的结果,选定的滑动窗大小分别为1、2、20,可以发现在窗口大小为20时已经能够显著的观察出钻进过程的周期性特点。步骤四:将基本特征归一化参数和类别特征归一化参数输入到相应的钻速优化模型或工况预测模型中进行拟合,并应用拟合后的模型得到最终的预测/优化结果。上述各实施例仅用于说明本专利技术,其中各部件的结构、连接方式和制作工艺等都是可以有所变化的,凡是在本专利技术技术方案的基础上进行的等同变换和改进,均不应排除在本专利技术的保护范围之外。本文档来自技高网...

【技术保护点】
1.一种基于深水油气钻井过程阶段性特征的数据预处理方法,其特征在于,包括以下步骤:步骤一:取得完整原始油气钻井过程数据流后,针对监测设备的运行情况和实际钻井过程的影响因素,根据参数概念和专家经验筛选剔除数据流中的无效数据,得到一次清理数据;步骤二:针对实际油气钻井过程的停钻、工况发生情况,清理一次清理数据中的离群数据和冗余数据,得到二次清理数据;步骤三:对二次清理数据进行特征工程提取;步骤四:将基本特征归一化参数和类别特征归一化参数输入到相应的钻速优化模型或工况预测模型中进行拟合,并应用拟合后的模型得到最终的预测/优化结果。

【技术特征摘要】
1.一种基于深水油气钻井过程阶段性特征的数据预处理方法,其特征在于,包括以下步骤:步骤一:取得完整原始油气钻井过程数据流后,针对监测设备的运行情况和实际钻井过程的影响因素,根据参数概念和专家经验筛选剔除数据流中的无效数据,得到一次清理数据;步骤二:针对实际油气钻井过程的停钻、工况发生情况,清理一次清理数据中的离群数据和冗余数据,得到二次清理数据;步骤三:对二次清理数据进行特征工程提取;步骤四:将基本特征归一化参数和类别特征归一化参数输入到相应的钻速优化模型或工况预测模型中进行拟合,并应用拟合后的模型得到最终的预测/优化结果。2.根据权利要求1所述的数据预处理方法,其特征在于,在进行上述步骤三时,具体包括如下步骤:步骤1:将二次清理数据划分为基本钻井监测数据与静态数据以及非基本钻井监测数据两大类;步骤2:对基本钻井监测数据与静态数据进行one-hot量化处理和归一化处理,得到基本特征归一化参数;步骤3:对非基本钻井监测数据进行特征分类,并对分类后的类内参数采用熵权法确定权重,同时采用滑窗法进行阶段性特征提取,得到类别特征归一化参数。3.根据权利要求2所述的数据预处理方法,其特征在于,在进行上述步骤3时...

【专利技术属性】
技术研发人员:殷志明李梦博刘书杰许亮斌罗洪斌袁俊亮王宁李永华朱玥
申请(专利权)人:中国海洋石油集团有限公司中海油研究总院有限责任公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1