一种用于石油专业工程定额编制数据处理方法技术

技术编号:26600765 阅读:20 留言:0更新日期:2020-12-04 21:23
本发明专利技术属于石油专业造价管理技术领域,具体涉及一种用于石油专业工程定额编制数据处理方法,首先利用箱线图法中两边的特征,将石油工程定额编制数据体划分为反映正常技术应用水平的常态数据区和需要剔除的异常数据区,然后利用箱线图法三线的特征,将常态数据区内的数据按照技术应用水平划分为先进、平均、落后数据区,最后对先进、平均、落后数据组标定权重,采用加权平均法计算形成定额成果;本发明专利技术实现了定额编制中异常数据剔除科学化、常态数据精准分区,避免了因定额编制人员经验水平不一,异常数据剔除、数据分区结果不一导致定额成果水平差异较大的问题,且对大数据量处理效率大幅提高。

【技术实现步骤摘要】
一种用于石油专业工程定额编制数据处理方法
本专利技术属于石油专业造价管理
,具体涉及一种用于石油专业工程定额编制数据处理方法。
技术介绍
石油专业工程定额编制过程中,用于定额编制的数据组在编制前需要先进行异常数据处理,剔除影响实际水平的不可用数据。目前所采用的异常数据处理方法均为人工判定法,即根据编制人员工程经验划定异常数据的界限,人工进行剔除。“3、5、2”平均先进法为石油专业工程定额编制采用的主要方法之一,该方法可通过不同队伍的应用反映整体平均先进水平。其中“3”、“5”、“2”分别为先进值、平均值和落后值的权重。目前在实际应用中,先进值、平均值和落后值的划分是依据实施阶段、技术发展等通过经验判定。目前的工作方法在数据处理、数据划分上,均主要依据人为经验,科学性不足,且在大数据量的情况下,处理效率低。
技术实现思路
本专利技术的专利技术目的在于克服现有技术存在的缺点,提出设计一种能够提升数据处理、数据划分效率的用于石油专业工程定额编制数据处理方法,以克服现有技术数据处理中科学性及高效性不足的问题。本专利技术涉及的一种用于石油专业工程定额编制数据处理方法,包括:(1)利用箱线图法中两边的特征,将石油工程定额编制数据体划分为反映正常技术应用水平的常态数据区和需要剔除的异常数据区,在此基础上进行异常数据处理及常态数据的水平划分,实现了常态数据和异常数据的科学、高效划分;(2)利用箱线图法三线的特征,将常态数据区内的数据按照技术应用水平划分为先进、平均、落后数据区,按照平均先进原则,实现了技术水平的精准分区;(3)对先进、平均、落后数据组标定权重,采用加权平均法计算形成定额成果;可根据具体定额特点,准确赋予权重进行定额成果计算,科学体现定额制定的平均先进原则。进一步的,步骤(1)中,所述箱线图法中两边为上边缘和下边缘;两边外数据做为异常数据,两边内数据做为常态数据。进一步的,步骤(2)中,所述箱线图法中三线为上四分位线、中位线和下四分位线;上四分位线到下四分位线为平均值,上四分位线到上边缘与下四分位线到下边缘数值依据定额类型确定为先进值或落后值,如下四分位线到下边缘的样本数据为先进数据,上四分位线到上边缘的样本数据为落后数据,或下四分位线到下边缘的样本数据为落后数据,上四分位线到上边缘的样本数据为先进数据。进一步的,步骤(3)中,所述先进水平赋予权重3,平均水平赋予权重5,落后水平赋予权重2。本专利技术依据“箱线图”法原理,在石油专业工程定额编制中创新了“两边三线”箱线图(两边:上边缘、下边缘;三线:上四分位线、中位线、下四分位线)数据处理工作方法,将“两边”用于判定异常数据,“两边”外数据做为异常数据,“两边”内数据做为常态数据;将“三线”用于常态数据分区,“上四分位线”到“下四分位线”为平均值,“上四分位线”到“上边缘”与“下四分位线”到“下边缘”数值依据定额类型确定为先进值或落后值,有效解决石油专业工程定额编制过程中异常数据处理、常态数据分区人为经验为主的问题,且对大数据量处理效率大幅提高。本专利技术与现有技术相比,具有以下优点:本专利技术实现了定额编制中异常数据剔除科学化、常态数据精准分区,避免了因定额编制人员经验水平不一,异常数据剔除、数据分区结果不一导致定额成果水平差异较大的问题,且对大数据量处理效率大幅提高,适用于定额编制异常数据界定剔除及平均先进法数据分区与标定权重;“两边三线”箱线图的创新应用为石油专业工程定额编制提供了更加科学、有效的工作方法。附图说明图1为本专利技术实施例中钻时定额编制“两边三线”箱线图;图2为本专利技术实施例中异常数据剔除实例图;图3为本专利技术实施例中精准分区、权重标定实例图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。实施例1:本实施例以某油田、某区块、开发井、直井段、某层位、216mm井眼钻时定额成果编制为例:本实施例所述的用于石油专业工程定额编制数据处理方法,包括:(1)首先对根据地层、井眼尺寸、井段等分组条件筛选出的同组钻时(单位h/m)样本数据绘制箱线图,其次依据上述数值特征,形成两边三线,利用箱线图法中两边的特征,将石油工程定额编制数据体划分为反映正常技术应用水平的常态数据区和需要剔除的异常数据区;如图1所示,两边为上边缘和下边缘;上边缘与下边缘外数据为异常数据,可先行剔除;上边缘与下边缘内数据为常态数据,反映不同阶段技术应用水平的钻时数据,可用于定额编制。(2)利用箱线图法三线的特征,将常态数据区内的数据按照技术应用水平划分为先进、平均、落后数据区;如图1所示,三线为上四分位线、中位线和下四分位线;在常态数据中,采用四分位线和上边缘、下边缘对不同技术发展阶段钻时水平进行划分,其中下四分位线到下边缘的样本数据为先进钻时数据,上四分位线到上边缘的样本数据为落后钻时数据,下四分位线到上四分位线的样本数据为平均钻时数据。(3)对先进、平均、落后数据组标定权重,采用加权平均法计算形成定额成果;如图1所示,先进水平赋予权重3,平均水平赋予权重5,落后水平赋予权重2。本实施例应用中,相关概念如下:下四分位线:由下四分位数(Q1)确定,下四分位数(Q1)为样本中所有数值由小到大排列后排序第25%的数值;中位线:由中位数(Q2)确定,中位数(Q2)为样本中所有数值由小到大排列后排序第50%的数值;上四分位线:由上四分位数(Q3)确定,上四分位数(Q3)为样本中所有数值由小到大排列后第75%的数值;四分位间距(IQR):上四分位数与下四分位数的差距;上边缘:取上限值与下限值区间内的最大值;下边缘:取上限值与下限值区间内的最小值;上限值:上四分位数+1.5四分位间距;下限值:下四分位数-1.5四分位间距。A、对该组钻时数据按数值大小重新排序,见表1。表1某区块、开发井、直井段、某层位、216mm井眼钻时数据排序结果源钻时数据(m/h)排序后钻时数据(m/h)排序后编号4.303.7714.933.8826.284.3033.884.9347.615.2355.236.2863.777.61714.7714.778B、以排序后钻时数据计算箱线图特征值,并绘制箱线图,见表2、图2。表2某区块、开发井、直井段、某层位、216mm井眼钻时数据箱线图特征值C、根据“本文档来自技高网...

【技术保护点】
1.一种用于石油专业工程定额编制数据处理方法,其特征在于:包括:/n(1)利用箱线图法中两边的特征,将石油工程定额编制数据体划分为反映正常技术应用水平的常态数据区和需要剔除的异常数据区;/n(2)利用箱线图法三线的特征,将常态数据区内的数据按照技术应用水平划分为先进、平均、落后数据区;/n(3)对先进、平均、落后数据组标定权重,采用加权平均法计算形成定额成果。/n

【技术特征摘要】
1.一种用于石油专业工程定额编制数据处理方法,其特征在于:包括:
(1)利用箱线图法中两边的特征,将石油工程定额编制数据体划分为反映正常技术应用水平的常态数据区和需要剔除的异常数据区;
(2)利用箱线图法三线的特征,将常态数据区内的数据按照技术应用水平划分为先进、平均、落后数据区;
(3)对先进、平均、落后数据组标定权重,采用加权平均法计算形成定额成果。


2.根据权利要求1所述的用于石油专业工程定额编制数据处理方法,其特征在于:步骤(1)中,所述箱线图法中两边为上边缘和下边缘;两边外数据做为异常数据,两边内数据做为常态数据。


3.根据权利要求2所述的用于石油专业工程定额编制数据处理方法,其特征在于:步骤(2)中,所述箱线图法中三线为上四分位线、中位线和下四分位线;上四分位线到下四分位线为平均值,上四分位线到上边缘与下四分位线到下边缘数值依据定额类型确定为先进值或落后值。


4.根据权利要求3所述的用于石油专业工程定额编制数据处理方法,其特征在于:所述下四分位线到下边缘的样本数据为先进数据,上四分位线到上边缘的样本数据为落后...

【专利技术属性】
技术研发人员:雷庆峰段志刚李心凯侯东升翟永明颜超朱玲玲张霄刘彬刘楚琦
申请(专利权)人:森诺科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1