一种基于k-means的油井参数分析组合算法制造技术

技术编号:19210148 阅读:46 留言:0更新日期:2018-10-20 04:54
本发明专利技术方法涉及一种基于k‑means的油井参数分析组合算法,该方法可以充分分析挖掘多项油井生产参数的潜在信息,为油田工作人员进行生产优化、故障诊断提供科学指导,而不是单纯依靠工人观测经验,减少了人力浪费,同时也避免了新人缺少经验容易判断失误造成一定经济损失或者是安全隐患的问题。本发明专利技术是通过以下技术方案实现:首先对油井产量相关和效率相关的多参数进行降维特征提取,然后设置不同初始点进行多次k‑means聚类循环,通过相似性矩阵判决实现聚类融合,使得聚类更为精准。本发明专利技术对油井多参数进行分析聚类,算法稳定可靠,提升了油井数据分析水平。

【技术实现步骤摘要】
一种基于k-means的油井参数分析组合算法
本方法涉及一种基于k-means的油井数据分析组合算法,可以挖掘分析油井参数的潜在信息,并对油井按照工作状态进行分类和分析,提升油井效率和生产能力。
技术介绍
随着油田信息化程度的加深,油井多项生产参数被实时的精确采集和传输存储,形成了大量数据资源。传统的油田参数分析主要针对两类参数,一类是以载荷为主的力学参数,是油井负荷量、产液量和平衡情况等工作状态的重要监控参数,对力学参数的分析可以辅助实现抽油机平衡校准、补偿和故障分析等;另外一类是电参数,是一组抽油机电机运行过程中电压、电流和电功率等构成的电气参数,对电参数的分析可以。但是,目前国内外对抽油机力学参数与电参数的分析研究都相对比较独立,没有挖掘出多元油井参数之间的关系,而且对采集到的数据只有一部分进行了分析,数据类型较少。研究基于大数据和机器学习的油井数据分析,可以更为精准的从数据分析的角度给出结论,而不是单纯依靠工人观测经验,可以减少一定的人力浪费,同时也避免了新人缺少经验容易判断失误造成一定经济损失或者是安全隐患的问题。但是,目前在油井应用的数据挖掘算法都是单一算法,在精确性、分析速度等方面都有待提高。
技术实现思路
为了更科学、更全面地分析和挖掘油井参数中的有用信息,基于多元生产参数对油井进行聚类,帮助工作人员进行生产优化决策,提出一种基于k-means的油井参数分析组合算法。首先对与油井产量相关的参数和与效率相关的参数油井工作参数进行降维特征提取,通过k-means和相似性矩阵聚类融合可以更为精准的从大数据分析的角度实现油井聚类,分析出高产高效、高产低效和低产低效井,为油田工作人员进行生产优化、故障诊断提供科学指导。本专利技术的目的是通过以下技术方案实现的。本专利技术的基于k-means的油井参数分析组合算法,步骤为:步骤一:将采油厂N口油井的实时原始数据按与产量相关的参数排列成矩阵X1和按与效率相关的参数排列成矩阵X2;所述的原始油井数据包括与产量相关的参数,如:冲程、冲次、实际生产时间、实际产液量、井底流压;和与效率相关的参数,如:泵效、系统效率、油压、套压、油温、含水率、平均有功功率、平均转速、平均功率因数、平均电机的输出轴功率、光杆功率、泵功率、有效功率、电机功率损耗、皮带损耗、减速箱损耗、四连杆功率损耗、抽油杆功率损失、抽油泵损失功率、油管摩阻损失功率、系统效率、地面效率、电机效率、皮带四连杆及减速箱效率、井下效率、抽油杆部分效率、平衡率、电机负载率、抽油机负载率、油管压头损失、泵吸入口压力、有效举升高度、泵效、泵充满系数、冲程损失泵效、气体损失泵效、漏失损失泵效、容积损失泵效和有功日耗电量;所述的矩阵X1,X2,每行代表采油厂中的一口油井的一组实时数据,每列为顺序排列的油井多元参数;步骤二:对矩阵X1,X2每一行进行PCA主成分分析法降维,分别选取降维至k1,k2维后的数据对原信息的贡献率超过90%时的k1,k2个特征值,Yn=[X1第n行降维后的k1个特征值,X2第n行降维后的k2个特征值],n∈{0,1,...,N}是降维提取特征后的数据样本;步骤三:设定相似性矩阵A中每个元素Aij初值为0,i,j初值为1,设定循环序数h初值为0,设定总聚类循环次数H,需满足H<N-3;所述的相似性矩阵A,矩阵的第i行第j列表示的是第i口油井降维提取特征后的数据样本Yi和第j口油井降维提取特征后的数据样本Yj之间的相似度,公式为步骤四:选取第h口油井特征数据Yh,第h+1口油井特征数据Yh+1,第h+2口油井特征数据Yh+2井作为聚类初始点,用k-means算法对降维后的油井数据Yn,n∈{0,1,...,N}聚类成三类;步骤五:判断Yi和Yj是否被分为同一类别时,当Yi和Yj被分为同一类时,Aij的值累加1/H;步骤六:j=j+1,当j<N+1时,循环执行步骤五,否则将j设为1并执行步骤七;步骤七:i=i+1,当i<N+1时,循环执行步骤五,否则执行步骤八;步骤八:h=h+1,当h<H时,循环执行步骤四至步骤七,否则,结束循环并执行步骤九;步骤九:遍历相似性矩阵A,当A中某个元素值Aij处于[0.5,1)时,说明特征数据Yi,数据数据Yj属于同一类别的概率大于0.5时,即大部分的情况下第i口油井和第j口油井经数据聚类分析后是属于同一个类别的,则可以认为实际上这两口油井就是属于一个类别当中的;步骤十:然后再对这些特征数据对两两进行处理,分为三种不同情况,第一种是当两个特征数据都没有被划分到某个类别的时候,将它们划分为同一个类别,同时标记两个特征数据为已标记状态;第二种情况是两个特征数据中有一个被划分到某个类别,而另一个没有类别标签的时候,将没有标签的特征数据标记为与有类别标签的特征数据相同标签,两个特征数据也同样标记为已标记状态;最后一种情况是两个特征数据都已经被标记,但是被分类到不同的类别当中,此时,将两个类别合并为一个类别;最终,得到三类油井的聚类情况,辅助油田工作人员更为科学地对高产高效井、高产低效井和低产低效井进行分别管理,优化。有益效果本专利技术方法充分分析挖掘多项油井生产参数的潜在信息,通过降维特征提取同时考虑了油井产量和效率两方面参数并减少了数据量保证了算法分析的实时性,通过k-means和相似性矩阵聚类融合可以更为精准的从大数据分析的角度实现油井聚类,为油田工作人员进行生产优化、故障诊断提供科学指导,而不是单纯依靠工人观测经验,减少了人力浪费,同时也避免了新人缺少经验容易判断失误造成一定经济损失或者是安全隐患的问题。附图说明图1是本专利技术方法的算法流程图。具体实施方式下面结合附图和实施例对本专利技术做进一步说明。实施例步骤一:将采油厂N口油井的实时原始数据按与产量相关的参数排列成矩阵X1和按与效率相关的参数排列成矩阵X2;所述的原始油井数据包括与产量相关的参数,如:冲程、冲次、实际生产时间、实际产液量、井底流压;和与效率相关的参数,如:泵效、系统效率、油压、套压、油温、含水率、平均有功功率、平均转速、平均功率因数、平均电机的输出轴功率、光杆功率、泵功率、有效功率、电机功率损耗、皮带损耗、减速箱损耗、四连杆功率损耗、抽油杆功率损失、抽油泵损失功率、油管摩阻损失功率、系统效率、地面效率、电机效率、皮带四连杆及减速箱效率、井下效率、抽油杆部分效率、平衡率、电机负载率、抽油机负载率、油管压头损失、泵吸入口压力、有效举升高度、泵效、泵充满系数、冲程损失泵效、气体损失泵效、漏失损失泵效、容积损失泵效和有功日耗电量;参数种类包括但不限于以上所述参数,在构成矩阵X1,X2时尽可能提供更多的数据种类,数据种类的排列顺序需保证对所有油井同一顺序即可;由于油井数据采集频率有所不同,一般选用同一天的一组数据,采集频率高的数据进行均值处理,一天只采集一次的则直接选取该数据,对需要体现油井采油一个周期中不同工作瞬间的参数,可用一个周期内的多个数据排列成矩阵X1,X2;所述的矩阵X1,X2,每行代表采油厂中的一口油井的一组实时数据,每列为油井各项参数;步骤二:对矩阵X1,X2每一行进行PCA主成分分析法降维,分别选取降维至k1,k2维后的数据对原信息的贡献率超过90%时的k1,k2个特征值,Yn=[X1第n行降维后本文档来自技高网...

【技术保护点】
1.一种基于k‑means的油井参数分析组合算法,其特征在于包括以下步骤:步骤一:将采油厂N口油井的实时原始数据按与产量相关的参数排列成矩阵X1和按与效率相关的参数排列成矩阵X2;所述的原始油井数据包括与产量相关的参数,如:冲程、冲次、实际生产时间、实际产液量、井底流压;和与效率相关的参数,如:泵效、系统效率、油压、套压、油温、含水率、平均有功功率、平均转速、平均功率因数、平均电机的输出轴功率、光杆功率、泵功率、有效功率、电机功率损耗、皮带损耗、减速箱损耗、四连杆功率损耗、抽油杆功率损失、抽油泵损失功率、油管摩阻损失功率、系统效率、地面效率、电机效率、皮带四连杆及减速箱效率、井下效率、抽油杆部分效率、平衡率、电机负载率、抽油机负载率、油管压头损失、泵吸入口压力、有效举升高度、泵效、泵充满系数、冲程损失泵效、气体损失泵效、漏失损失泵效、容积损失泵效和有功日耗电量;所述的矩阵X1,X2,每行代表采油厂中的一口油井的一组实时数据,每列为顺序排列的油井多元参数;步骤二:对矩阵X1,X2每一行进行PCA主成分分析法降维,分别选取降维至k1,k2维后的数据对原信息的贡献率超过90%时的k1,k2个特征值,Yn=[X1第n行降维后的k1个特征值,X2第n行降维后的k2个特征值],n∈{0,1,...,N}是降维提取特征后的数据样本;步骤三:设定相似性矩阵A中每个元素Aij初值为0,i,j初值为1,设定循环序数h初值为0,设定总聚类循环次数H,需满足H<N‑3;所述的相似性矩阵A,矩阵的第i行第j列表示的是第i口油井降维提取特征后的数据样本Yi和第j口油井降维提取特征后的数据样本Yj之间的相似度,公式为...

【技术特征摘要】
1.一种基于k-means的油井参数分析组合算法,其特征在于包括以下步骤:步骤一:将采油厂N口油井的实时原始数据按与产量相关的参数排列成矩阵X1和按与效率相关的参数排列成矩阵X2;所述的原始油井数据包括与产量相关的参数,如:冲程、冲次、实际生产时间、实际产液量、井底流压;和与效率相关的参数,如:泵效、系统效率、油压、套压、油温、含水率、平均有功功率、平均转速、平均功率因数、平均电机的输出轴功率、光杆功率、泵功率、有效功率、电机功率损耗、皮带损耗、减速箱损耗、四连杆功率损耗、抽油杆功率损失、抽油泵损失功率、油管摩阻损失功率、系统效率、地面效率、电机效率、皮带四连杆及减速箱效率、井下效率、抽油杆部分效率、平衡率、电机负载率、抽油机负载率、油管压头损失、泵吸入口压力、有效举升高度、泵效、泵充满系数、冲程损失泵效、气体损失泵效、漏失损失泵效、容积损失泵效和有功日耗电量;所述的矩阵X1,X2,每行代表采油厂中的一口油井的一组实时数据,每列为顺序排列的油井多元参数;步骤二:对矩阵X1,X2每一行进行PCA主成分分析法降维,分别选取降维至k1,k2维后的数据对原信息的贡献率超过90%时的k1,k2个特征值,Yn=[X1第n行降维后的k1个特征值,X2第n行降维后的k2个特征值],n∈{0,1,...,N}是降维提取特征后的数据样本;步骤三:设定相似性矩阵A中每个元素Aij初值为0,i,j初值为1,设定循环序数h初值为0,设定总聚类循环次数H,需满足H<N-3;所述的相似性矩阵A,矩阵的第i行第j列表示的是第i口油井降维提取特征后的数据样本Yi和第j口油井降维提取特...

【专利技术属性】
技术研发人员:高巍史玥婷王卫江
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1