当前位置: 首页 > 专利查询>渤海大学专利>正文

一种基于数据的抽油井泵效多模型软测量方法技术

技术编号:20893303 阅读:28 留言:0更新日期:2019-04-17 14:33
一种基于数据的抽油井泵效多模型软测量方法,包括如下步骤:搭建泵效软测量系统,分别采集上冲程平均载荷、下冲程平均载荷、井口压力、抽油机冲程和冲次、井口出液量、电动机上冲程平均电流和电动机下冲程平均电流数据;根据历史生产数据训练并建立抽油井泵效多模型软测量模型;将新采集的数据代入已经训练好的多模型中,得到泵效数据,实现抽油井泵效的软测量。本发明专利技术能够实现生产数据的在线连续测量,测量成本低,实时性强,可以避免人工记录所带来的数据丢失、记录错误等问题,可以避免对抽出井口的油液进行抽样化验所带来的决策过程落后于抽油井实际工况的问题,预测准确度高,可以有效处理所采集数据样本中含有的噪声对预测精度的影响问题。

【技术实现步骤摘要】
一种基于数据的抽油井泵效多模型软测量方法
本专利技术属于油井采油
,具体涉及一种基于数据的抽油井泵效多模型软测量方法。
技术介绍
抽油泵是抽油井在井下的重要生产部分,抽油泵的泵效是评价抽油井生产能力的一个重要参数。泵效的高低可以反映抽油设备的工作效率、抽汲参数的合理程度以及管理水平的高低。抽油井生产过程中,影响泵效的因素主要有:抽油杆和油管柱的弹性伸缩、气体影响和供液不足、游动阀或固定阀不严等造成的泵漏失。对于抽油井泵效的测量,目前有油液采样分析方法、机理建模计算方法等。油液采样分析方法是将抽出井口的油液进行抽样化验,通过相应的分析方法进行计算,但是存在决策过程落后于抽油井实际工况的问题;机理建模计算方法根据生产工艺建立泵效计算的机理模型,但是存在井下不可直接测量参数过多、采样时间滞后、不确定性强、计算误差较大等问题。
技术实现思路
本专利技术要解决的技术问题是提供一种基于数据的抽油井泵效多模型软测量方法,实现抽油井运行数据的远程采集和泵效的自动计算。本专利技术的技术解决方案是:一种基于数据的抽油井泵效多模型软测量方法,包括如下步骤:步骤1:搭建由示功图无线采集模块、井口压力无线采集模块、井口出液量无线采集模块、抽油机电动机电力参数无线采集模块、无线数据远程传输设备和抽油井泵效计算服务器构成的泵效软测量系统,分别采集上冲程平均载荷、下冲程平均载荷、井口压力、抽油机冲程和冲次、井口出液量、电动机上冲程平均电流和电动机下冲程平均电流数据;步骤2:根据历史生产数据训练并建立抽油井泵效多模型软测量模型步骤2.1:对已采集到的抽油井历史生产数据进行预处理,填补缺失数据,将缺失数据点的前一数值和后一数值的平均值作为代替值;步骤2.2:将历史数据中的上冲程平均载荷、下冲程平均载荷、井口压力、抽油机冲程和冲次、流出井口的油液出液量、电动机上冲程平均电流和电动机下冲程平均电流作为模型输入变量,历史数据中的泵效作为模型输出变量,训练并建立软测量模型,首先由主成分分析法(PCA)对数据进行降维处理,步骤如下:步骤2.2.1:假设数据集为D={(x1,y1),(x2,y2),…,(xi,yi),…,(xm,ym)},其中,m为数据集中样本的数量,xi为第i组数据的输入变量(n维),yi为第i组数据的输出变量(1维);对数据集D中的m组数据进行归一化处理,如下:其中,i=1,2,…,m;j=1,2,…,n;为m组数据第j维的平均值;Xj=[x1j,x2j,…,xmj]T为m组数据的第j维所组成的向量,步骤2.2.2:求出归一化处理后的数据集D的协方差矩阵,如下:其中,cov(Xj,Xj)的计算公式如下:步骤2.2.3:由下式计算协方差矩阵的特征值和相应的特征向量,λ·q=covD·q(4)其中,λ和q分别为特征值和特征向量;步骤2.2.4:由下式计算主成分累计贡献率,其中,G为主成分累计贡献率;p为特征值的个数;当前K个主成分累计贡献率大于80%时,可以认为这K个主成分包含原始数据的大部分信息,将这K个主成分所对应的特征向量作为原数据集的特征向量,那么,数据集由n维映射到K维;步骤2.2.5:由K个主成分得到新的数据集,如下:Z=qT·X(6)其中,q=(q1,q2,…,qK)为前K个特征向量;X为原输入变量数据集,X=[X1,X2,…,Xn];Z为新输入变量数据集,Z=[Z1,Z2,…,ZK];步骤2.2.6:原数据集D映射为新的数据集Z={(z1,y1),(z2,y2),…,(zi,yi),…,(zm,ym)},其中,zi为第i组数据的输入变量(K维);步骤2.3:采用一种基于变种群果蝇优化算法优化截断距离的密度峰值聚类方法将新的数据集Z划分为多个数据子集,步骤如下:步骤2.3.1:参数初始化,将截断距离dc作为待优化参数,给定初始果蝇种群规模Sizepop,最大迭代数Maxgen,根据dc的取值范围[dcmin,dcmax],其中:dcmin和dcmax分别为截断距离的最小值和最大值,随机生成Sizepop个果蝇群体位置[X_axis,Y_axis],信息熵计算规模N,种群变化权值ω,步长变化权值ξ;步骤2.3.2:每个果蝇利用嗅觉向随机的方向移动,定义如下:其中,[X_new_axisi,Y_new_axisi]为第i个果蝇个体的新位置,i=1,2,…,Sizepop;RandomValue为搜索距离;步骤2.3.3:计算每个果蝇个体的位置与原点的距离Disti,再计算新位置的味道浓度判定值Si,将Si作为待优化的截断距离值,定义如下:步骤2.3.4:将味道浓度判定值Si代入适应度函数,求出每个果蝇个体位置的味道浓度Smelli,定义如下:Smelli=f(Si)(9)其中,f(·)为适应度函数,定义如下:其中,ρg表示样本数据集Z中数据点g的局部密度,定义如下:其中,dgg’表示数据集中其它的任意一个g’点与g点的欧式距离;δg表示的是样本数据集Z中所有局部密度大于g点的数据点中,与g点距离最小的数据点之间的距离,定义如下:步骤2.3.5:找出果蝇群体中味道浓度最佳的果蝇(记为最优个体),如下:[bestSmell,bestindex]=min(Smelli)(13)步骤2.3.6:记录并保留最佳味道浓度值bestSmell,同时记录最优个体的位置,如下:Smellbest=bestSmell(14)步骤2.3.7:迭代Num_ite(Num_ite<Maxgen)次后,由最近Num_ite次迭代的最优味道浓度值计算信息熵的值,如下:其中,EH(·)表示信息熵;cur_ite表示当前第cur_ite次迭代;步骤2.3.8:将最近一次由Num_ite次迭代得到的信息熵的值与上一次由Num_ite次迭代得到的信息熵的值进行比较,如果熵值变大,更新种群数量如下:Sizepop(cur_ite+1)=Sizepop(cur_ite)-w*Sizepop(cur_ite)(18)其中,Sizepop(cur_ite)和Sizepop(cur_ite+1)分别表示第cur_ite次和cur_ite+1次迭代;如果熵值变小,更新种群数量和果蝇个体的新位置如下:Sizepop(cur_ite+1)=Sizepop(cur_ite)+w*Sizepop(cur_ite)(19)当熵值持续γ次迭代不变时,更新种群数量和果蝇个体的新位置如下:Sizepop(cur_ite+1)=Sizepop(cur_ite)-w*Sizepop(cur_ite)(21)步骤2.3.9:重复步骤2.3.2-2.3.8,直到达到最大迭代次数;步骤2.3.10:输出最优截断距离dc,根据公式11—公式12得到每一个数据点的局部密度ρi及相对距离δi,选取ρi值和δi值中由大到小排列前5%的具有相同标签的数据点作为聚类中心ci(i=1,2,...,r);步骤2.3.11:对于数据集中聚类中心以外的点,分别计算它们与每一个聚类中心的欧氏距离,将每一个点划分到与其距离最近的聚类中心所在的类簇中,那么,数据集Z被划分为r个数据子集,表示为:C1,C2,…,Cr;步骤2.4:对每一个样本子集建立子模型,步骤如下:步骤2.4.1:对于每个数据子集Ci(i=1,本文档来自技高网...

【技术保护点】
1.一种基于数据的抽油井泵效多模型软测量方法,其特征是包括如下步骤:步骤1:搭建由示功图无线采集模块、井口压力无线采集模块、井口出液量无线采集模块、抽油机电动机电力参数无线采集模块、无线数据远程传输设备和抽油井泵效计算服务器构成的泵效软测量系统,分别采集上冲程平均载荷、下冲程平均载荷、井口压力、抽油机冲程和冲次、井口出液量、电动机上冲程平均电流和电动机下冲程平均电流数据;步骤2:根据历史生产数据训练并建立抽油井泵效多模型软测量模型步骤2.1:对已采集到的抽油井历史生产数据进行预处理,填补缺失数据,将缺失数据点的前一数值和后一数值的平均值作为代替值;步骤2.2:将历史数据中的上冲程平均载荷、下冲程平均载荷、井口压力、抽油机冲程和冲次、流出井口的油液出液量、电动机上冲程平均电流和电动机下冲程平均电流作为模型输入变量,历史数据中的泵效作为模型输出变量,训练并建立软测量模型,首先由主成分分析法(PCA)对数据进行降维处理,步骤如下:步骤2.2.1:假设数据集为D={(x1,y1),(x2,y2),…,(xi,yi),…,(xm,ym)},其中,m为数据集中样本的数量,xi为第i组数据的输入变量(n维),yi为第i组数据的输出变量(1维);对数据集D中的m组数据进行归一化处理,如下:...

【技术特征摘要】
1.一种基于数据的抽油井泵效多模型软测量方法,其特征是包括如下步骤:步骤1:搭建由示功图无线采集模块、井口压力无线采集模块、井口出液量无线采集模块、抽油机电动机电力参数无线采集模块、无线数据远程传输设备和抽油井泵效计算服务器构成的泵效软测量系统,分别采集上冲程平均载荷、下冲程平均载荷、井口压力、抽油机冲程和冲次、井口出液量、电动机上冲程平均电流和电动机下冲程平均电流数据;步骤2:根据历史生产数据训练并建立抽油井泵效多模型软测量模型步骤2.1:对已采集到的抽油井历史生产数据进行预处理,填补缺失数据,将缺失数据点的前一数值和后一数值的平均值作为代替值;步骤2.2:将历史数据中的上冲程平均载荷、下冲程平均载荷、井口压力、抽油机冲程和冲次、流出井口的油液出液量、电动机上冲程平均电流和电动机下冲程平均电流作为模型输入变量,历史数据中的泵效作为模型输出变量,训练并建立软测量模型,首先由主成分分析法(PCA)对数据进行降维处理,步骤如下:步骤2.2.1:假设数据集为D={(x1,y1),(x2,y2),…,(xi,yi),…,(xm,ym)},其中,m为数据集中样本的数量,xi为第i组数据的输入变量(n维),yi为第i组数据的输出变量(1维);对数据集D中的m组数据进行归一化处理,如下:其中,i=1,2,…,m;j=1,2,…,n;为m组数据第j维的平均值;Xj=[x1j,x2j,…,xmj]T为m组数据的第j维所组成的向量,步骤2.2.2:求出归一化处理后的数据集D的协方差矩阵,如下:其中,cov(Xj,Xj)的计算公式如下:步骤2.2.3:由下式计算协方差矩阵的特征值和相应的特征向量,λ·q=covD·q(4)其中,λ和q分别为特征值和特征向量;步骤2.2.4:由下式计算主成分累计贡献率,其中,G为主成分累计贡献率;p为特征值的个数;当前K个主成分累计贡献率大于80%时,可以认为这K个主成分包含原始数据的大部分信息,将这K个主成分所对应的特征向量作为原数据集的特征向量,那么,数据集由n维映射到K维;步骤2.2.5:由K个主成分得到新的数据集,如下:Z=qT·X(6)其中,q=(q1,q2,…,qK)为前K个特征向量;X为原输入变量数据集,X=[X1,X2,…,Xn];Z为新输入变量数据集,Z=[Z1,Z2,…,ZK];步骤2.2.6:原数据集D映射为新的数据集Z={(z1,y1),(z2,y2),…,(zi,yi),…,(zm,ym)},其中,zi为第i组数据的输入变量(K维);步骤2.3:采用一种基于变种群果蝇优化算法优化截断距离的密度峰值聚类方法将新的数据集Z划分为多个数据子集,步骤如下:步骤2.3.1:参数初始化,将截断距离dc作为待优化参数,给定初始果蝇种群规模Sizepop,最大迭代数Maxgen,根据dc的取值范围[dcmin,dcmax],其中:dcmin和dcmax分别为截断距离的最小值和最大值,随机生成Sizepop个果蝇群体位置[X_axis,Y_axis],信息熵计算规模N,种群变化权值ω,步长变化权值ξ;步骤2.3.2:每个果蝇利用嗅觉向随机的方向移动,定义如下:其中,[X_new_axisi,Y_new_axisi]为第i个果蝇个体的新位置,i=1,2,…,Sizepop;RandomValue为搜索距离;步骤2.3.3:计算每个果蝇个体的位置与原点的距离Disti,再计算新位置的味道浓度判定值Si,将Si作为待优化的截断距离值,定义如下:步骤2.3.4:将味道浓度判定值Si代入适应度函数,求出每个果蝇个体位置的味道浓度Smelli,定义如下:Smelli=f(Si)(9)其中,f(·)为适应度函数,定义如下:其中,ρg表示样本数据集Z中数据点g的局部密度,定义如下:其中,dgg’表示数据集中其它的任意一个g’点与g点的欧式距离;δg表示的是样本数据集Z中所有局部密度大于g点的数据点中,与g点距离最小的数据点之间的距离,定义如下:步骤2.3.5:找出果蝇群体中味道浓度最佳的果蝇(记为最优个体),如下:[bestSmell,bestindex]=min(Smelli)(13)步骤2.3.6:记录并保留最佳味道浓度值bestSmell,同时记录最优个体的位置,如下:Smellbest=bestSmell(14)步骤2.3.7...

【专利技术属性】
技术研发人员:李琨宿文肃韩莹李太芳杨洋王焕清刘亮王一安葛发蔚
申请(专利权)人:渤海大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1