System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于聚类模型的电潜泵产能多参综合优化方法技术_技高网

一种基于聚类模型的电潜泵产能多参综合优化方法技术

技术编号:40957429 阅读:3 留言:0更新日期:2024-04-18 20:34
本发明专利技术公开了一种基于聚类模型的电潜泵产能多参综合优化方法,包括以下步骤:步骤S1、采集电潜泵的原始计量数据,并保存各监测参数的名称;步骤S2、截取部分监测参数的数据作为训练集,并通过归一化方法统一数据量纲;步骤S3、构建K‑means++聚类模型和K‑Medoids聚类模型,保存训练成果模型;步骤S4、应用训练成果聚类模型前,对参数值进行归一化处理;步骤S5、应用聚类模型计算出待优化的电潜泵所属类别;步骤S6、计算当前电潜泵与所属类别中各个样本点的相似度,作为优化建议进行推荐。本发明专利技术的产能优化建议是结合了井况、工况、生产情况等多个参数计算而来,且推荐的优化参数在历史上真实存在,避免了人工计算调参无法模拟的情况。

【技术实现步骤摘要】

本专利技术涉及一种电潜泵产能优化方法,尤其涉及一种基于聚类模型的电潜泵产能多参综合优化方法


技术介绍

1、当今社会,石油被广泛运用于交通运输、石化、制造等各行各业,成为人类社会生活的必需品,极大地丰富和改善了人们的生活,推动了人类社会的物质文明,被称为经济乃至整个社会的“黑色黄金”、“经济血液”。当代采油技术发展中,电潜泵采油工艺已成为其发展水平的主要标志。新技术的快速革新,带动了电潜泵相关的技术优化,电潜泵技术已经逐步趋向于成熟阶段。随着采油成本越来越低、效益越来越好,积极合理的进行智能化技术、自动化技术的研发已经成为电潜泵未来主要发展方向,强化并提升电潜泵产能效率已经成为时代发展的必然趋势。

2、传统的电潜泵产能优化技术主要基于专业知识的方法,该方法由工程师通过专业知识的计算,进行电潜泵控制参数的优化调控,然而电潜泵的生产是一个复杂且非线性的,油藏环境无法通过专业知识的计算进行完全模拟,依据单一的线性公式进行电潜泵产能优化的调控,可能会导致电潜泵运行出现异常或故障。


技术实现思路

1、为了解决上述技术所存在的不足之处,本专利技术提供了一种基于聚类模型的电潜泵产能多参综合优化方法,主要通过机器学习算法,根据收集到的历史正常工况下的运行数据,经特征选择、数据清洗、数据归一化操作后,并对处理后的数据进行聚类模型训练,使其在应用时在保证同一泵型、电机额定参数接近、油藏属性接近的前提下,给出电潜泵产能较低井的可调控参数的指标以及调控后的预期效果。

2、为了解决以上技术问题,本专利技术采用的技术方案是:一种基于聚类模型的电潜泵产能多参综合优化方法,包括以下步骤:

3、步骤s1、采集电潜泵的原始计量数据,分析电潜泵的运行参数及数据缺失情况,确定能够反映电潜泵运行状态的监测参数,并保存各监测参数的名称;

4、步骤s2、从电潜泵的历史计量数据中截取部分监测参数的数据作为训练集,对训练集的缺失值、异常值进行清洗操作,并通过归一化方法统一数据量纲;

5、步骤s3、构建k-means++聚类模型和k-medoids聚类模型,将训练集中电潜泵的每组监测参数值作为聚类模型的数据集,对两种聚类模型的聚类中心点进行初始化后进行无监督训练,直到k个聚类中心都被确定,保存训练成果模型;

6、步骤s4、应用训练成果聚类模型前,对待评估电潜泵的监测参数进行筛选、并对参数值进行归一化处理;

7、步骤s5、应用聚类模型计算出待优化的电潜泵所属类别;

8、步骤s6、计算当前电潜泵与所属类别中各个样本点的相似度,选取相似度高的样本点中参数,作为优化建议进行推荐。

9、优选的,步骤s1的具体内容为:获取由全部电潜泵运行监测参数构成的数据集,分析数据集中电潜泵各参数间的联系,并计算电潜泵各参数间的pearson相关系数,公式如下:

10、

11、式中:px,y表示变量x和变量y之间的相关系数分值,cov(x,y)是变量x和变量y的协方差,σx和σy分别是变量x和变量y的标准差;

12、通过各变量间的pearson相关系数,筛选出与出口压力、入口压力、油压、电流等相关性在0.5-0.8之间的电潜泵关键参数,为训练集保存这些参数项的名称。

13、优选的,步骤s2的具体内容为:对训练集进行特征选择,以及对训练集的缺失值、异常值进行清洗操作,并通过归一化方法统一数据量纲;

14、其中,在特征选择过程中,监测参数的选择是从步骤s1中保存的参数项中获取的;在数据清洗过程中,仅保留电潜泵正常运行时段内的数据,故障时段内的数据及缺失数据需剔除;归一化过程采用最大最小值方法,对原始数据进行线性变换,将数据值映射到[0,1]之间,公式如下:

15、

16、式中:xmax为测点数据中的最大值,xmin为测点数据中的最小值,x*为数据映射后的值。

17、优选的,步骤s3中,假设样本数据集为d={xj,j=1,2,…,n},其中xj表示每一个数据样本,n表示样本集大小,具体建模步骤如下:

18、步骤s31:k-means++聚类算法使用欧氏距离作为样本相似性度量,其核心思想是选取距离尽可能远的数据样本作为初始聚类中心点,重复此过程,直至选出k个聚类中心;

19、步骤s32:k-medoids聚类算法采用簇中位置最中心的对象,即当前簇中所有其他点到该中心点的距离之和最小,直至选出k个聚类中心;

20、步骤s33:计算两种聚类算法每次选择聚类中心点后的轮廓系数,通过轮廓系数评价聚类效果的好坏。

21、优选的,步骤s31的选择过程如下:

22、1)从数据集d={xj,j=1,2,…,n}中随机选取一个样本点作为第一个初始聚类中心ci;

23、2)计算每个样本与当前已有聚类中心之间的最短距离,用d(ci,xj)表示,公式如下:

24、

25、式中:d(ci,xj)表示聚类中心ci和样本点xj之间的欧式距离;xj表示数据集d中的任意样本点,d表示数据样本集,n表示数据样本集的维度;

26、3)计算每个样本点被选为下一个聚类中心的概率p(ci,xj),最后选择最大概率值所对应的样本点作为下一个簇中心;

27、

28、式中:d(ci,xj)2表示某个样本点与当前已有聚类中心之间的距离,σi∈k;j∈nd(ci,xj)2表示所有样本点与已有聚类中心之间的距离之和;

29、4)重复第2步和第3步,直到选择出k个聚类中心或目标函数e的值不再变化,即达到最优;

30、

31、式中:xj为数据集中的样本点,ci为聚类的中心点,其不一定属于样本数据集中的样本点,e则表示数据集中所有样本点到中心点的距离之和。

32、优选的,步骤s32的具体步骤如下:

33、1)任意选取k个点作为中心点ci;

34、2)按照与中心点最近原则,将剩余样本点分配到当前最佳中心点代表的簇中;

35、3)将簇之间每个点之间作为中心点,都计算一次其与所有样本点之间的距离,然后选择距离最小的点作为新的中心点min(c);

36、

37、式中:xj为数据集中的样本点,ci为聚类的中心点,其属于样本集中的样本点,c则表示数据集中所有样本点到中心点的距离之和;

38、4)重复步骤1-3的过程,直到中心点不再偏移,即达到最优。

39、优选的,步骤s33,轮廓系数取值范围为[-1,1],针对某个样本的轮廓系数s为:

40、

41、式中:a(i)表示某个样本与其所在簇内其他样本的平均距离,即内聚度;b(i)表示某个样本与其他簇样本的平均距离,即分离度;

42、再次计算k-means++聚类中心点与k-medoids聚类中心点的相似度,选择轮廓系数值趋近于1且相似度较本文档来自技高网...

【技术保护点】

1.一种基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S1的具体内容为:获取由全部电潜泵运行监测参数构成的数据集,分析数据集中电潜泵各参数间的联系,并计算电潜泵各参数间的Pearson相关系数,公式如下:

3.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S2的具体内容为:对训练集进行特征选择,以及对训练集的缺失值、异常值进行清洗操作,并通过归一化方法统一数据量纲;

4.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S3中,假设样本数据集为D={Xj,j=1,2,…,n},其中Xj表示每一个数据样本,n表示样本集大小,具体建模步骤如下:

5.根据权利要求4所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S31的选择过程如下:

6.根据权利要求4所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S32的具体步骤如下:

7.根据权利要求4所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S33,轮廓系数取值范围为[-1,1],针对某个样本的轮廓系数S为:

8.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S4的具体内容为:获取当前待评估电潜泵的监测数据,筛选该电潜泵的监测参数项,并对其筛选结果集进行归一化,这两步的处置依据来自于步骤S1、步骤S2所保存的参数项列表和归一化模型。

9.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S5的具体内容为:根据步骤S4,应用已训练的聚类模型,计算当前电潜泵在训练样本中的所属类别。

10.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤S6中,选取相似度降序排列时的前二十个样本点参数,根据同频率选油嘴、同油嘴选频率的规则,以及产液量高于当前电潜泵产能时油嘴、频率均选的规则,给出电潜泵产能参数的优化建议。

...

【技术特征摘要】

1.一种基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤s1的具体内容为:获取由全部电潜泵运行监测参数构成的数据集,分析数据集中电潜泵各参数间的联系,并计算电潜泵各参数间的pearson相关系数,公式如下:

3.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤s2的具体内容为:对训练集进行特征选择,以及对训练集的缺失值、异常值进行清洗操作,并通过归一化方法统一数据量纲;

4.根据权利要求1所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤s3中,假设样本数据集为d={xj,j=1,2,…,n},其中xj表示每一个数据样本,n表示样本集大小,具体建模步骤如下:

5.根据权利要求4所述的基于聚类模型的电潜泵产能多参综合优化方法,其特征在于:所述步骤s31的选择过程如下:

6.根据权利要求4所述的基于聚类模型的电潜泵产能多参综合优化...

【专利技术属性】
技术研发人员:赵玉泉李郭敏曾珍
申请(专利权)人:未必然数据科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1