一种示功图诊断模型无监督预训练方法技术

技术编号:38541285 阅读:14 留言:0更新日期:2023-08-19 17:09
本发明专利技术公开了一种示功图诊断模型的无监督预训练方法,该方法针对示功图本身仅具有线条且中心区域为空白的特征,首先采用漫水填充算法对示功图数据中心区域进行填充,并通过让诊断模型输出特征向量,反卷积模型输出填充后的示功图数据,计算生成图像与填充图像的重建误差,进行深度学习模型的预训练,从而减轻模型训练对大量带标签示功图样本的依赖,缩短训练周期并保证示功图诊断精度。练周期并保证示功图诊断精度。练周期并保证示功图诊断精度。

【技术实现步骤摘要】
一种示功图诊断模型无监督预训练方法


[0001]本专利技术涉及油井采油机故障诊断领域,具体而言是通过让深度学习模型学习填充示功图的代理任务,进行模型的无监督预训练。

技术介绍

[0002]采油机作为原油开采的主要手段,其工作状况好坏直接关系到油田整体经济效益。示功图作为反应深井泵工作状况好坏的重要手段,被广泛应用于采油机故障诊断。随着人工智能技术的发展,采用深度学习模型对示功图进行诊断取得了较高的诊断精度。但目前主流的深度学习模型依赖于大量带标签样本的有监督训练,而进行示功图的标记不仅需要耗费大量的人力成本,而且依赖于专业知识。
[0003]近几年,出现了许多采用无监督算法对深度学习模型进行训练的方法,但这些方法多用于自然图像的训练。然而,由于示功图是由较细线条围成的空心多边形,无效空白区域较多,特征较为稀疏,在示功图诊断领域效果还不够理想。对示功图中心区域进行填充能够增加示功图特征信息,有助于示功图诊断的精度提升。
[0004]现有方法中出现了利用填充示功图进行模型的有监督训练,这虽然提升了分类精度,但仍无法避免对大量带标签样本的依赖。而采用填充示功图作为代理任务进行无监督预训练将有望提升精度,且不需要标注样本,目前此方向的研究较少。
[0005]可见,亟需一种示功图诊断模型的无监督预训练方法,针对示功图本身特征,通过填充示功图的代理任务进行模型的预训练,以减轻模型训练对大量带标签示功图样本的依赖,缩短训练周期并保证示功图诊断精度。

技术实现思路

[0006]针对上述问题,本专利技术公开一种示功图诊断模型的无监督预训练方法,该方法采用漫水填充算法对采油机的示功图进行填充,通过让模型学习生成填充示功图数据,并计算生成图像与填充图像的重建误差,进行深度学习模型预训练,从而减轻模型训练对大量标注样本的依赖,以缩短训练周期并保证诊断精度。
[0007]该方法具体包含以下步骤:
[0008]1)采集采油机的历史示功图,组成示功图数据集S,并使用留出法分为训练集、验证集和测试集,其中留出法比例为8:1:1;
[0009]2)遍历S,利用中线扫描法寻找每一个示功图样本中的任意一个内点P,其中中线扫描法具有如下步骤:
[0010]2‑
1)以示功图左上角为原点,根据示功图数据的列数l计算中线的横坐标x=l/2;
[0011]2‑
2)找出中线与示功图上行程线交点p1的坐标(x,y1);
[0012]2‑
3)找出中线与示功图下行程线交点p2的坐标(x,y2);
[0013]2‑
4)计算内点P的纵坐标y=(y1+y2)/2,则P点的坐标为(x,y)。
[0014]3)将P作为漫水填充算法的起始点,对S中样本进行填充,得到填充示功图数据集
Y;
[0015]4)将填充前数据集S作为目标深度学习模型的输入,输出n维特征向量V,其中128≤n≤2048;
[0016]5)将向量V作为反卷积深度学习模型的输入,生成填充后的示功图Y';
[0017]6)根据Y和Y'计算重建误差L
train
,完成m轮无监督预训练,其中训练轮数0<m≤300,重建误差计算公式如下:
[0018][0019]其中,i为样本的下标,k为样本的总数量,L
train
为在训练集上计算得到的重建误差,
[0020]L
test
为在测试集上计算得到的重建误差,Y
i
表示第i个填充数据集样本,Y
i
'表示第i个生成填充数据输出。
[0021]7)计算测试集重建误差L
test
,判断L
test
是否小于误差阈值L
min
,若低于L
min
则预训练结束,否则转到步骤5),其中0<L
min
≤0.01;
[0022]8)使用带标签示功图数据进行预训练模型的迁移学习,使用训练完成的模型进行工况类型诊断。
[0023]有益效果:
[0024]本专利技术所公开的一种示功图诊断模型的无监督预训练方法,针对示功图本身特征,采用漫水填充算法对采油机的示功图进行填充,通过让模型学习生成填充示功图数据,并计算生成图像与填充图像的重建误差,进行深度学习模型预训练,从而减轻模型训练对大量带标签示功图样本的依赖,缩短训练周期并保证示功图诊断精度。
附图说明
[0025]图1为本专利技术中方法流程图;
[0026]图2为本专利技术具体算例中模型的训练集和验证集损失值曲线。
具体实施方式
[0027]下面结合附图以及具体的算例,给出详细的计算过程和具体操作流程,以对本专利技术作进一步说明。本实施案例在以本专利技术技术方案为前提下进行实施,但本专利技术的保护范围不限于下述的实施案例。
[0028]本案例以某采油企业为例来说明本方法的有效性及实施过程,其工作流程如图1所示,以2021年7月至2021年8月之间的数据构建训练集、验证集及测试集,分析本文方法在不依赖大量带标签样本的前提下,对提升诊断精度的有效性。
[0029]具体的实施步骤如下:
[0030]1)采集采油机的历史示功图共49852张,组成示功图数据集S,按照留出法以8:1:1的比例划分数据集S为训练集S
train
39882张、验证集S
val
4985张和测试集S
test
4985张。
[0031]2)对数据集中的所有样本计算其内点P的坐标,部分示功图的内点P如表1所示:
[0032]表1部分示功图P点坐标
[0033][0034][0035]3)将P点作为起始点,采用漫水填充算法对示功图进行填充,得到填充示功图数据
集,部分填充示功图样本如表2所示:
[0036]表2部分填充示功图样本
[0037][0038][0039]4)本实施例中以卷积神经网络模型Resnet18为例,取n=512,经过模型计算,得到部分特征向量如表3所示:
[0040]表3部分示功图特征向量
[0041]示功图编号特征向量V1[0.213,0.971,...,0.023]1×
512
2[0.182,0.294,...,0.737]1×
512
3[0.856,0.913,...,0.354]1×
512
4[0.761,0.673,...,0.209]1×
512
[0042]5)将特征向量作为反卷积神经网络的输入,输出填充示功图数据。
[0043]6)取m=300,根据输出图像数据和实际填充样本数据计算训练集重建误差L
train
,完成300轮无监督预训练。
[0044]7)取L
min
=0.05,计算测试集重建误差判断测试集重建误差L
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种示功图诊断模型的无监督预训练方法,其特征在于采集示功图历史数据,根据漫水填充算法填充示功图数据组成填充数据集,根据填充示功图的代理任务而非人工标注标签作为模型的训练信号,进行模型的无监督预训练,避免模型训练对大量带标签样本的依赖,包括以下步骤:1)采集采油机的历史示功图,组成示功图数据集S,并使用留出法分为训练集、验证集和测试集;2)遍历S,利用中线扫描法寻找每一个示功图样本中的任意一个内点P;3)将P作为漫水填充算法的起始点,对S中样本进行填充,得到填充示功图数据集Y;4)将填充前数据集S作为目标深度学习模型的输入,输出n维特征向量V;5)将向量V作为反卷积深度学习模型的输入,生成填充后的示功图Y';6)根据Y和Y'计算训练集重建误差L
train
,完成m轮无监督预训练;7)计算测试集重建误差L
test
,判断L
test
是否小于误差阈值L
min
,若低于L
min
则预训练结束,否则转到步骤5);8)使用带标签示功图数据进行预训练模型的迁移学习,使用训练完成的模型进行工况类型诊断。2.根据权利要求1所述的一种示功图诊断模型的无监督预训练方法,其特征在于步骤1)所述留出法比例为8:1:1。3.根据权利要求1所述的一种示功图诊断模型的无监督预训练方法,其特征在于...

【专利技术属性】
技术研发人员:陈夕松钱帅康曹兴广姜磊卜禹
申请(专利权)人:南京富岛油气智控科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1