测井数据异常检测方法技术

技术编号:38372417 阅读:7 留言:0更新日期:2023-08-05 17:35
本发明专利技术提供一种测井数据异常检测方法,该测井数据异常检测方法包括:步骤1、构造测井数据样本集合;步骤2、进行系统初始化;步骤3、进行特征提取层训练;步骤4、输出分类层训练;步骤5、进行异常值识别。该测井数据异常检测方法引入了多层特征提取层,并在特征提取层构造的时候引入了类内散度矩阵,能够得到具有分辨力的抽象特征;在训练输出分类层的时候引入了风险加权矩阵,提升了训练结果对噪声的鲁棒性。提升了训练结果对噪声的鲁棒性。提升了训练结果对噪声的鲁棒性。

【技术实现步骤摘要】
测井数据异常检测方法


[0001]本专利技术涉及构造地质学及石油地质学
,特别是涉及到一种测井数据异常检测方法。

技术介绍

[0002]在数据挖掘中,异常检测(anomaly detection)对不匹配预期模式或数据集中其他项目的项目、事件或观测值的识别。通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。常见的异常检测方法有:基于密度的方法、基于子空间与相关性的高维数据的孤立点检测、一类支持向量机等。在收集测井数据时,由于测井液、岩屑的影响,可能导致某些深度的测井值异常,这就需要我们研究测井数据的异常检测。
[0003]在申请号:CN201910308560.6的中国专利申请中,涉及到一种时间序列异常值检测方法及装置,该方法包括:获取待检测时刻前预设时长内、属于同一时间序列的历史数据;对所述历史数据进行标准化处理;根据标准化处理后的历史数据和预先训练的计算模型,确定所述待检测时刻的数据是否为异常值。这种方法本质上利用了时间相关性,具有较强的假设前提条件。
[0004]在申请号:CN201610970187.7的中国专利申请中,涉及到一种LTE网络中的异常值检测方法及系统,通过将实测数据划分为训练集和测试集,在训练集中定义集群和参数,由聚类算法找到各数据点所属的集群,根据参数值和聚类的结果,计算每个数据点的似然值,依据设定的预警阈值、报警阈值将似然值分成异常区域、中间区域和正常区域;将已经计算出的模型应用在测试集中,每个数据点的似然值均被计算出来,并分到各区域中,从而找到测试集中的异常值。该方法虽然采用了机器学习的手段,但是本质上是一种无监督的方法,具有较大的不确定性。另外,关于测井数据的异常检测也鲜见报道。测井数据具有明显得物理意义,其可以用于进行岩性识别,因此可以采用监督学习方法;同时测井数据往往存在一定的噪声,也对异常检测带来较大困难。
[0005]在申请号:CN201611123548.0的中国专利申请中,涉及到一种微电阻率扫描成像测井数据异常校正方法及装置,属于石油工程测井
本专利技术首先采集测井数据,判断测井数据是否异常以及异常类型;然后根据异常类型选取异常数据相邻的正常数据计算平均值;再利用异常数据与相邻正常数据的相似性计算异常数据的可信度,并根据可信度判断异常数据是否可信;最后在异常数据不可信时,利用平均值代替异常数据作为校正值;在异常数据可信时,则提取异常数据的变化特征,并将变化特征加上其对应的平均值作为异常数据的校正值。该专利技术的校正方法能在整体上使校正后的异常数据与相邻正常数据大小相吻合,同时在局部上又保留了自身的变化特征,经过可视化成像后,取得较好的成图效果。
[0006]以上现有技术均与本专利技术有较大区别,未能解决我们想要解决的技术问题,为此我们专利技术了一种新的测井数据异常检测方法。

技术实现思路

[0007]本专利技术的目的是提供一种能够得到具有分辨力的抽象特征,提升了训练结果对噪声的鲁棒性的测井数据异常检测方法。
[0008]本专利技术的目的可通过如下技术措施来实现:测井数据异常检测方法,该测井数据异常检测方法包
[0009]本专利技术的目的还可通过如下技术措施来实现:
[0010]该测井数据异常检测方法包括:
[0011]步骤1、构造测井数据样本集合;
[0012]步骤2、进行系统初始化;
[0013]步骤3、进行特征提取层训练;
[0014]步骤4、输出分类层训练;
[0015]步骤5、进行异常值识别。
[0016]在步骤1中,获取一口或多口井的测井数据,每个深度上的所有测井值组成一个特征向量,即样本,一个样本表达为其中表示实数域,d为样本维度;测井数据构成的样本集合为样本矩阵样本矩阵其中n为该集合的样本总数;为测井数据打上岩性标签。
[0017]在步骤1中,测井值包括自然伽马、自然电位、井径、声波时差、密度、补偿中子、深侧向电阻率及浅侧向电阻率。
[0018]在步骤2中,令经验损失系数τ>0,学习率系数a,b>0,停止系数∈>0,最大特征提取层数m为正整数,高维特征数量N
h
为正整数;令高斯核宽σ>0,样本拒绝系数α∈(0,100);特征提取层权重矩阵为零矩阵,动量向量为零矩阵。
[0019]在步骤2中,τ∈(10,103),a∈(0.5,1),b∈(0.01,0.1),∈=10
‑3,m>5,a∈(0.1,1),α=10,N
h
>200。
[0020]步骤3包括:
[0021]步骤301、初始化:令i=1,Y0=X,=X,为Y0的第k行;
[0022]步骤302、随机生成权重矩阵随机生成偏置向量随机生成偏置向量然后构造高维特征矩阵H的第k列为φ为激活函数;
[0023]步骤303、计算第i特征提取层的权重矩阵
[0024]步骤304、令i自增1,如果i>m,跳至步骤4,否则跳至步骤302。
[0025]在步骤302中,激活函数采用Sigmoid、Tanh或者Softmax。
[0026]在步骤302中,随机生成方法所采用的概率分布为高斯分布或者均匀分布。
[0027]步骤303包括:
[0028]步骤30301、根据求解类内或者总体散度矩阵S;
[0029]步骤30302、计算梯度其中如果则跳至步骤30303,如果则把当前θ的值赋给Θ
i
,令Y
i
=φ(Θ
i
Y
i
‑1),然后跳至步骤304;
[0030]步骤30303、计算更新后的动量向量:
[0031][0032]然后计算更新后的权重矩阵θ
*
=θ

bv;
[0033]步骤30304、把θ
*
的值赋给θ,把v
*
的值赋给v,然后跳至步骤30302。
[0034]步骤4包括:
[0035]步骤401、对样本分别求取其编码后特征表示如下:其中
[0036]步骤402、对样本计算误差其中其中为元素全为1向量,I为单位阵;
[0037]步骤403、计算风险加权矩阵M为对角阵,其第k个对角元素为
[0038]步骤404、计算输出权重矩阵,如下:
[0039][0040]在步骤5中,对于新的样本集合p为新样本集合的样本数量,求取其编码后特征表示如下:其中其中然后计算预测误差对进行从大到小排序,排序后的集合中前α%的预测误差所对应的样本即为异常样本。
[0041]本专利技术中的测井数据异常检测方法,包括以下步骤:构造测井数据样本集合,系统初始化,特征提取层训练,输出分类层训练,异常值识别。相比于现有技术,本专利技术引入了多层特征提取层,并在特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.测井数据异常检测方法,其特征在于,该测井数据异常检测方法包括:步骤1、构造测井数据样本集合;步骤2、进行系统初始化;步骤3、进行特征提取层训练;步骤4、输出分类层训练;步骤5、进行异常值识别。2.根据权利要求1所述的测井数据异常检测方法,其特征在于,在步骤1中,获取一口或多口井的测井数据,每个深度上的所有测井值组成一个特征向量,即样本,一个样本表达为其中表示实数域,d为样本维度;测井数据构成的样本集合为样本矩阵样本矩阵其中n为该集合的样本总数;为测井数据打上岩性标签。3.根据权利要求2所述的测井数据异常检测方法,其特征在于,在步骤1中,测井值包括自然伽马、自然电位、井径、声波时差、密度、补偿中子、深侧向电阻率及浅侧向电阻率。4.根据权利要求2所述的测井数据异常检测方法,其特征在于,在步骤2中,令经验损失系数τ>0,学习率系数a,b>0,停止系数∈>0,最大特征提取层数m为正整数,高维特征数量N
h
为正整数;令高斯核宽σ>0,样本拒绝系数α∈(0,100);特征提取层权重矩阵为零矩阵,动量向量为零矩阵。5.根据权利要求4所述的测井数据异常检测方法,其特征在于,在步骤2中,τ∈(10,103),a∈(0.5,1),b∈(0.01,0.1),∈=10
‑3,m>5,a∈(0.1,1),α=10,N
h
>200。6.根据权利要求4所述的测井数据异常检测方法,其特征在于,步骤3包括:步骤301、初始化:令i=1,Y0=X,k=1,

,n;为Y0的第k行;步骤302、随机生成权重矩阵随机生成偏置向量随机生成偏置向量然后构造高维特征矩阵H的第k列为φ为激活函数;步骤303、计算第i特征提...

【专利技术属性】
技术研发人员:韩宏伟冯德永刘海宁史士龙江洁李长红罗荣涛夏健朱剑兵刘鸽
申请(专利权)人:中国石油化工股份有限公司胜利油田分公司物探研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1