一种综合地质钻孔测井岩性识别方法技术

技术编号:26304520 阅读:28 留言:0更新日期:2020-11-10 20:00
本发明专利技术提供了一种综合地质钻孔测井岩性识别方法,该方法对钻孔测井数据进行精化处理,得到精化数据集,包括对钻孔测井数据进行缺失值填补、均衡处理、数据集归一化处理;根据t‑SNE算法对精化数据集进行降维处理,根据PSO算法对BP神经网络进行改进、优化,得到网络最优初始化权值和阈值,并建立网络模型,利用建立的网络模型对降维数据集进行训练学习,该方法通过对钻孔测井数据进行精化处理,解决了获取的钻孔测井数据缺失、数据集不均衡、训练数据不在统一量纲范围而造成最终识别率过低的问题,且再根据t‑SNE算法对钻孔测井数据集进行降维处理,从而简化数据,再通过PSO算法对现有技术中的常用BP神经网络进行优化,提升了识别准确率高和识别速率。

【技术实现步骤摘要】
一种综合地质钻孔测井岩性识别方法
本专利技术涉及一种综合地质钻孔测井岩性识别方法,特别是一种基于t-SNE与PSO对BP神经网络进行改进的综合钻孔测井岩性识别方法。
技术介绍
快速发展的经济使得人们对资源和能源的需求不断增加,对地质勘探提出了更高的要求。岩石的成分、结构以及物理化学特性等一切能够反映岩石特征的属性就是岩石的岩性。由于岩性控制着岩石物理性质(如孔隙度和渗透率)的分布,因此,对岩性空间变化的了解对于地下矿层的勘探具有重要意义。岩性识别主要通过分析钻井岩芯以及测井资料数据可得,但是钻井取心由于部分岩层岩性采取率不高又很难做到对钻遇地层的完整描述。随着不断发展的测井技术给地质工作者带来了丰富的测井信息,对这些测井信息进行分析运用识别岩性信息,相对于分析钻井岩芯来讲更快速,效果更准确。由于复杂的地质条件和沉积环境,储层非均质性与测井响应特征之间的非线性关系表明,采用线性测井响应方程和经验统计公式不能有效地刻画储层特征,不能满足实际生产需要。传统的岩性鉴别方法与工作人员多年来不断存储积累的经验有很大关联的,得到的答案并不是唯一确定的。20世纪80年代后期,人工神经网络技术因为能在解决问题的时候不受其他因素干扰的能力和对不是线性数据的映射能力的优势在世界范围迅速发展起来,为测井解释的变革工作提出了新的想法可进行研究。与传统测井分析方法相比,该方法在避免人为因素造成误差的同时还可以提高岩性识别的效率以及识别率。在岩性识别方面使用到的机器学习算法多种多样,不同的算法识别效果不同,从目前的一些识别数据来看,在岩性识别方面识别准确率并没有达到一个令人满意的程度,找到合适的方法提高识别的准确率具有很大的意义。为了提高识别率、加快识别速率,且避免人工分析测井曲线识别岩性方法中人为因素造成的误差,已有使用BP神经网络技术来对测井数据进行岩性识别,但BP神经网络在训练分布不均匀且具有模糊性的测井参数时,会对测井识别的速度有较为严重的影响,很容易出现陷入局部最小,而且BP神经网络一般是先根据经验设置最开始的各种网络所需要的参数,再根据实验结果误差率的反馈对参数进行调整,在调参阶段反复迭代、工作量大且不一定能找到最优的权值和阈值,因此就目前在岩性识别方面使用的BP神经网络学习算法获得的识别数据来看,在岩性识别方面识别准确率较低。
技术实现思路
本专利技术的目的在于解决上述现有技术的不足,并提供一种综合地质钻孔测井岩性识别方法,该方法是基于t-SNE与PSO对BP神经网络进行改进的综合钻孔测井岩性识别方法,具有识别准确率高、识别速率快的优点。实现本专利技术目的的技术方案为:一种综合地质钻孔测井岩性识别方法,该方法至少包括以下步骤:1.获取钻孔测井数据;2.对钻孔测井数据进行精化处理,得到精化数据集,精化处理步骤如下;2.1判断钻孔测井数据数据特征类型列表是否存在空缺,若出现空缺,则选用均值填补、中值填补、众数填补、任意值填补任一方式填补数据至该空缺部分;2.2根据钻孔测井数据中各个岩性类别下的数据量与标准钻孔测井数据中各个岩性类别下的数据量进行比对,若岩性分类的数据量不相等,则存在数据不均衡情况,利用SMOTE过采样算法对钻孔测井数据集进行均衡处理;2.3采用线性函数法对钻孔测井数据进行归一化处理,得到精化数据集;3.根据t-SNE算法对精化数据集进行降维处理,降维处理步骤如下:3.1设定好降至的维数;3.2为体现数据相似度,采用条件概率表达选出的数据样本在空间中的投射距离,其中高维空间数据样本用高斯分布来表达样本在空间中的投射距离,低维数据用t分布来表达特性相近样本在空间中的投射距离,其中高维空间数据样本的条件概率Pij通过如下公式获得:式中,xi和xj为数据样本中表示同一岩性的数据在高维空间的数据点,σi为以xi为中心点的高斯分布方差;xk和xl为数据集中的数据映射在高维空间中的数据点,其中低维空间数据样本的条件概率qij通过如下公式获得:式中,yi和yj分别为高维数据点xi和xj映射于低维的数据点;yk和yl为高维空间数据点xk和xl映射与低维空间的数据点;其中离群点X’i的条件概率p’ij通过如下公式获得:式中,Pj|i为以xi为中心的xj与xi之间的条件概率,Pi|j为以xj为中心的xi与xj之间的条件概率)3.3将转换后的低维数据用Kullback-Leibler散度进行表达,具体的代价函数如下:式中,Pij为高维空间数据样本的条件概率,qij为低维空间数据样本的条件概率,C和KL(P||Q)为条件概率Pij与条件概率qij的信息熵的差值;对代价函数进行梯度求解的公式如下:式中,C为条件概率Pij与条件概率qij的信息熵的差值,yi和yi分别为高维数据点xi和xj映射于低维的数据点,Pij为高维空间数据样本的条件概率,qij为低维空间数据样本的条件概率;4.根据PSO算法对BP神经网络进行改进、优化,得到网络最优初始化权值和阈值,建立网络模型,具体步骤如下;4.1设定最小误差值和迭代次数阈值;4.2设定BP神经网络的初始值参数,再进行迭代运算,具体为:利用适应度函数进行计算粒子适应度值,再根据个体极值和全局极值将粒子的速度以及种群的位置不断进行更新,判断当前粒子新适应度值是否低于最小误差值,若低于则输出目前适应度值,若高于则进一步判断迭代次数的数值是否符合迭代次数阈值,若符合则输出目前适应度值,若不符合则继续进行迭代运算,且迭代次数数值加1,当迭代的次数达到迭代次数阈值则停止迭代运算;4.3根据输出的多个适应度值确定个体极值,其中个体极值为当前适应度值所对应粒子的目标函数值,再选取所有粒子的个体极值中最大目标函数值为群体极值,将输出当前群体极值所对应的粒子的速度以及向量作为BP神经网络初始权值与阈值,建立网络模型;5.利用建立的网络模型对降维数据集进行训练学习得到最终的岩性识别率。对上述技术方案的进一步改进为,步骤2.3中线性函数法对钻孔测井数据进行归一化处理,得到精化数据集,由如下公式获得;式1中,X(i)为钻孔测井数据,为所有钻孔测井数据的平均值,N为钻孔测井数据的数据数量,式2中,A为算法中的调节因子,为所有钻孔测井数据的平均值,X为初始钻孔测井数据;对上述技术方案的进一步改进为,步骤2.3中线性函数法对钻孔测井数据进行归一化处理,得到精化数据集,由如下公式获得;式中,Xmin为钻孔测井数据的最小值,Xmax为钻孔测井数据的最大值,X为初始钻孔测井数据。对上述技术方案的进一步改进为,步骤2.3中线性函数法对钻孔测井数据进行归一化处理,得到精化数据集,由如下公式获得;式3中,Xmin为钻孔测井数据的最小值,Xmax为钻孔测井数据的最大值,Xmid为钻孔测井数据的中间值,X为初始钻孔测井数据;式4中,Xmin为钻孔测本文档来自技高网
...

【技术保护点】
1.一种综合地质钻孔测井岩性识别方法,其特征在于该方法至少包括以下步骤:/n1.获取钻孔测井数据;/n2.对钻孔测井数据进行精化处理,得到精化数据集,精化处理步骤如下;/n2.1判断钻孔测井数据数据特征类型列表是否存在空缺,若出现空缺,则选用均值填补、中值填补、众数填补、任意值填补任一方式填补数据至该空缺部分;/n2.2根据钻孔测井数据中各个岩性类别下的数据量与标准钻孔测井数据中各个岩性类别下的数据量进行比对,若岩性分类的数据量不相等,则存在数据不均衡情况,利用SMOTE过采样算法对钻孔测井数据集进行均衡处理;/n2.3采用线性函数法对钻孔测井数据进行归一化处理,得到精化数据集;/n3.根据t-SNE算法对精化数据集进行降维处理,降维处理步骤如下:/n3.1设定好降至的维数;/n3.2为体现数据相似度,采用条件概率表达选出的数据样本在空间中的投射距离,其中高维空间数据样本用高斯分布来表达样本在空间中的投射距离,低维数据用t分布来表达特性相近样本在空间中的投射距离,其中高维空间数据样本的条件概率P

【技术特征摘要】
1.一种综合地质钻孔测井岩性识别方法,其特征在于该方法至少包括以下步骤:
1.获取钻孔测井数据;
2.对钻孔测井数据进行精化处理,得到精化数据集,精化处理步骤如下;
2.1判断钻孔测井数据数据特征类型列表是否存在空缺,若出现空缺,则选用均值填补、中值填补、众数填补、任意值填补任一方式填补数据至该空缺部分;
2.2根据钻孔测井数据中各个岩性类别下的数据量与标准钻孔测井数据中各个岩性类别下的数据量进行比对,若岩性分类的数据量不相等,则存在数据不均衡情况,利用SMOTE过采样算法对钻孔测井数据集进行均衡处理;
2.3采用线性函数法对钻孔测井数据进行归一化处理,得到精化数据集;
3.根据t-SNE算法对精化数据集进行降维处理,降维处理步骤如下:
3.1设定好降至的维数;
3.2为体现数据相似度,采用条件概率表达选出的数据样本在空间中的投射距离,其中高维空间数据样本用高斯分布来表达样本在空间中的投射距离,低维数据用t分布来表达特性相近样本在空间中的投射距离,其中高维空间数据样本的条件概率Pij通过如下公式获得:



式中,xi和xj为数据样本中表示同一岩性的数据在高维空间的数据点,σi为以xi为中心点的高斯分布方差;xk和xl为数据集中的数据映射在高维空间中的数据点,其中低维空间数据样本的条件概率qij通过如下公式获得:



式中,yi和yj分别为高维数据点xi和xj映射于低维的数据点;yk和yl为高维空间数据点xk和xl映射与低维空间的数据点;
其中离群点X’i的条件概率p’ij通过如下公式获得:



式中,Pj|i为以xi为中心的xj与xi之间的条件概率,Pi|j为以xj为中心的xi与xj之间的条件概率;
3.3将转换后的低维数据用Kullback-Leibler散度进行表达,具体的代价函数如下:



式中,Pij为高维空间数据样本的条件概率,qij为低维空间数据样本的条件概率,C和KL(P||Q)为条件概率Pij与条件概率qij的信息熵的差值;对代价函数进行梯度求解的公式如下:



式中,C为条件概率Pij与条件概率qij的信息熵的差值,yi和yj分别为高维数据点xi和xj映射于低维的数据点,Pij为高维空间数据样本的条件概率,qij为低维空间数据...

【专利技术属性】
技术研发人员:张夏林谢俊李章林翁正平张明林吴冲龙祝洪涛何昆洋刘洋刘刚田宜平孙青王晋
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1