一种基于机器学习的砂岩型铀矿岩层类型识别方法及装置制造方法及图纸

技术编号:36538468 阅读:44 留言:0更新日期:2023-02-01 16:29
本发明专利技术公开了一种基于机器学习的砂岩型铀矿岩层类型识别方法及装置,方法包括:获取目标测井数据,进行格式转换与归一化预处理,并确定验证数据集与特征筛选数据集;基于特征筛选数据集确定输入特征,并基于样本数据库中的砂岩型铀矿钻井岩性分类,得到岩性类型;建立训练数据集和测试数据集,对预设的随机森林模型、支持向量机模型、K

【技术实现步骤摘要】
一种基于机器学习的砂岩型铀矿岩层类型识别方法及装置


[0001]本专利技术涉及地质分析
,尤其涉及一种基于机器学习的砂岩型铀矿岩层类型识别方法及装置。

技术介绍

[0002]岩性是岩石命名的基础,是颜色、质地、粒径和矿物成分的总体反映,准确识别盆地内地层的岩性对储层划分、油气层识别和油藏评价具有重要的意义。
[0003]砂岩型铀矿勘查是一项基于不同地质、地球物理和地球化学等手段的一种综合找矿活动,如寻找铀源、划定含铀砂岩体、定位氧化还原过渡带和确定砂岩成分等。划定含铀砂岩体是砂岩型铀矿勘查的最关键步骤之一,因为铀矿体都位于砂岩体内。因此,正确的岩性鉴定对这类铀矿床的勘探具有决定性意义。
[0004]地质测井和测井解释是当下常用的获取地下岩性信息的手段。地质测井容易受到岩屑细小、混油钻井液污染、岩屑沉降等因素的影响,造成识别困难,进而影响整个剖面的完整绘制。在大多数情况下,测井解释通过地质测井进行校正,或者两者都相互验证。地质测井通常精度高,可靠性强,但效率低。相比之下,地球物理解释速度快,成本低,但准确性和可靠性较低。从测井数据中识别岩性的方法有交叉图法、曲线重叠法、统计法、结构特征参数法等,可以很直观的体现岩性分布和所在区域,但是工作量大,无法全面解释岩性信息,数理统计方法只适用于物理性质较好的测井资料。
[0005]因此,现有技术还有待改进和提高。

技术实现思路

[0006]本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于机器学习的砂岩型铀矿岩层类型识别方法及装置,旨在提供解决现有技术中识别岩性的方法存在准确性低、效率低或者可靠性低的问题。第一方面,本专利技术提供一种基于机器学习的砂岩型铀矿岩层类型识别方法,其中,所述方法包括:
[0007]获取目标测井数据,对所述目标测井数据进行格式转换以及归一化预处理,得到已处理的测井数据,并基于已经处理的测井数据确定验证数据集与特征筛选数据集;
[0008]基于所述特征筛选数据集确定输入特征,并基于样本数据库中的砂岩型铀矿钻井岩性分类,得到岩性类型,其中,所述输入特征为对钻井取芯采集的钻井数据曲线;
[0009]基于所述输入特征与所述岩性类型建立训练数据集和测试数据集,并基于所述训练数据集分别对预设的随机森林模型、支持向量机模型、K

近邻模型和逻辑回归算法分类模型进行训练与精度检验,得到对应的四种岩性识别模型;
[0010]基于所述测试样本集对所述四种岩性识别模型进行分类性能评价,从所述四种岩性识别模型中确定分类性能最优的岩性识别模型,得到目标岩性识别模型;
[0011]基于所述目标岩性识别模型对所述验证数据集进行岩性识别,得到岩性识别结果。
[0012]在一种实现方式中,所述对所述目标测井数据进行格式转换以及归一化预处理,得到已处理的测井数据,包括:
[0013]根据测井信息资料确定LAS或XLS格式的原始测井曲线,将所述原始测井曲线作为所述目标测井数据;
[0014]将所述目标测井数据的格式转换为CSV格式,并对格式转换后的所述目标测井数据进行归一化预处理,得到已处理的测井数据。
[0015]在一种实现方式中,所述对格式转换后的所述目标测井数据进行归一化预处理,得到已处理的测井数据,包括:
[0016]获取所述目标测井数据中占比95%的数据作为最大值、占比5%的数据作为最小值;
[0017]基于归一化计算公式对所述目标测井数据进行归一化处理,得到所述已处理的测井数据,所述已处理的测井数据的数值范围均分布在[0,1]之间;
[0018]其中,所述归一化计算公式为:
[0019][0020]其中,X是所述已处理的测井数据;x
i
是所述目标测井数据;x
min
是所述目标测井数据的最小值;X
max
是所述目标测井数据的最大值。
[0021]在一种实现方式中,所述钻井数据曲线包括:密度曲线,电阻率曲线,自然伽马曲线,井径曲线和自然电位曲线。
[0022]在一种实现方式中,所述基于所述输入特征与所述岩性类型建立训练数据集和测试数据集,包括:
[0023]基于所述输入特征与所述岩性类型确定学习数据样本;
[0024]将所述学习数据样本按照7:3的比例划分为所述训练数据集和所述测试数据集。
[0025]在一种实现方式中,所述基于所述训练数据集分别对预设的随机森林模型、支持向量机模型、K

近邻模型和逻辑回归算法分类模型进行训练与精度检验,得到对应的四种岩性识别模型,包括:
[0026]将所述训练数据集中2/3的数据作为样本集,将所述训练数据集中1/3的数据作为袋外数据;
[0027]利用所述样本集分别对所述随机森林模型、支持向量机模型、K

近邻模型和逻辑回归算法分类模型进行训练,得到四种岩性识别模型;
[0028]基于所述袋外数据对所述四种岩性识别模型进行精度检验,并使用混淆矩阵对所述四种岩性识别模型进行精度评价。
[0029]在一种实现方式中,所述基于所述测试样本集对所述四种岩性识别模型进行分类性能评价,从所述四种岩性识别模型中确定分类性能最优的岩性识别模型,得到目标岩性识别模型,包括:
[0030]基于所述测试样本集分别确定所述四种岩性识别模型所对应的分类结果;
[0031]根据所述分类结果,确定分类准确率、精确率及召回率参数,并基于分类准确率、精确率及召回率参数确定分类性能最优的岩性识别模型,作为所述目标岩性识别模型。
[0032]第二方面,本专利技术实施例还提供一种基于机器学习的砂岩型铀矿岩层类型识别装
置,其中,所述装置包括:
[0033]测井数据处理模块,用于获取目标测井数据,对所述目标测井数据进行格式转换以及归一化预处理,得到已处理的测井数据,并基于已经处理的测井数据确定验证数据集与特征筛选数据集;
[0034]数据筛选与分类模块,用于基于所述特征筛选数据集确定输入特征,并基于样本数据库中的砂岩型铀矿钻井岩性分类,得到岩性类型,其中,所述输入特征为对钻井取芯采集的钻井数据曲线;
[0035]识别模型训练模块,用于基于所述输入特征与所述岩性类型建立训练数据集和测试数据集,并基于所述训练数据集分别对预设的随机森林模型、支持向量机模型、K

近邻模型和逻辑回归算法分类模型进行训练与精度检验,得到对应的四种岩性识别模型;
[0036]目标模型确定模块,用于基于所述测试样本集对所述四种岩性识别模型进行分类性能评价,从所述四种岩性识别模型中确定分类性能最优的岩性识别模型,得到目标岩性识别模型;
[0037]岩性识别执行模块,用于基于所述目标岩性识别模型对所述验证数据集进行岩性识别,得到岩性识别结果。
[0038]第三方面,本专利技术实施例还提供一种终端设备,其中,所述终端设备为商显终端或者投本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的砂岩型铀矿岩层类型识别方法,其特征在于,所述方法包括:获取目标测井数据,对所述目标测井数据进行格式转换以及归一化预处理,得到已处理的测井数据,并基于已经处理的测井数据确定验证数据集与特征筛选数据集;基于所述特征筛选数据集确定输入特征,并基于样本数据库中的砂岩型铀矿钻井岩性分类,得到岩性类型,其中,所述输入特征为对钻井取芯采集的钻井数据曲线;基于所述输入特征与所述岩性类型建立训练数据集和测试数据集,并基于所述训练数据集分别对预设的随机森林模型、支持向量机模型、K

近邻模型和逻辑回归算法分类模型进行训练与精度检验,得到对应的四种岩性识别模型;基于所述测试样本集对所述四种岩性识别模型进行分类性能评价,从所述四种岩性识别模型中确定分类性能最优的岩性识别模型,得到目标岩性识别模型;基于所述目标岩性识别模型对所述验证数据集进行岩性识别,得到岩性识别结果。2.根据权利要求1所述的基于机器学习的砂岩型铀矿岩层类型识别方法,其特征在于,所述对所述目标测井数据进行格式转换以及归一化预处理,得到已处理的测井数据,包括:根据测井信息资料确定LAS或XLS格式的原始测井曲线,将所述原始测井曲线作为所述目标测井数据;将所述目标测井数据的格式转换为CSV格式,并对格式转换后的所述目标测井数据进行归一化预处理,得到已处理的测井数据。3.根据权利要求2所述的基于机器学习的砂岩型铀矿岩层类型识别方法,其特征在于,所述对格式转换后的所述目标测井数据进行归一化预处理,得到已处理的测井数据,包括:获取所述目标测井数据中占比95%的数据作为最大值、占比5%的数据作为最小值;基于归一化计算公式对所述目标测井数据进行归一化处理,得到所述已处理的测井数据,所述已处理的测井数据的数值范围均分布在[0,1]之间;其中,所述归一化计算公式为:其中,X是所述已处理的测井数据;x
i
是所述目标测井数据;x
iin
是所述目标测井数据的最小值;X
max
是所述目标测井数据的最大值。4.根据权利要求1所述的基于机器学习的砂岩型铀矿岩层类型识别方法,其特征在于,所述钻井数据曲线包括:密度曲线、电阻率曲线、自然伽马曲线、井径曲线和自然电位曲线。5.根据权利要求1所述的基于机器学习的砂岩型铀矿岩层类型识别方法,其特征在于,所述基于所述输入特征与所述岩性类型建立训练数据集和测试数据集,包括:基于所述输入特征与所述岩性类型确定学习数据样本;将所述学习数据样本按照7:3的比例划分为所述训练数据集和所述测试数据集。6.根据权利要求1或5所述的基于机器学习的砂岩型铀矿岩层类型识别方法,其特征在于,所述基于所述训练数据集分别对预设的随机森林模型、支持向量机模型、K

近邻...

【专利技术属性】
技术研发人员:李增华陈冠群郭福生许德如邓腾张鑫杨立飞尚培严兆彬李长圣罗文姝王新凯
申请(专利权)人:东华理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1