基于控矿要素制约的机器学习化探数据处理方法及系统技术方案

技术编号:38872248 阅读:12 留言:0更新日期:2023-09-22 14:08
本发明专利技术公开了一种基于控矿要素制约的机器学习化探数据处理方法及系统,涉及化探异常数据检测领域,方法包括:将研究区域的化探原始数据输入至地球化学异常识别模型中,得到化探原始数据对应的重构误差,并根据重构误差确定研究区域的多元地球化学异常;地球化学异常识别模型包括地质约束变分自动编码器网络和重构误差计算模块;其中,该网络的输入数据为化探原始数据,输出数据为重构后的化探数据,损失函数为将基于地质约束的损失函数以正则化项添加到原始变分自动编码器网络的损失函数后得到损失函数。本发明专利技术实现了带知识约束的机器学习模型的构建及提取地球化学异常识别的有效性和精确性。的有效性和精确性。的有效性和精确性。

【技术实现步骤摘要】
基于控矿要素制约的机器学习化探数据处理方法及系统


[0001]本专利技术涉及化探异常数据检测领域,特别是涉及一种基于控矿要素制约的机器学习化探数据处理方法及系统。

技术介绍

[0002]近年来,诸多学者开始并致力于基于机器学习的地球化学数据挖掘与模式识别,取得了许多创新性成果。如采用受限玻尔兹曼机、核马氏距离、单类支持向量机、孤立森林、高斯混合模型、Kohonen神经网络、关联规则算法、推荐系统算法,独立成分分析以及测度学习等算法实现了地球化学异常识别。此外,也对地球化学异常识别的机器学习方法进行了对比,如李苍柏等提供了对支持向量机、随机森林和人工神经网络算法在地球化学异常提取中的对比研究,构建了基于监督机器学习方法的地球化学异常提取流程;郑泽宇等提供了对基于非监督的地球化学异常识别算法(孤立森林和单类支持向量机)的对比研究,表明两种算法均可有效识别多元地球化学异常,但前者在数据处理耗时上表现略优。
[0003]如今,一些群体智能优化算法,如蚁群算法、Bat算法,也用于地球化学异常识别和提取,识别的异常信息与成矿相关的地质体具有较高的空间相关性。这些研究表明群体智能优化算法是一类行之有效的地球化学异常识别方法。此外,还有一些混合的方法,比如将卡尔曼滤波和盲抽取方法与支持向量机相结合,其中前者用于地球化学数据的融合及元素组合的提取,后者用于地球化学异常与背景信息的分离。混合方法充分吸收两种方法的优势,是地球化学数据处理的一种有益尝试。
[0004]深度学习作为一种具有多级非线性变换的层级机器学习算法,区别于一般的神经网络,深度学习强调通过更深层次的网络模型来学习和提取样本特征,并采用逐层训练和反向传播的方式解决全局最优解问题,可学习到多源找矿信息与矿床之间复杂的时空耦合关系,能够刻画常规方法无法发现的异常和模式,已经应用于矿致异常识别和矿产资源潜力评价。相关学者较早使用深度学习模型开展了复杂地质条件下的地球化学异常识别,如利用连续受限玻尔兹曼机有效识别了多元地球化学异常。在该模型的基础上,构建了基于深度自编码网络的多元地球化学异常识别模型。基于深度学习强大的特征提取能力,进一步构建了深度置信网络与单类支持向量机相结合的混合模型,将深度学习模型提取的深层次特征信息作为单类支持向量机异常检测算法的输入,有效地提取了多元地球化学异常。将深度自编码网络与基于密度的聚类算法相结合,利用深度自编码网络提取深层次的地球化学特征作为密度聚类算法的输入,进行多元地球化学异常识别和提取。通过构建基于层次聚类的堆栈降噪自编码网络来提取地球化学数据的深层次特征信息,作为非监督孤立森林异常检测算法的输入,有效地提取了浙西北地区铅锌银多金属矿的地球化学异常。这些研究发现深度学习模型不依赖勘查地球化学数据的分布假设,可处理复杂、非线性的空间模式,可识别传统方法无法识别的异常。与此同时,尝试使用全部地球化学变量,将大数据思维和深度学习方法相结合,以充分考虑元素组合的复杂性和多样性,为刻画具有非线性性特征的地球化学空间模式和提取隐式的异常提供了新途径,可更好的应用于地球化学异
常识别。
[0005]以上基于机器学习和深度学习的勘查地球化学数据处理忽略了地球化学数据的空间特性。深度学习算法结构复杂参数多,导致对未知数据解释能力欠佳,缺乏物理规律一致性,这制约了深度学习模型在矿致异常提取和矿产资源潜力评价中的进一步发展。然而,最主要缺点是大数据和深度学习模型的中间过程为“黑箱”,很难知道元素间的相互关系和内在联系,但这些信息具有特定的地质内涵,对矿床成因和矿产勘查具有重要的指示意义。
[0006]因此,结合勘查地球化学的特点,通过基于成矿规律研究下的控矿条件制约的机器学习和深度学习算法开展勘查地球化学大数据挖掘与集成,实现找矿模型和机器学习、理论驱动与数据驱动的有机融合是未来该领域的重要创新点。常规的基于纯数据驱动的机器学习方法,在科学问题推理中对训练数据拟合较好,然而由于机器学习或深度学习结构复杂、参数多,中间过程为黑箱,导致对未知数据解释能力欠佳,缺乏物理规律一致性。因此,即使黑箱的深度学习模型在经过一系列的模型调参后可达到较高的预测与分类精度,但缺乏对物理机制及领域知识的表达能力,以及无法提供更多可靠的信息,严重制约了深度学习模型在矿致异常提取和矿产资源评价中的进一步发展。

技术实现思路

[0007]本专利技术的目的是提供一种基于控矿要素制约的机器学习化探数据处理方法及系统,将基于地质约束的损失函数以正则化项添加到原始深度学习模型的损失函数,从而加速网络收敛,且使网络学习具有地质意义,最后结果识别精度更高。
[0008]为实现上述目的,本专利技术提供了如下方案:
[0009]本专利技术提供了一种基于控矿要素制约的机器学习化探数据处理方法,包括:
[0010]获取研究区域的化探原始数据;
[0011]将所述化探原始数据输入至地球化学异常识别模型中,得到所述化探原始数据对应的重构误差,并根据所述重构误差确定研究区域的多元地球化学异常;所述地球化学异常识别模型包括地质约束变分自动编码器网络和重构误差计算模块;
[0012]其中,地质约束变分自动编码器网络的输入数据为化探原始数据,地质约束变分自动编码器网络的输出数据为重构后的化探数据,地质约束变分自动编码器网络的损失函数为将基于地质约束的损失函数以正则化项添加到原始变分自动编码器网络的损失函数后得到损失函数;重构误差计算模块用于根据所述化探原始数据及对应的重构后的化探数据计算重构误差。
[0013]可选地,基于地质约束的损失函数的确定过程为:
[0014]选取地质要素,并在GIS环境下进行缓冲区分析;
[0015]分别统计缓冲区内落在不同缓冲间距处的矿床数,并根据矿床数计算矿床空间分布密度;
[0016]以缓冲区宽度为横坐标,以矿床空间分布密度为纵坐标,建立矿床空间分布密度与缓冲区距离的幂律函数;
[0017]对所述幂律函数进行归一化处理,计算不同缓冲区对矿床形成的约束权重;
[0018]根据约束权重,构建基于地质约束的损失函数。
[0019]可选地,选取地质要素,并在GIS环境下进行缓冲区分析,具体包括:
[0020]根据矿床所在区域的地质特征,确定控矿要素的影响范围,并根据控矿要素的影响范围,确定缓冲区的缓冲间距和缓冲距离。
[0021]可选地,以缓冲区宽度为横坐标,以矿床空间分布密度为纵坐标,建立矿床空间分布密度与缓冲区距离的幂律函数,具体包括:
[0022]以缓冲区宽度为横坐标,以矿床空间分布密度为纵坐标,绘制双对数散点图并拟合成直线,得到矿床空间分布密度与缓冲区距离的幂律函数。
[0023]可选地,基于地质约束的损失函数为:
[0024][0025]其中,loss
ρ
为基于地质约束的损失函数,x
i
为位置i处的证据图层数据,f(x
i
)为x
i
的重构数据,为位置i处的约束权重,ρ为矿床本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于控矿要素制约的机器学习化探数据处理方法,其特征在于,包括:获取研究区域的化探原始数据;将所述化探原始数据输入至地球化学异常识别模型中,得到所述化探原始数据对应的重构误差,并根据所述重构误差确定研究区域的多元地球化学异常;所述地球化学异常识别模型包括地质约束变分自动编码器网络和重构误差计算模块;其中,地质约束变分自动编码器网络的输入数据为化探原始数据,地质约束变分自动编码器网络的输出数据为重构后的化探数据,地质约束变分自动编码器网络的损失函数为将基于地质约束的损失函数以正则化项添加到原始变分自动编码器网络的损失函数后得到损失函数;重构误差计算模块用于根据所述化探原始数据及对应的重构后的化探数据计算重构误差。2.根据权利要求1所述的一种基于控矿要素制约的机器学习化探数据处理方法,其特征在于,基于地质约束的损失函数的确定过程为:选取地质要素,并在GIS环境下进行缓冲区分析;分别统计缓冲区内落在不同缓冲间距处的矿床数,并根据矿床数计算矿床空间分布密度;以缓冲区宽度为横坐标,以矿床空间分布密度为纵坐标,建立矿床空间分布密度与缓冲区距离的幂律函数;对所述幂律函数进行归一化处理,计算不同缓冲区对矿床形成的约束权重;根据约束权重,构建基于地质约束的损失函数。3.根据权利要求2所述的一种基于控矿要素制约的机器学习化探数据处理方法,其特征在于,选取地质要素,并在GIS环境下进行缓冲区分析,具体包括:根据矿床所在区域的地质特征,确定控矿要素的影响范围,并根据控矿要素的影响范围,确定缓冲区的缓冲间距和缓冲距离。4.根据权利要求3所述的一种基于控矿要素制约的机器学习化探数据处理方法,其特征在于,以缓冲区宽度为横坐标,以矿床空间分布密度为纵坐标,建立矿床空间分布密度与缓冲区距离的幂律函数,具体包括:以缓冲区宽度为横坐标,以矿床空间分布密度为纵坐标,绘制双对数散点图并拟合成直线,得到矿床空间分布密度与缓冲区距离的幂律函数。5.根据权利要求2所述的一种基于控矿要素制约的...

【专利技术属性】
技术研发人员:阴江宁
申请(专利权)人:中国地质科学院矿产资源研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1