System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于锆石成分预测斑岩型矿床类型和储量的机器学习方法技术_技高网

基于锆石成分预测斑岩型矿床类型和储量的机器学习方法技术

技术编号:40807812 阅读:15 留言:0更新日期:2024-03-28 19:30
本发明专利技术提供了一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法,包括:数据库建设、数据预处理、机器学习ML方法、特征重要性分析、模型内置的计算方法、SHAP值方法、LightGBM算法、五折交叉验证、XGBoost算法、数据标准化、数据不平衡处理、缺失值处理、异常值处理。通过本发明专利技术的技术方案,通过广泛的数据搜集,构建矿床类型和铜钼储量有关的锆石数据库。利用机器学习算法建立分类模型,并进行特征重要性分析,对金属在斑岩中富集的规律进行解译。最后,将会做一个乌努格吐山矿床的案例分析,验证模型可靠性的同时为模型的使用提供范本。

【技术实现步骤摘要】

本专利技术涉及地质调查和矿产勘查,具体而言,特别涉及一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法


技术介绍

1、锆石(zrsio4)是斑岩型矿床中广泛存在的一种副矿物,它具有稳定的晶体结构,很难被后期热液流体蚀变。锆石的微量元素可靠地记录了研究矿化过程和物质来源的信息,成为研究斑岩型矿床的有效工具。锆石中的ce和eu含量与氧化还原条件有关,因而可以根据ce和eu估算环境的氧逸度。eu含量岩浆水含量的间接控制,eu异常eu/eu*≥0.4被认为是区分矿床富矿或贫矿的标志。ti可以在sio2和tio2缓冲系统中用来计算岩浆温度。th和u含量与岩浆结晶分异程度呈正相关、th/u、yb/dy和lu/gd等元素比值岩浆的结晶分异呈负相关,受角闪石、磷灰石、榍石结晶控制。过去,统计发现中国东北地区斑岩钼矿床的大小与氧逸度有正相关关系,但是铜矿,尤其是>10mt的铜矿,很难与氧逸度建立线性关联。这可能是由于斑岩铜矿的形成中其他因素如水含量、温度等的影响,难以通过单一因素给建立紧密关联。机器学习是一门致力于让计算机系统能够通过学习数据和经验,并中发现模式、规律的学科,可以帮我们做出准确的预测和决策。机器学习方法已经被用到斑岩型矿床的勘探中,在岩石地球化学数据的基础上采用随机森林、svm、人工神经网络、逻辑回归算法,发现低mn、高al、高sr、高k和铲状ree模式是与富矿岩浆有关的最重要参数。锆石成分与斑岩肥化的关系也被详细研究过,通过随机森林算法建立锆石的矿床分类模型,可以从众多矿床中识别斑岩型矿床。对比随机森林和深度神经网络算法,发现eu/eu*、eu/eu*/y、ce/nd、ce/ce*、dy、hf和ti是区分矿床富矿或贫矿的重要参数。相似地,采用随机森林算法发现锆石的eu、ce和dy是鉴别富矿岩浆最重要的参数。

2、锆石的微量元素灵敏地记录了矿床形式时的温度、水含量和氧逸度,被广泛地用作斑岩型矿床的矿化示踪剂。以往的研究根据锆石微量元素含量或计算值提出一些指标和二元判别图,用于判断成矿潜力和预测金属储量。然而,在大规模的数据集中,这些指标和图的判别效率受到了一定的限制。这项研究基于锆石的微量元素,采用机器学习方法对不同斑岩型矿床类型分类并对不同储量等级的铜、钼矿床进行区分,旨在帮助找矿和勘探工作者更高效地判别盲矿体类别并能够有针对性地开采铜钼矿。


技术实现思路

1、为了弥补现有技术的不足,本专利技术提供了一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法。

2、本专利技术是通过如下技术方案实现的:一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法,其特征在于,具体包括以下步骤:

3、步骤s1数据库建设:

4、在pcr中搜集了来自全球17个国家82个斑岩铜矿床中的共计6032条锆石微量元素数据在pmr中搜集了来自37个矿床的1598条锆石微量元素数据,这些数据全部来自中国;pdt数据库是pcr,pmr的锆石数据在加上贫矿斑岩中锆石的数据,一共是9649条数据;pcr中按照铜储量将这些矿床标记为ⅰ、ⅱ、ⅲ、ⅳ、ⅴ共5个等级;pmr中按照钼储量将这些矿床标记为a, b, c共3个等级;pdt中,铜矿斑岩的锆石数据标记为cu,钼矿斑岩的锆石数据标记为mo,贫矿斑岩的锆石数据标记为barren;

5、步骤s2数据预处理:

6、步骤s2-1异常值处理:所有数据库中的la和pr元素被删除;采用四分位数间距法,利用数据的四分位数来测量数据的分散程度,并基于四分位数的差异来判断是否存在异常值;

7、步骤s2-2缺失值处理:

8、选用knn插值法填补空缺值,对于每个包含缺失值的数据点,计算它与数据集中所有其他数据点之间的距离;根据计算出的距离(公式1),选择与缺失值数据点最接近的k个(k=3)邻居,用于估计缺失值(公式2),

9、distance(a, b)= √(σni=1(ai-bi)2)  (公式1)

10、其中,a 和 b 是两个样本,n 是特征的数量;

11、 ŷ=(σk i=1 wi‧ yi)/(σk i=1 wi)  (公式2)

12、 ŷ是缺失值的估计, yi是邻居样本的已知值, wi是与邻居的距离相关的权重;

13、步骤s2-3数据标准化:

14、采用z-score方法进行数据标准化,将数据转换为具有均值为0和标准差为1的标准正态分布(公式3),

15、z = (x - μ) / σ  (公式3)

16、μ和σ分别为每个特征的均质和标准差。

17、步骤s2-4数据不平衡处理:

18、样本数量较少的类别将获得较高的权重(公式4),从而增加其在模型训练中的影响,

19、weightclass=(total samples)/(number of samples in class)  (公式4)

20、“weightclass”是类别的权重,“total samples”是总样本数,“number of samplesin class”是属于该类别的样本数;

21、步骤s3机器学习ml方法:

22、采用监督学习算法,自动地将数据分为训练集和测试集,设置为9:1,分别用来训练数据和检验;具体包括以下步骤:

23、步骤s3-1xgboost算法:

24、对于xgboost算法,首先定义目标函数,该函数由损失函数和正则化项组成,用于衡量模型拟合能力和控制模型复杂度(公式5);然后,通过迭代进行梯度提升,每轮迭代都计算损失函数的负梯度,以确定下一个弱学习器的权重;样本会根据之前的误差进行加权,以关注误分类的样本;最终,将所有弱学习器的预测结果组合,生成最终的模型预测;

25、objective = σni=1 l( yi, f( xi))+γ‧ω( f)  (公式5)

26、“objective”是目标函数,n是样本的数量, l( yi, f( xi))是损失函数,用于衡量模型预测 f( xi)与真是标签 yi之间的差异,γ是正则化项的系数,ω( f)是模型 f的正则化项;本文档来自技高网...

【技术保护点】

1.一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法,其特征在于,所述步骤S1中锆石微量元素数据包括Hf, U, Th, Y, Ti, Nb, Ta, REEs,∑REE, T(℃), Th/U, Hf/Y, Yb/Dy, EuN/EuN*, (EuN/EuN*)/Y, Ce/Nd, CeN/CeN*和△FMQ一共31个特征。

3.根据权利要求1所述的一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法,其特征在于,所述步骤S1中Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ的5个等级的范围为Ⅰ>100 Mt, 10 Mt <Ⅱ≤100 Mt, 1 Mt <Ⅲ≤10 Mt, 0.1 Mt <Ⅲ≤1 Mt, 0.01 Mt <Ⅲ≤0.1 Mt。

4.根据权利要求1所述的一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法,其特征在于,所述步骤S1中A、B、C的3个等级的范围为1<A≤10 Mt, 0.1<B≤1 Mt, 0.01<C≤0.1 Mt。

...

【技术特征摘要】

1.一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的一种基于锆石成分预测斑岩型矿床类型和储量的机器学习方法,其特征在于,所述步骤s1中锆石微量元素数据包括hf, u, th, y, ti, nb, ta, rees,∑ree, t(℃), th/u, hf/y, yb/dy, eun/eun*, (eun/eun*)/y, ce/nd, cen/cen*和△fmq一共31个特征。

3.根据权利要求1所述的一种基于锆石成分预测斑...

【专利技术属性】
技术研发人员:温子豪许博孙晓洁
申请(专利权)人:中国地质大学北京
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1