System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于岩石分类,具体涉及一种基于机器学习和锆石成分识别花岗岩类型的方法及系统。
技术介绍
1、开展区域找矿勘查和成矿潜力评价通常需要查明研究区的花岗质岩浆事件和成因类型,这是由于花岗岩成因类型与许多热液矿床之间具有密切的成因联系,并且花岗岩成因类型还能指示与之相关矿产的成矿构造环境。例如i型花岗岩通常与斑岩铜矿床有关,形成于火山弧环境,而s型花岗岩通常与w-sn矿床有关,形成于陆陆碰撞造山带。
2、目前,在矿产普查阶段,地质工作者通常采用岩石(基岩)测量方法以及土壤采样和水系采样等地球化学勘查方法,以查明区域花岗质岩浆事件和成因类型。然而,常用的岩石(基岩)测量方法通常面临采样受主观影响大、区域代表性差的问题,而土壤采样和水系采样等地球化学勘查方法的物力、人力成本较高。
3、锆石是花岗岩中一种常见的副矿物,成分十分稳定,在花岗岩蚀变和风化之后仍然能够保持原有的成分信息。因此,锆石成为花岗岩风化产物中的重要组成。相对于岩石(基岩)测量方法,花岗岩风化形成的碎屑锆石能够记录一个较大区域的花岗岩类型,因此其可能成为一种潜在的找矿勘查利器。另外,相对于土壤采样和水系采样等地球化学勘查方法,碎屑锆石采集方法简单,极大降低了人力和物力成本。
4、然而,尽管前人研究指出锆石成分能够指示花岗岩成因类型,从而可以用来指导区域找矿勘查,但是运用锆石区分花岗岩成因类型也面临一些问题。研究发现,锆石的微量元素除受熔体成分控制外,还受温度、结晶先后顺序等多种因素控制,而传统方法难以确定这些不同因素的相对贡献,这
技术实现思路
1、本专利技术实施例提供一种基于机器学习和锆石成分识别花岗岩类型的方法及系统,以解决现有技术难以确定不同因素对花岗岩类型识别的影响,导致利用锆石成分判定花岗岩类型的准确率较低的问题。
2、为了解决上述技术问题,本专利技术实施例公开了如下技术方案:
3、本专利技术的一个方面提供一种基于机器学习和锆石成分识别花岗岩类型的方法,所述方法包括:
4、获取多个锆石样品的信息数据,所述信息数据至少包括样品中含有元素的名称和含量值,以及,对应的花岗岩类型,所述花岗岩类型为i型花岗岩、s型花岗岩或a型花岗岩;
5、根据锆石样品的信息数据构建锆石数据集,所述锆石数据集中每个样本均包含多种预设元素特征的数据及对应的花岗岩类型;
6、对锆石数据集中的样本进行预处理,并基于特征工程的方式在所有种预设元素特征中筛选出训练元素特征;
7、将预处理后的锆石数据集按照预设比例随机划分为训练数据集和测试数据集,所述训练数据集和所述测试数据集中的样本均仅包含训练元素特征的数据及对应的花岗岩类型;
8、利用训练数据集,采用支持向量机svm算法训练svm模型;
9、利用训练数据集,采用随机森林rf算法训练rf模型;
10、利用训练数据集,采用多层感知器mlp算法训练mlp模型;
11、在训练过程中,基于训练数据集分别同步对svm模型、rf模型和mlp模型进行性能评估,获得对应的性能评估结果,所述性能评估结果至少包括准确率;
12、采用网格搜索参数优化方法,以及,svm模型、rf模型和mlp模型各自对应的性能评估结果,分别对svm模型、rf模型和mlp模型的参数进行优化处理,得到优化后svm模型、rf模型和mlp模型;
13、基于测试数据集分别对优化后的svm模型、rf模型和mlp模型进行性能评估,获得每个模型对应的准确率,选择准确率最高的模型作为最终的预测模型;
14、获取待预测锆石中含有元素的名称和含量值并生成输入数据,所述输入数据具有所有种训练元素特征;将所述输入数据输入所述预测模型,根据输出数据确定待预测锆石的源岩所对应的花岗岩类型。
15、可选的,根据锆石样品的信息数据构建锆石数据集,包括:
16、判断是否存在信息数据一致的两个或两个以上锆石样品,
17、如果是,将信息数据一致的锆石样品作为一组重复样品;
18、针对每组重复样品,均保留其中一个样品的信息数据并删除剩余样品的信息数据;
19、预先选取第一预设数量种稀土元素特征和第二预设数量种微量元素特征作为预设元素特征;
20、根据样品中含有元素的名称及含量值,判断是否存在具有所有种预选微量元素特征的样品,
21、如果是,将所述样品作为待保留样品;
22、针对每个待保留样品,均执行以下步骤:
23、判断所述待保留样品是否具有所有种预选稀土元素特征,
24、如果是,根据所述待保留样品的信息数据生成一个样本加入锆石数据集;
25、如果否,确定所述待保留样品中缺少的预选稀土元素特征;
26、针对所述待保留样品中缺少的每种预选稀土元素特征,均执行以下步骤:
27、判断所述待保留样品是否具有与所述缺少的预选稀土元素特征在元素周期表中相邻的两种稀土元素特征,
28、如果是,利用相邻两种稀土元素特征的数据,采用内插法计算得到所述缺少的预选稀土元素特征的数据,并补充至所述待保留样品的信息数据,直至所述待保留样品具有所有种预选稀土元素特征;
29、根据补充完全的待保留样品的信息数据生成一个样本加入锆石数据集。
30、可选的,所述对锆石数据集中的样本进行预处理,并基于特征工程的方式在所有种预设元素特征中筛选出训练元素特征,包括:
31、对锆石数据集的样本进行数据清洗处理,删除满足预设清洗条件的样本;
32、统计清洗后锆石数据集中,每种花岗岩类型对应的样本数量;对样本数量小于预设样本量的花岗岩类型所对应的样本进行过采样处理,或者,对样本数量大于预设样本量的花岗岩类型所对应的样本进行欠采样处理,得到数据平衡的锆石数据集;
33、针对数据平衡后的锆石数据集中每一个样本,均采用对数转换的方式对所述样本中每个预设元素特征的数据进行标准化处理;
34、基于标准化处理后的锆石数据集,采用lasso回归模型在预设元素特征中选取出不存在多重共线性关系的训练元素特征。
35、可选的,所述利用训练数据集,采用支持向量机svm算法训练svm模型;包括:
36、采用非线性映射方法,将训练数据集每个样本中训练元素特征的数据和对应的锆石成因类型映射到高维特征空间;
37、在所述高维特征空间中获得最优分类超平面;
38、根据最优分类超平面训练svm模型。
39、可选的,所述利用训练数据集,采用随机森林rf算法训练rf模型,包括:
40、基于训练数据集生成多个训练数据子集,其中,针对每个训练数据子集,均采用有放回的方式,在训练数据集中随机抽取预设样本数量个样本生成所述训练数据子集;
41、根据本文档来自技高网...
【技术保护点】
1.一种基于机器学习和锆石成分识别花岗岩类型的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,根据锆石样品的信息数据构建锆石数据集,包括:
3.根据权利要求2所述的方法,其特征在于,所述对锆石数据集中的样本进行预处理,并基于特征工程的方式在所有种预设元素特征中筛选出训练元素特征,包括:
4.根据权利要求1所述的方法,其特征在于,所述利用训练数据集,采用支持向量机SVM算法训练SVM模型;包括:
5.根据权利要求1所述的方法,其特征在于,所述利用训练数据集,采用随机森林RF算法训练RF模型,包括:
6.根据权利要求1所述的方法,其特征在于,所述利用训练数据集,采用多层感知器MLP算法训练MLP模型,包括:
7.根据权利要求1所述的方法,其特征在于,所述在训练过程中,基于训练数据集分别同步对SVM模型、RF模型和MLP模型进行性能评估,获得对应的性能评估结果;包括:
8.根据权利要求7所述的方法,其特征在于,所述采用网格搜索参数优化方法,以及,SVM模型、RF模型和MLP模
9.一种基于机器学习和锆石成分识别花岗岩类型的系统,其特征在于,所述系统包括:
...【技术特征摘要】
1.一种基于机器学习和锆石成分识别花岗岩类型的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,根据锆石样品的信息数据构建锆石数据集,包括:
3.根据权利要求2所述的方法,其特征在于,所述对锆石数据集中的样本进行预处理,并基于特征工程的方式在所有种预设元素特征中筛选出训练元素特征,包括:
4.根据权利要求1所述的方法,其特征在于,所述利用训练数据集,采用支持向量机svm算法训练svm模型;包括:
5.根据权利要求1所述的方法,其特征在于,所述利用训练数据集,采用随机森林rf算法训练rf模型,包括:
6.根据权利要求1所...
【专利技术属性】
技术研发人员:钟世华,李晶,李三忠,郭广慧,杜立华,赵鸿,
申请(专利权)人:中国海洋大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。