【技术实现步骤摘要】
基于地统计加权随机森林的地球化学变量空间预测方法
[0001]本专利技术涉及地质勘查领域,具体是基于地统计加权随机森林的地球化学变量空间预测方法。
技术介绍
[0002]勘查地球化学手段在过去几十年的找矿工作中发挥了举足轻重的作用。随着露头矿和浅表矿逐渐被发现殆尽,找矿难度日益增大,如何在复杂地质条件下挖掘有用的地球化学信息,已经成为缓解目前矿产资源紧缺形势的重要途径。地球化学分布模式是原生和次生地质过程、人类活动等长期共同作用的结果。受区域地质背景、矿体埋深、矿化类型及规模、风化强度以及地球化学景观等的影响,地球化学元素在表生介质中呈现十分复杂的变异特征,导致地球化学异常识别结果存在很大的不确定性,从而增加了勘查风险,限制了勘查地球化学手段的找矿成效。因此,准确模拟地球化学元素含量的空间分布,并刻画其不确定性显得尤为重要。
[0003]随机森林由于具有模型简单、准确度高、可解释性强等优点,在地球化学元素含量空间分布模拟中具有较大应用潜力。然而,经典随机森林算法潜在假设样本是独立同分布的,并未考虑元素含量分布的空间异 ...
【技术保护点】
【技术特征摘要】
1.基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,包括以下步骤:S1、获取训练随机森林模型所需的训练数据,所述训练数据包括输入变量和模型输出变量,输入变量包括地质要素和遥感要素,地质要素包括从区域地质数据提取的岩性类别数据和从区域地质数据提取的线环构造矢量数据转换的断裂密度,遥感要素包括地形坡度和植被覆盖度,模型输出变量为已知地球化学元素含量观测数据;其中,输入变量和输出变量采用栅格格式存储;S2、根据输入变量与已知地球化学元素含量观测数据之间的相关系数及输入变量之间的相关性筛选输入变量作为预测因子,将已知地球化学元素含量观测数据与预测因子作为训练样本;S3、基于训练样本训练随机森林模型,并采用训练好的随机森林模型对待预测位置的地球化学元素含量进行预测。2.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,所述步骤S1中将线环构造矢量数据转换为断裂密度的转换公式为:其中,i表示栅格的行,j表示栅格的列,ρ
ij
为第i行第j列栅格的断裂密度,L
ij
为对应栅格内线性断裂和环形断裂的总长度,S为栅格的面积;所述步骤S1中岩性类别数据为将区域地质数据中的岩性分布数据转换的类别变量,即c
ij
∈{C
k
,k=1,2,
…
n}其中,n为岩性类别总数,C
k
表示n种岩性类别中的第k种岩性,c
ij
代表栅格位置(i,j)处的岩性类别。3.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,所述步骤S1还包括对遥感数据进行辐射校正处理,并利用以下公式计算归一化植被指数:其中,i表示栅格的行,j表示栅格的列,NDVI
ij
为栅格位置(i,j)处的植被指数,为近红外波段处的反射率,为红光波段处的反射率。4.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,所述步骤S1还包括以下已知地球化学元素含量观测数据处理步骤:迭代剔除位于区间[μ
m
‑
3σ
m
,μ
m
+3σ
m
]之外的已知观测值,其中,μ
m
为第m个元素的均值,σ
m
为迭代过程中第m个元素的标准差;对低于检测限的观测值用相应元素检测限的一半代替;对缺失值用对应元素的均值补全;采用中心对数比变换法对已知多元地球化学元素含量观测数据进行处理,处理公式如下:
其中,x
m
和z
m
分别代表第m个元素变换前后的值,D代表元素个数。5.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,所述步骤S1在获取训练随机森林模型所需的训练数据后还包括以下步骤:采用待预测区域掩膜文件对栅格数据进行裁剪,并统一数据的坐标系。6.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,所述步骤S2中根据输入变量与已知地球化学元素含量观测数据之间的相关系数及输入变量之间的相关性筛选输入变量包括以下步骤:计算各个输入变量与已知地球化学元素含量观测数据之间的相关系数并剔除弱相关性输入变量,再计算各个输入变量之间的相关性,任意两个输入变量之间相关性大于设定阈值时保留其一。7.根据权利要求6所述的基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,所述计算各个输入变量与已知地球化学元素含量观测数据之间的相关系数、计算各个输入变量之间的相关性均包括以下步骤:对于连续型数据,计算Pearson相关系数,对于离散型数据,计算Spearman秩相关系数;计算各个输入变量与已知地球化学元素含量观测数据之间的相关系数时若相关系数绝对值|r|<0.3,则剔除该属性特征。8.根据权利要求1所述的基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,所述步骤S3包括以下步骤:S31、定义模拟栅格图层和滑动窗口半径序列,以及确定随机森林模型中决策树的数目和决策树节点划分时属性的数目;S32、按照从左到右,从上到下的顺序遍历栅格单元,对于当前需预测地球化学元素含量值的栅格位置,利用紧凑度指数确定最佳滑动窗口半径;S33、计算空间邻域观测点的空间权重:提取最佳窗口内的训练样本,通过全局变差函数模型和克立格方程组求解训练样本的权重;S34、训练地统计加权随机森林模型:采用地统计加权的均方根误差函数作为改进的目标函数,训练随机森林回归模型;S35、预测地球化学元素含量未知点处的取值:将待预测位置s处的预测因子值输入步骤S34训练好的随机森林模型,预测地球化学元素含量值;S36、重复步骤S32~步骤S...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。