【技术实现步骤摘要】
一种基于模糊理论与集成学习对地质勘查的空间插值方法
[0001]本专利技术涉及一种基于模糊理论与集成学习对地质勘查的空间插值方法,属于地质空间数据插值领域。
技术介绍
[0002]目前,在对地质勘查的实际场景中进行空间数据分析时,往往希望得到的是能够包含所有地质勘查研究区域的所有属性数据。但考虑到人力、时间成本和实际地形地貌等情况,大部分的空间数据来源于实地测量、工程钻探、站点监测等方法,得到的数据往往都是在空间上离散、稀疏、分布不均匀的三维数据点,为了能够得到取样点之外的数据,往往通过空间数据插值进行数据外推。
[0003]传统的数据插值通常采用多项式内插、样条内插和最小二乘法内插等方法来外推得到取样点之外的属性信息,但这些方法往往存在效果较差、精度低、得到数据单一、无法刻画较大的数据波动等问题,并且由于未考虑到实际的空间地形,无法刻画较大的空间变异性。而在空间数据中常用的反距离权重插值、自然邻域插值、克里金插值等方法各有优缺点。反距离权重插值法通过与样本点距离大小赋予权重,距离近的样本点被赋予较大的权重受该样本点 ...
【技术保护点】
【技术特征摘要】
1.一种基于模糊理论与集成学习对地质勘查的空间插值方法,其特征在于包括如下步骤:(1)样本数据预处理:对地质勘查数据中属性缺失和属性异常的样本数据进行预处理,并输入计算所需的相关参数,所需输入的参数包括样本数据集S、待插值数据集SP、中心观测点强作用距离R0、观测点数量n和平均绝对百分比误差率阈值ε;(2)设立中心观测点:将中心观测点定义为包括中心观测点位置与在空间中中心观测点强作用距离R0信息的向量,并将其加入样本数据集S中;(3)完善样本数据集:以中心观测点为参照,迭代选取其他观测点,并将其加入样本数据集中;其中其他观测点为通过定义样本空间中的复合距离,选取某一观测点的初始位置,再根据该初始位置附近样本数据集的局部特征调整该观测点位置,确定该观测点的最终位置;(4)训练观测模型:训练各个观测点相对于样本数据集的观测模型,首先对每个观测点的插值模型进行预训练,再通过预训练结果评估当前模型选择是否合理,最后确定全部n个观测点选择的插值模型;(5)计算插值结果:将各个观测点及观测模型迁移到待插值空间中,构建待插值点模糊系统,并计算各个待插值点的插值结果。2.根据权利要求1所述的基于模糊理论与集成学习对地质勘查的空间插值方法,其特征在于:所述步骤(1)中的数据预处理具体要求为:1)属性值缺失的样本数据:使用基于层次聚类的缺失值插补方法填补缺失的属性值;2)属性值异常的样本数据:使用箱型图的四分位距检测并剔除属性值异常的样本数据。3.根据权利要求1所述的基于模糊理论与集成学习对地质勘查的空间插值方法,其特征在于:在步骤(2)中通过计算并赋值的方式,将中心观测点加入样本数据集中,其中的中心观测点的定义如式1所示:[X
0 Y
0 Z
0 R0]
ꢀꢀꢀꢀ
式1式中:R0为中心观测点的强作用距离,其含义为以中心观测点为球心,R0为半径的球形区域内不再选取其他观测点;X0、Y0、Z0表示中心观测点在空间中不同维度的位置信息,其位置与样本数据集S的密度中心位置一致;当目标属性为T时,按照式2对中心观测点的位置向量X0、Y0、Z0进行计算:式中:∑Ti表示当前样本数据集S中全部样本点属性T值的和;∑TiXi、∑TiYi和∑TiZi分布表示当前样本数据集S中全部样本点X坐标值、Y坐标值和Z坐标值与其对应属性T值乘
积的和。4.如权利要求1所述的基于模糊理论与集成学习对地质勘查的空间插值方法,其特征在于:在步骤(3)中,按照以下步骤对第J个观测点进行选取:1)观测点初始位置的计算:选取第J个观测点的初始位置时,样本数据集S中某一点i被选为第J个观测点初始位置的概率P
i
(J)满足式3:其中Σdist(i,j)表示该点i距已经选择的全部n
‑
J个观测点复合距离的和,该复合距离由两点在位置空间中的距离与属性空间中的距离共同决定,对空间中的两点i与j来说,两者间的复合距离由式4计算得来:dist(i,j)=dist(z
i
,z
j
)+dist(t
i
,t
j
)
ꢀꢀꢀꢀ
式4式中:dist(z
i
,z
j
)由两点在空间中的位置信息决定,计算方式如式5所示;dist(t
i
,t
j
)由两点在空间中的属性信息决定,计算方式如式6所示:由两点在空间中的属性信息...
【专利技术属性】
技术研发人员:许纹赫,张夏林,郭辰颢,金梦楠,史科理,翁正平,李章林,陈麒玉,
申请(专利权)人:中国地质大学武汉,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。