基于EBK回归分析的地质覆盖层插值方法技术

技术编号:36786434 阅读:21 留言:0更新日期:2023-03-08 22:29
本发明专利技术提出一种基于EBK回归分析的地质覆盖层插值方法,具体步骤为:步骤S1:根据数据采集结构提取地质覆盖层数据;步骤S2:针对输变电工程勘察数据进行清洗及预处理,同时置备实验区域地形高程数据及坡度数据;步骤S3:对清洗后的数据做探索性分析,确定地质覆盖层数据空间分布方式和数值分布进行变换,制备并判断解释变量相关性;步骤S4:利用地质先验知识及地形数据进行回归分析,拟合勘探点钻孔数值得到半变异函数分布,以此对插值区域进行数值预测。测。测。

【技术实现步骤摘要】
基于EBK回归分析的地质覆盖层插值方法


[0001]本专利技术属于输变电工程勘测数据处理
,具体涉及一种基于EBK回归分析的地质覆盖层插值方法。

技术介绍

[0002]输变电工程勘测过程中产生大量数据,数据的使用往往局限在特定项目本身。通过收集过往工程项目的地质勘探数据,利用统计学方法对数据进行分析与插值,绘制相关属性的地质分布图具有较大工程应用效益。为了满足地质覆盖层绘制需求,需设计具有地学特点的数据插值方法。
[0003]现有统计方法通常分为确定性插值方法与地统计学方法。确定性方法中主要是:反距离权重法、多项式插值法、径向基函数法,其主要思想是利用输入数据拟合多项式或距离加权函数,并利用该函数计算指定位置的数值。
[0004]地统计学法中最重要的一类是克里金法,克里金法假设插值内容具有空间自相关性,通过输入的样本对特定区域进行地质属性值的分布参数统计,并利用分布方式及空间变异函数进行指定位置数值的概率预测。
[0005]以克里金插值为例,其大致包括以下步骤:步骤1、数据提取:获取地质覆盖层数据与转孔位置。
[0006]步骤2、数据清洗:清理地质数据中存在错误属性类型的勘探点;针对地质数据进行空间可视化操作,清除实验区域位置外的数据点。
[0007]步骤3、普通克里金插值a、引入勘探点数据b、根据地质数据选择合适的指数型半变异函数,对所有勘探点数据进行半变异函数的估计,得到一个确定的半变异函数。
[0008]c、计算插值位置与附近勘探点数据的距离,使用半变异函数计算该插值位置与对应勘探点数据的半方差,并以勘探点距离作为权重加权平均该位置的最终预测值。
[0009]传统方法人为干预少,同时步骤较为简单,能够快速有效得到大范围的地质分布特点。但是,仅仅通过勘探点数据无法准确预测未采样区域的覆盖层厚度。同时,由于地质覆盖层数据为不稳定的数据,未对数据先进行区域划分,无法有效控制样本数据的影响范围,造成方差估计量的偏差。

技术实现思路

[0010]现有技术方案无论是确定性插值方法或地统计学方法在数据分布充足且均匀情况下具有良好的插值效果。但在具体工程中,地质条件复杂,无法很好满足计算前提。为解决这一问题,本专利技术设计采用EBK结合回归分析进行地质覆盖层插值预测。
[0011]EBK:经验贝叶斯克里金法(Empirical Bayesian Kriging),统计学中的插值方法。
[0012]本专利技术方案的步骤为:步骤S1:根据数据采集结构提取地质覆盖层数据;步骤S2:针对输变电工程勘察数据进行清洗及预处理,同时置备实验区域地形高程数据及坡度数据;步骤S3:对清洗后的数据做探索性分析,确定地质覆盖层数据空间分布方式和数值分布进行变换,制备并判断解释变量相关性;步骤S4:利用地质先验知识及地形数据进行回归分析,拟合勘探点钻孔数值得到半变异函数分布,以此对插值区域进行数值预测。
[0013]本专利技术具体采用以下技术方案:一种基于EBK回归分析的地质覆盖层插值方法,其特征在于,包括以下步骤:步骤S1:数据提取:根据数据结构特点,读取地质勘探点信息采集表中的地质数据及勘探点空间位置;步骤S2:地质数据清洗及解释变量的置备:清理地质数据中存在错误属性类型的勘探点;针对地质数据进行空间可视化操作,清除实验区域位置外的数据点,并置备地理回归需要采用的高程数据,利用高程数据计算实验区域各位置坡度;步骤S3:数据探索:用于了解数据本身相关统计信息以制定后续步骤中的插值方式;步骤S4:进行EBK回归分析,计算得到所有实验区域位置的预测值。
[0014]进一步地,在步骤S3中,首先,结合覆盖层数值特点设置0.2m厚度为一个步长,统计各直方的频数,利用直方图观察勘探点覆盖层数值是否呈现正态分布;若数据非正态分布,则利用包括对数变换、平方根变换、倒数变换的变换方式的其中之一,将数据分布形式转换为正态分布;其次,判断覆盖层数值与地形及坡度的关系,通过制作三维散点图,确定采用高程及坡度数据作为函数估计的解释变量。
[0015]进一步地,步骤S4具体包括以下步骤:步骤S41:引入勘探点数据及解释变量;步骤S42:对勘探点进行约束聚类:指定类簇尺寸,设置类簇重叠比例;对勘探点进行基于尺寸约束的K

means聚类,假设共有N个勘探点,每个类簇上限为T,则有K = [N//T]+1个类簇,类簇间允许有共同点;对各个类簇计算最小凸边界计算;步骤S43:回归方程估计;使用最小二乘法对类簇最小凸边界计算范围内估算高程、坡度与覆盖层厚度的回归方程;步骤S44:对步骤S42中生成的所有类簇估计半变异函数γ1(h),函数类型采用指数函数;步骤S45:使用所述半变异函数及回归方程计算所有勘探点所在位置的模拟值;并用新的模拟值估计新的半变异函数γ2(h);步骤S46:重复步骤S45共计N次,得到M个半变异函数,统计M个半变异函数分布;步骤S47:应用变异函数分布及回归方程,计算得到所有实验区域位置的预测值。
[0016]以及,一种基于EBK回归分析的地质覆盖层插值装置,其特征在于:包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述的基于EBK回归分析的地质覆盖层插值方法。
[0017]以及,一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于:该计算机程序被处理器执行时实现如上所述的基于EBK回归分析的地质覆盖层插值方法。
[0018]与现有技术相比,本专利技术及其优选方案提出的方法基于:随着距离增加,插值位置
的预测值与样本点的不确定性会逐渐增加,符合地质先验知识。利用聚类划分好勘探点类簇,通过拟合类簇的数据,在较少方差估计量偏差的同时得到整体误差分布规律;同时在控制整体误差保持在较低水平的状态下,结合地形解释变量得到更为准确的地质覆盖层分布预测。
附图说明
[0019]下面结合附图和具体实施方式对本专利技术进一步详细的说明:构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图 1 是本专利技术实施例总体方案流程图。
具体实施方式
[0020]为让本专利的特征和优点能更明显易懂,下文特举实施例,作详细说明如下:下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。通常在此处的附图中的描述和示出的组件可以以不同配置来组合设计。因此,以下对在附图中提供的本专利技术的选定实施例的详细描述并非为了限制要求保护的本专利技术的范围,而是仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例都属于本专利技术保护的范围。
[0021]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于EBK回归分析的地质覆盖层插值方法,其特征在于,包括以下步骤:步骤S1:数据提取:根据数据结构特点,读取地质勘探点信息采集表中的地质数据及勘探点空间位置;步骤S2:地质数据清洗及解释变量的置备:清理地质数据中存在错误属性类型的勘探点;针对地质数据进行空间可视化操作,清除实验区域位置外的数据点,并置备地理回归需要采用的高程数据,利用高程数据计算实验区域各位置坡度;步骤S3:数据探索:用于了解数据本身相关统计信息以制定后续步骤中的插值方式;步骤S4:进行EBK回归分析,计算得到所有实验区域位置的预测值。2.根据权利要求1所述的基于EBK回归分析的地质覆盖层插值方法,其特征在于:在步骤S3中,首先,结合覆盖层数值特点设置0.2m厚度为一个步长,统计各直方的频数,利用直方图观察勘探点覆盖层数值是否呈现正态分布;若数据非正态分布,则利用包括对数变换、平方根变换、倒数变换的变换方式的其中之一,将数据分布形式转换为正态分布;其次,判断覆盖层数值与地形及坡度的关系,通过制作三维散点图,确定采用高程及坡度数据作为函数估计的解释变量。3.根据权利要求1所述的基于EBK回归分析的地质覆盖层插值方法,其特征在于:步骤S4具体包括以下步骤:步骤S41:引入勘探点数据及解释变量;步骤S42:对勘探点进行约束聚类:指定类簇尺寸,设置类簇重叠比例;对...

【专利技术属性】
技术研发人员:颜琰郭威陈熙隆张成炜肖方顺林少远陈晓敏王春丽黄典祖张娜高献曾庆权张长飞
申请(专利权)人:国网福建省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1