基于空间约束多自编码器的多元地球化学异常识别方法技术

技术编号:17467964 阅读:50 留言:0更新日期:2018-03-15 05:19
本发明专利技术公开了基于空间约束多自编码器的多元地球化学异常识别方法,包括以下步骤:数据聚类;空间域划分;自监督学习;异常值计算;异常地图生成。本发明专利技术将多元数据聚类、空间滤波与自编码神经网络结合,兼顾多种地球化学元素间的复杂关系和空间分布特征,从而有效提高化探异常识别的精确性,为复杂地质条件下利用多元化探数据进行异常识别提供了较为实用可靠的科学方法。

【技术实现步骤摘要】
基于空间约束多自编码器的多元地球化学异常识别方法
本专利技术涉及地球化探异常识别领域、人工智能应用领域,尤其涉及一种基于空间约束多自编码器的多元地球化学异常识别方法。
技术介绍
地球化探异常识别是矿产勘探的重要工作之一,地质学家将化探异常与其他地质信息结合进行综合判断来寻找潜在矿田。基于频域的异常识别法被广泛使用,如箱线图法、均值法、多元数据分析法等。但这些方法缺少考虑地球化学数据的一个重要特征---地球化学场的空间性。分形/多重分形、克里金方法、奇异值方法、空间因素分析法、趋势面法等考虑了空间近邻样本的相关性,在化探异常识别领域有突出表现。随着人工智能领域的技术发展和机器学习的广泛应用,神经网络对深层次隐含结构特征的学习能力使其在化探异常识别领域引起了广泛关注。已有的研究表明,深度玻尔兹曼、深度置信网络等神经网络模型在复杂地质环境的异常识别中表现不俗。然而,由于基于单一神经网络模型的化探异常识别方法缺乏考虑区域范围的地球化学背景差异,不能因地制宜地区分空间差异,造成模型参数训练难度较大,对包含弱异常的潜在矿产资源区域识别准确率低。总之,目前缺乏综合考虑地球化学背景空间差异、数据非正态分布、以及多化学元素非线性关系的化探异常识别方法。
技术实现思路
有鉴于此,本专利技术的实施例提供了一种以实现复杂地质环境下的多元化探异常识别,为区域性找矿、圈定潜在含矿单元提供技术支持的基于空间约束多自编码器的多元地球化学异常识别方法。本专利技术的实施例提供基于空间约束多自编码器的多元地球化学异常识别方法,包括以下步骤:步骤1.数据聚类,即通过对多元化探样本数据进行归一化和聚类,生成多个样本组;步骤2.空间域划分,即根据样本组的地理空间分布,利用中值滤波和空间约束规则消除碎片,生成多个空间域;步骤3.自监督学习,即针对每个空间域,利用多个结构特征不同的自编码器组件构建多自编码器神经网络模型(Multi-Auto-Encoder,MAE),并利用相应空间域内的样本数据进行训练,选取误差最小的自编码器作为该空间域的最优模型;步骤4.异常值计算,即计算每个化探样本原始数据与相应空间域最优自编码器输出值之间的欧式距离;步骤5.异常地图生成,即将样本异常值映射到样本所在地理位置,反映化探异常的地理空间分布。进一步,所述步骤1中,分析不同聚类因素对化探样本数据聚类结果的影响,并查看不同聚类因素条件下的聚类结果是否在空间分布上具有差异。进一步,所述聚类因素包括聚类数、聚类方法和相似性度量方式,所述聚类方法为无监督方法,所述聚类方法包括K-means方法和SOM方法。进一步,所述步骤2的具体步骤为:步骤2.1.利用圆形窗口的中值滤波方法对聚类结果进行滤波,并多次迭代,直至各个样本组再不发生明显变化;步骤2.2.设定空间约束规则,并利用空间约束规则进一步优化样本组划分;步骤2.3.将属于同组但空间分离的样本块划分为独立样本组,最终生成的多个样本组,在地理空间上的表现为多个相互独立且各自内部连续的区块,即空间域。进一步,所述步骤3中,针对每个空间域,利用多个结构特征不同的自编码器组件构建多个自编码器神经网络模型,并利用相应空间域内的样本数据进行训练,每个自编码器的训练在误差不再变化时停止,选取误差最小的自编码器作为该空间域的最优模型。进一步,样本异常值的计算公式如下:l:样本异常值xk:化探样本原始数据中元素k的含量;xk′:相应空间域最优自编码器输出数据中元素k的含量;n:化学元素的个数。与现有技术相比,本专利技术具有以下有益效果:(1)将多元数据聚类、空间滤波与自编码神经网络结合,兼顾多种地球化学元素间的复杂关系和空间分布特征,从而有效提高化探异常识别的精确性,为复杂地质条件下利用多元化探数据进行异常识别提供了较为实用可靠的科学方法。(2)利用自编码神经网络进行自监督学习,可以避免化探异常提取方法中常用的正态分布(或其他已知分布)假设,提取复杂地质环境下的化探数据的普遍规律(即地球化学背景),减少人为干预,从而为异常值计算提供有效基础。(3)利用聚类和滤波进行空间域划分,可以提取空间域内自相似性特征,区分地球化学背景的空间差异,有利于不同背景条件下化学异常的精细提取,减少异常圈定范围,提高潜在矿质异常识别能力;另外,相对于全局建模和训练,针对每个空间域单独建模并训练,可以降低神经网络的训练难度,提高收敛速度和可靠性。(4)本方法的异常识别效果优于基于全局单一多层自编码器的异常识别效果,其完全数据驱动的异常识别方式,避免了“就矿找矿”方式对非常规矿产资源的不适应性。附图说明图1是本专利技术基于空间约束多自编码器的多元地球化学异常识别方法的流程图。图2是本专利技术实施例的闽西铁矿带研究区的5个化学元素(Cu、Zn、Mn、Pb和Fe2O3)的化探数据直方图。图3是本专利技术对原始数据进行分类形成样本块的效果图。图4是本专利技术进行空间域划分的流程图。图5是本专利技术对多个空间域数据进行MAE模型训练的流程图。图6是本专利技术实施例中输出的化探异常地图以及利用已知铁矿点对异常地图的ROC曲线评估,(a)输出的化探异常地图;(b)ROC评估曲线。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地描述。请参考图1,本专利技术的实施例提供了基于空间约束多自编码器的多元地球化学异常识别方法,包括以下步骤:步骤1.数据聚类,即通过对多元化探样本数据进行归一化和聚类,生成多个样本组;本实施例中,对Cu-Zn-Mn-Pb-Fe2O3化探样本数据(如图2所示)进行归一化和聚类,分析不同聚类因素(包括聚类数、聚类方法、相似性度量方式)对Cu-Zn-Mn-Pb-Fe2O3化探样本数据聚类结果的影响,查看不同影响因素条件下的聚类结果(即样本组)是否在空间分布上具有较大差异。在本实施例中,对于研究区内1:20万化探数据,不同聚类方法(如K-means、SOM等无监督方法)以及不同相似性度量对聚类结果影响不大。本实施例采用K-means方法进行聚类。当聚类数大于3类时,样本组的空间分布过于碎片化,不符合地质条件(包括断层、岩体、地层)的分布,故聚类数设为2类。聚类结果中,被划分到同组且空间邻接的多个样本形成样本块,如图3所示。步骤2.空间域划分,即根据样本组的地理空间分布,利用中值滤波和空间约束规则消除碎片,生成多个空间域;具体步骤为:步骤2.1.利用圆形窗口的中值滤波方法对聚类结果进行滤波,目的是消除占据较大空间范围的样本块中夹杂的异类数据细小碎片,并多次迭代,直至各个样本组再不发生明显变化,得到如图4中步骤2.1对应的效果图;步骤2.2.设定空间约束规则,并利用空间约束规则进一步优化样本组划分;本实施例将面积小于研究区总面积10%的小样本块融合到周围的大面积样本块中,得到如图4中步骤2.2对应的效果图;步骤2.3.将属于同组但空间分离的样本块划分为独立样本组,最终生成的多个样本组,在地理空间上的表现为多个相互独立且各自内部连续的区块,即空间域,即图4中步骤2.3对应的效果图。步骤3.自监督学习,即针对每个空间域,利用多个结构特征不同的自编码器组件构建多自编码器神经网络模型(Multi-Auto-Encoder,MAE),并利用相应空间域内的样本数据进行训本文档来自技高网...
基于空间约束多自编码器的多元地球化学异常识别方法

【技术保护点】
基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,包括以下步骤:步骤1.数据聚类,即通过对多元化探样本数据进行归一化和聚类,生成多个样本组;步骤2.空间域划分,即根据样本组的地理空间分布,利用中值滤波和空间约束规则消除碎片,生成多个空间域;步骤3.自监督学习,即针对每个空间域构建多个结构特征不同的自编码器神经网络模型,并利用相应空间域内的样本数据进行训练,选取误差最小的自编码器作为该空间域的最优模型;步骤4.异常值计算,即计算每个化探样本原始数据与相应空间域的最优自编码器输出值之间的欧式距离;步骤5.异常地图生成,即将样本异常值映射到样本所在地理位置,反映化探异常的地理空间分布。

【技术特征摘要】
1.基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,包括以下步骤:步骤1.数据聚类,即通过对多元化探样本数据进行归一化和聚类,生成多个样本组;步骤2.空间域划分,即根据样本组的地理空间分布,利用中值滤波和空间约束规则消除碎片,生成多个空间域;步骤3.自监督学习,即针对每个空间域构建多个结构特征不同的自编码器神经网络模型,并利用相应空间域内的样本数据进行训练,选取误差最小的自编码器作为该空间域的最优模型;步骤4.异常值计算,即计算每个化探样本原始数据与相应空间域的最优自编码器输出值之间的欧式距离;步骤5.异常地图生成,即将样本异常值映射到样本所在地理位置,反映化探异常的地理空间分布。2.根据权利要求1所述的基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,所述步骤1中,分析不同聚类因素对化探样本数据聚类结果的影响,并查看不同聚类因素条件下的聚类结果是否在空间分布上具有差异。3.根据权利要求2所述的基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,所述聚类因素包括聚类数、聚类方法和相似性度量方式,所述聚类方法为无监督方法,所述聚类方法包括K-means方法和SOM方法。4.根据权利要求1所述的...

【专利技术属性】
技术研发人员:关庆锋陈丽蓉
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1